如何从存储在AWS S3中的数据库文件创建sqlite连接？ Python

Question

12 浏览2023年2月28日

匿名的 2023年2月28日

0 Comments

我在一个S3存储桶中存储了一个名为file.db的SQLite文件。\n我想要的是使用该文件建立与数据库的连接。类似于以下的代码：\n

import boto3
import pandas
import sqlite3
s3 = boto3.resource('s3')
cnx = sqliite3.connect('s3://bucket/file.db')
df = pd.read_sql_table('select * from table', cnx)

\n是否有可能用Python/Pandas从S3中读取文件？我了解到棘手的问题是将文件从S3中作为绝对路径而不是对象导入。\n期待您的评论，这将对我非常有帮助。

0

1 答案

匿名的 · Answer 1 · 2023-05-22T10:36:29+00:00

如何从存储在AWS S3中的db文件创建一个sqlite连接？Python

问题的出现原因：

当我们想要从存储在AWS S3中的db文件创建一个sqlite连接时，我们面临着一些挑战。首先，我们需要找到一种方法将文件下载到本地文件系统。其次，我们需要在sqlite中打开该文件。然而，无论我们对该文件进行了哪些更改，这些更改都不会反映在S3上的副本中。因此，我们需要找到解决这个问题的方法。

解决方法：

有两种不同的方法可以解决这个问题。

方法一：

第一种方法是将sqlite数据库下载到本地文件系统，然后使用sqlite打开它。

首先，我们可以使用如下代码从S3下载文件：

import boto3
s3 = boto3.client('s3')
s3.download_file('my_bucket', 'file.db', 'file.db')

然后，我们可以使用以下代码在sqlite中打开文件：

import sqlite3
con = sqlite3.connect("file.db")

然而，任何对该文件的更改都不会反映在S3上的副本中。

方法二：

第二种方法是使用Litestream。Litestream是一个工具，通过将WAL写入S3来将更改复制回S3。WAL是文件中发生更改的记录，您可以仅使用WAL和旧版本的SQLite数据库恢复数据库的当前状态。它定期通过写入SQLite数据库的新副本来压缩WAL，然后删除旧数据库和WAL。

您可以参考他们的教程来了解如何使用Litestream。

限制：

如果您想在S3中拥有一个SQLite数据库，并且有多个客户端对该数据库进行读写，这是不可能的。您需要一个支持多用户并发的数据库，如PostgreSQL或MySQL，才能实现这一点。SQLite和S3无法完成这个任务。