如何在iPython中使用pandas库读取.xlsx文件？

Question

27 浏览2023年5月23日

匿名的 2023年1月2日

0 Comments

我想使用Python的Pandas Library读取.xlsx文件并将数据传输到postgreSQL表中。

到目前为止，我所能做的是：

import pandas as pd
data = pd.ExcelFile("*File Name*")

现在我知道这个步骤已经成功执行了，但我想知道如何解析已读取的Excel文件，以便我可以了解Excel中的数据如何映射到变量数据中的数据。

我了解到如果我没有错的话，数据是一个Dataframe对象。那么，我要如何解析这个数据框架对象，以逐行提取每一行。

admin 更改状态以发布 2023年5月23日

0

匿名的 · Answer 1 · 2023-01-02T20:57:58+00:00

pd.read_excel(file_name)

有时，对于xlsx文件，这段代码会出错：XLRDError：Excel xlsx文件；不支持

相反，您可以使用openpyxl引擎来读取Excel文件。

df_samples = pd.read_excel(r'filename.xlsx', engine='openpyxl')

匿名的 · Answer 2 · 2023-01-02T20:57:58+00:00

我通常会创建一个包含每个表格的DataFrame的字典:

xl_file = pd.ExcelFile(file_name)
dfs = {sheet_name: xl_file.parse(sheet_name) 
          for sheet_name in xl_file.sheet_names}

更新: 在pandas版本0.21.0+中，通过将sheet_name=None传递给read_excel，您将更清晰地获得此行为:

dfs = pd.read_excel(file_name, sheet_name=None)

在0.20及更早版本中，这是sheetname而不是sheet_name（现已弃用上述功能）:

dfs = pd.read_excel(file_name, sheetname=None)