如何在iPython中使用pandas库读取.xlsx文件?

27 浏览
0 Comments

如何在iPython中使用pandas库读取.xlsx文件?

我想使用Python的Pandas Library读取.xlsx文件并将数据传输到postgreSQL表中。

到目前为止,我所能做的是:

import pandas as pd
data = pd.ExcelFile("*File Name*")

现在我知道这个步骤已经成功执行了,但我想知道如何解析已读取的Excel文件,以便我可以了解Excel中的数据如何映射到变量数据中的数据。

我了解到如果我没有错的话,数据是一个Dataframe对象。那么,我要如何解析这个数据框架对象,以逐行提取每一行。

admin 更改状态以发布 2023年5月23日
0
0 Comments

pd.read_excel(file_name) 

有时,对于xlsx文件,这段代码会出错:XLRDError:Excel xlsx文件;不支持

相反,您可以使用openpyxl引擎来读取Excel文件。

df_samples = pd.read_excel(r'filename.xlsx', engine='openpyxl')

0
0 Comments

我通常会创建一个包含每个表格的DataFrame的字典:

xl_file = pd.ExcelFile(file_name)
dfs = {sheet_name: xl_file.parse(sheet_name) 
          for sheet_name in xl_file.sheet_names}


更新: 在pandas版本0.21.0+中,通过将sheet_name=None传递给read_excel,您将更清晰地获得此行为:

dfs = pd.read_excel(file_name, sheet_name=None)


在0.20及更早版本中,这是sheetname而不是sheet_name(现已弃用上述功能):

dfs = pd.read_excel(file_name, sheetname=None)

0