pandas的read_csv函数中的index_col=None参数在每行末尾有分隔符时无法正常工作。

10 浏览2023年3月4日

匿名的 2023年3月4日

0 Comments

我正在阅读《Python数据分析》一书，并在“示例：2012年联邦选举委员会数据库”部分遇到了读取数据到DataFrame的问题。问题在于，即使将index_col参数设置为None，数据中的一列始终被设置为索引列。

这是数据的链接：http://www.fec.gov/disclosurep/PDownload.do。

这是加载代码（为了节省时间，我将nrows设置为10）：

import pandas as pd
fec = pd.read_csv('P00000001-ALL.csv',nrows=10,index_col=None)

为了简洁起见，我省略了数据列的输出，但这是我的输出（请注意索引值）：

In [20]: fec
Out[20]:

Index: 10 entries, C00410118 to C00410118
Data columns:
...
dtypes: float64(4), int64(3), object(11)

这是该书的输出（再次省略了数据列）：

In [13]: fec = read_csv('P00000001-ALL.csv')
In [14]: fec
Out[14]:

Int64Index: 1001731 entries, 0 to 1001730
...
dtypes: float64(1), int64(1), object(14)

我的输出中的索引值实际上是文件中的第一列数据，然后将所有其他数据向左移动一列。有人知道如何防止此列数据被列为索引吗？我希望索引只是递增的整数。

我对python和pandas还相对新手，对任何不便我深感抱歉。谢谢。

阅读Pandas中一个大型CSV文件的最后N行

pandas的read_csv函数和使用usecols参数筛选列

从1开始对Pandas DataFrame进行索引。

为什么Pandas不能正确索引我的CSV文件?

如何在Pandas中解决数据帧索引问题？

pandas从csv文件读取时添加列

使用Pandas处理可变列数 - Python

如何忽略pandas的read_csv中的换行符定义?

在读取csv文件时，删除pandas中的索引列

使用pandas的read_csv和nrows功能来读取约13000行CSV文件的部分内容。

我需要给文件添加标题，但在使用Pandas的`df.columns`之后，我丢失了第一行的数据。

使用Pandas将CSV读取为具有不同行长度的dataFrame。

如何部分读取一个巨大的CSV文件？

如何将*.csv文件加载为具有连续编号的列的数据框？

使用pandas读取csv文件时出错

如何向 Pandas 数据框添加表头行

Pandas读入无标题的表格。

为什么我无法在数据框中删除任何列？

Dataframe不返回完整结果Python

关键错误: [Int64Index...] dtype='int64] 中的任何一列不在列中

pandas的read_csv函数中的index_col=None参数在每行末尾有分隔符时无法正常工作。

0 答案