为什么在附加pandas数据框时列的顺序会改变？

15 浏览2023年2月13日

匿名的 2023年2月13日

0 Comments

我想使用Python的pandas库将文件夹中的所有csv文件合并成一个文件。

例如：假设文件夹中有两个csv文件test1.csv和test2.csv，内容如下：

A_Id    P_Id    CN1         CN2         CN3
AAA     111     702         709         740
BBB     222     1727        1734        1778

和

A_Id    P_Id    CN1         CN2         CN3
CCC     333     710        750          750
DDD     444     180        734          778

所以我编写的Python脚本如下：

#!/usr/bin/python
import pandas as pd
import glob
all_data = pd.DataFrame()
for f in glob.glob("testfolder/*.csv"):
    df = pd.read_csv(f)
    all_data = all_data.append(df)
all_data.to_csv('testfolder/combined.csv')

尽管combined.csv似乎包含了所有合并的行，但它的样式如下：

      CN1       CN2         CN3    A_Id    P_Id
  0   710      750         750     CCC     333
  1   180       734         778     DDD     444     
  0   702       709         740     AAA     111
  1  1727       1734        1778    BBB     222

而它应该是这样的：

A_ID   P_Id   CN1    CN2    CN2
AAA    111    702    709    740
BBB    222    1727   1734   1778
CCC    333    710    750    750
DDD    444    180    734    778

为什么前两列被移到了最后？
为什么它在第一行而不是最后一行追加？

我错过了什么？如何去掉第一列的0和1？

附注：由于这些是大型的csv文件，我考虑使用pandas库。

合并两个csv文件使用panda.concat。

如何根据列将文件夹中的所有csv文件合并为一个单独的csv文件？

pandas从csv文件读取时添加列

使用 Pandas 进行 DataFrame 合并时出现问题。

Python Pandas：将CSV复制到Excel而不重写

如何创建一个空的数据框并将其添加

将DataFrame在for循环中结合起来

如何使用Python合并文件夹中的多个 .csv 文件

在Python中合并CSV文件

在for循环中生成的pandas数据帧进行追加操作

在Python的Pandas DataFrame中保留列顺序

使用pandas将已存在的Excel文件追加

使用pandas中的.append在for循环内部。

从同一文件夹中的多个文件创建一个csv文件

如何在pandas中将数据框追加到同一Excel工作表中

如何连接多个 pandas 数据帧

如何迭代遍历pandas数据框并将其连接到另一个数据框上。

将数据框的开头值添加到数据框的末尾

使用Pandas将2个CSV文件连接起来，不包括行索引。

使用`left`选项进行`pandas.merge`后，行数仍然会发生变化。

为什么在附加pandas数据框时列的顺序会改变？

0 答案