Python/pyspark数据框重新排列列。

11 浏览2023年5月21日

匿名的 2023年5月21日

0 Comments

我在Python/PySpark中有一个数据框，其中包含列id time city zip等等......

现在我给这个数据框添加了一个新列name。

现在我必须按照一种方式排列列，使得name列在id之后。

我已经像下面这样做了：

change_cols = ['id', 'name']
cols = ([col for col in change_cols if col in df] 
        + [col for col in df if col not in change_cols])
df = df[cols]

我得到了这个错误

pyspark.sql.utils.AnalysisException: u"Reference 'id' is ambiguous, could be: id#609, id#1224.;"

为什么会出现这个错误？我该如何纠正它。

如何在PySpark中更改数据框列名？

在Spark中，从其他列派生出一个新的数据帧列。

在Spark Scala中重命名DataFrame的列名。

如何在Spark DataFrame中添加新列（使用PySpark）？

Pandas dataframe的列标题为'name'。

根据优先级修改数据框

Pandas不显示第一列

如何重新排列Python Pandas数据框，将列标题移动到下一行并重新命名合并的标题

将Pandas DataFrame的行转换为列标题。

更改多个列名但不是所有列名- Pandas Python

在Pandas中为多列分配值。

如何在pandas中添加列名

在Pandas中重命名列名

如何在pandas的数据框中插入列名？

添加新列，其值为后续列的和。

Spark Dataframe区分具有重复名称的列

将Pandas数据帧转换为Spark数据帧出现错误。

重命名pandas数据帧的特定列

在 pandas DataFrame 中更改特定的列名称

在现有的Python Pandas 1.2.4数据框中为一个无名索引命名。

Python/pyspark数据框重新排列列。

0 答案