如何通过pandas或Spark DataFrame删除所有行中具有相同值的列?

14 浏览
0 Comments

如何通过pandas或Spark DataFrame删除所有行中具有相同值的列?

假设我有类似以下的数据:

  索引   id   名称  值    值2    值3    数据1  值5
    0  345  名称1  1    99     23     3     66
    1   12  名称2  1    99     23     2     66
    5    2  名称6  1    99     23     7     66

我们如何使用Python一条或几条命令删除所有行中具有相同值的列(如值2值3)?

考虑到我们有许多类似于值2值3...值200的列。

输出:

   索引    id  名称   数据1
       0   345  名称1   3
       1    12  名称2   2
       5     2  名称6   7

0