如何在pandas数据框中计算重复行的数量？

19 浏览2023年6月22日

匿名的 2023年6月22日

0 Comments

我试图统计数据框中每种类型的行的重复次数。例如，假设我有一个pandas数据框如下：

df = pd.DataFrame({'one': pd.Series([1., 1, 1]),
                   'two': pd.Series([1., 2., 1])})

得到如下数据框：

我想象的第一步是找到所有不同的唯一行，我可以通过以下方式实现：

df.drop_duplicates()

这给我以下数据框：

    one two
0   1   1
1   1   2

现在，我想要从上面的数据框（[1 1]和[1 2]）中获取每个行在初始数据框中出现的次数。我的结果可能如下所示：

Row     Count
[1 1]     2
[1 2]     1

我应该如何进行最后一步操作呢？

编辑：

这里有一个更大的示例，以使问题更清晰：

df = pd.DataFrame({'one': pd.Series([True, True, True, False]),
                   'two': pd.Series([True, False, False, True]),
                   'three': pd.Series([True, False, False, False])})

得到：

    one three   two
0   True    True    True
1   True    False   False
2   True    False   False
3   False   False   True

我想要一个告诉我：

       Row           Count
[True True True]       1
[True False False]     2
[False False True]     1

汇总具有重复列的多行数据 pandas

计算pandas中一列中唯一行的总数。

如何在Pandas数据框中计算唯一值的数量？

统计一列中按多个其他列分组后的唯一值数量

在pandas中对数据框进行按值计数的分组

如何使用Python的pandas库从DataFrame中正确地检索两列的数据？

通过索引在Pandas dataframe中汇总两列中的重复行

如何在Pandas DataFrame中同时获取多个列的值计数？

在Python中计算两列的值

如何获取 Pandas DataFrame 的行数？

在pandas数据帧中如何像在Qlik中那样计算一列中的唯一值数量？

计算每个ID的唯一名称数量，并将结果写入新的pandas列中。

在pandas DataFrame中查找重复行的索引

Pandas按组删除重复项

pandas - 在一个DataFrame中计算每个另一列的唯一值中某个值的出现次数。

在 Pandas 中，计算每年所代表的月份数量。

在DataFrame中查找每列不同元素的数量。

在Pandas中查找重复行，其中列值的顺序无关紧要。

Pandas：如何从另一个数据框中获取出现次数的计数？

统计pandas DataFrame列中值的频率。

如何在pandas数据框中计算重复行的数量？

0 答案