Pandas GroupBy并选择具有特定列中最小值的行

12 浏览2023年1月13日

匿名的 2023年1月13日

0 Comments

我有一个包含列A、B和C的DataFrame。对于A的每个值，我想选择B列中最小值的行。

即，从以下内容中：

df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 2],
                   'B': [4, 5, 2, 7, 4, 6],
                   'C': [3, 4, 10, 2, 4, 6]})      
    A   B   C
0   1   4   3
1   1   5   4
2   1   2   10
3   2   7   2
4   2   4   4
5   2   6   6

我想得到：

    A   B   C
0   1   2   10
1   2   4   4

目前我是按列A进行分组，然后创建一个指示我要保留的行的值：

a = data.groupby('A').min()
a['A'] = a.index
to_keep = [str(x[0]) + str(x[1]) for x in a[['A', 'B']].values]
data['id'] = data['A'].astype(str) + data['B'].astype('str')
data[data['id'].isin(to_keep)]

我确信有更简单的方法来做到这一点。

我在这里看到很多答案都使用了MultiIndex，但我更愿意避免使用它。

谢谢您的帮助。

如何按照一列进行分组，并对另一列的值进行排序？

pandas: 如何在每个GROUP BY组中选择第一行？

Python pandas - filter rows after groupby 在使用Python pandas进行groupby之后筛选行

按列A删除重复项，保留列B最高值所在的行。

DataFrame返回错误的值Pandas

如何使用pandas删除重复的值并保留其中一个

熊猫删除重复项但保持关联关系。

Pandas：按行从DataFrame的特定列中选择值

如何使用Pandas根据列值合并行？

在进行分组时保留其他列。

如何在Pandas中按组将数据框行分组为列表

python pandas groupby() result

折叠Pandas数据框以获得一个非冗余的列。

如何根据某个条件删除重复的行

使用不同逻辑折叠Pandas数据帧中的行

Pandas分组和求和只针对一列

在pandas数据框中按组递增地编号行

从数据框中删除重复项，基于两个列A、B，并保留具有另一列C中最大值的行。

Pandas按分组聚合和列排序

获取第一行具有匹配值的行，并删除具有相同值的其余行，直到出现新值。

Pandas GroupBy并选择具有特定列中最小值的行

0 答案