Pandas:为通过groupby标识的每个组分配一个索引。

11 浏览
0 Comments

Pandas:为通过groupby标识的每个组分配一个索引。

在使用groupby()函数时,如何创建一个包含组号索引的新列的DataFrame,类似于R中的dplyr::group_indices。例如,如果我有以下数据:

df=pd.DataFrame({'a':[1,1,1,2,2,2],'b':[1,1,2,1,1,2]})

df的输出为:

a b

0 1 1

1 1 1

2 1 2

3 2 1

4 2 1

5 2 2

如何获取一个类似于下面的DataFrame:

a b idx

0 1 1 1

1 1 1 1

2 1 2 2

3 2 1 3

4 2 1 3

5 2 2 4

(idx索引的顺序不重要)

0