按照Groupby类别,并统计特征中的缺失值。

15 浏览
0 Comments

按照Groupby类别,并统计特征中的缺失值。

我有一个问题,在网络或文档中找不到任何解决方案,尽管我认为这个问题非常简单。

我想做什么?

我有一个像这样的数据框:

类别 特征1 特征2 特征3
  X      A       NaN      NaN
  X     NaN       A       NaN
  B      A        A        A

我想按标签(类别)分组,并显示每个特征中计数的NaN值的数量,使其看起来像这样。这样做的目的是获得有关缺失值在不同类别中的分布的一般想法。

类别 特征1 特征2 特征3
  X      1        1        2
  B      0        0        0

我知道如何获得非null值的数量 - df.groupby['类别'].count()

是否有类似于NaN值的东西?

我尝试将count()与size()相减,但返回的输出未格式化,填充了NaN值。

0