在pandas数据框中替换问号

10 浏览
0 Comments

在pandas数据框中替换问号

当从csv文件等源读取数据框时,在pandas中,空白值通常以'?'表示。

如果这是一个数值列,并且您尝试用均值替换,例如df['weight'].replace('?',df['weight'].mean() ,inplace='True'),如果它的类型是'Object'而不是int64,则可能不起作用。

在这种情况下,我用NaN替换这些'?',因为isna()无法直接处理它们。然后将这些NaN替换为0,并最后使用它们来替换实际值以进行填充。

df['SGOT'].replace('?',np.nan,inplace='True' )
df1['SGOT'].fillna(value=0,inplace=True)
df1['SGOT']=df1['SGOT'].astype(int)
df1['SGOT'].replace(0,df1['SGOT'].mean(),inplace=True )

我相信有更好的方法来做到这一点。请告诉我。

0