pandas列与统计显著性的相关性

15 浏览
0 Comments

pandas列与统计显著性的相关性

给定一个pandas dataframe df,如何以最佳方式获取其列df.1和df.2之间的相关性?我不希望输出计算包含NaN的行数,而pandas内置的correlation会计算它们。但是我也希望输出p值或标准误差,而内置的方法却没有。似乎SciPy对NaN值遇到了问题,尽管我相信它会报告显著性。数据示例:

1 2

0 2 NaN

1 NaN 1

2 1 2

3 -4 3

4 1.3 1

5 NaN NaN

0