检查DataFrame中的哪些列是分类变量

8 浏览
0 Comments

检查DataFrame中的哪些列是分类变量

我对Pandas还不熟悉... 我想要找到一种简单而通用的方法来确定我的DataFrame中哪些列是categorical的,而不像在这个SO问题中手动指定每个列的类型。用以下代码创建了df:

import pandas as pd
df = pd.read_csv("test.csv", header=None)

例如:

           0         1         2         3        4
0   1.539240  0.423437 -0.687014   Chicago   Safari
1   0.815336  0.913623  1.800160    Boston   Safari
2   0.821214 -0.824839  0.483724  New York   Safari

更新(2018/02/04)问题假设数值列不是categorical,@Zero的被接受的答案解决了这个问题

要小心:

正如@Sagarkar的评论指出的,并不总是这样。 困难在于数据类型和Categorical/Ordinal/Nominal类型是正交的概念,因此它们之间的映射并不简单。

@Jeff的答案明确指出了实现手动映射的方法。

0