如何在pandas DataFrame中按列设置数据类型

18 浏览
0 Comments

如何在pandas DataFrame中按列设置数据类型

我想将一些数据导入到pandas的DataFrame中,并希望在导入时为每一列分配数据类型。我希望能够对包含许多不同列的大型数据集执行此操作,但是以一个示例为例:

myarray = np.random.randint(0,5,size=(2,2))
mydf = pd.DataFrame(myarray,columns=['a','b'], dtype=[float,int])
mydf.dtypes

结果是:

TypeError: 数据类型无法理解

我尝试了一些其他方法,例如:

mydf = pd.DataFrame(myarray,columns=['a','b'], dtype={'a': int})

TypeError: 'type'对象没有长度(len)

如果我使用dtype=(float,int),它会将两列都应用为浮点格式。

最后,我希望只需向它传递一个数据类型列表,就像我可以传递一个列名列表一样。

0