如何在Canopy中显示关于数据框的信息

8 浏览
0 Comments

如何在Canopy中显示关于数据框的信息

我正在使用Canopy v1.4.1的免费版本。我有一个类似的问题,就像这里所述: http://stackoverflow.com/questions/11361985/output-data-from-all-columns-in-a-dataframe-in-pandas 但是与获取关于数据框的信息不同,我得到的是包含数据的实际表格:

enter image description here

我希望它看起来像这样:

In [373]: names
Out[373]:

Int64Index: 1690784 entries, 0 to 1690783
Data columns:
name   1690784  non-null values
sex    1690784  non-null values
births 1690784  non-null values
year   1690784  non-null values
dtypes: int64(2), object(2)

我的代码:

import pandas as pd
pieces = [] # 创建名字的字典
columns = ['name', 'sex', 'births']  # 指定列名
for year in years: 
    path = 'yob%d.txt' % year
    frame = pd.read_csv(path, names = columns)
    frame['year'] = year
    pieces.append(frame)
    names = pd.concat(pieces, ignore_index = True)
print names

0
0 Comments

在Canopy中展示DataFrame信息的问题是由以下原因引起的:1)你正在使用iPython,因为Canopy使用iPython,所以pandas默认在可以时使用HTML漂亮打印;2)你想要整个DataFrame的信息。

要关闭漂亮打印,请执行以下操作:

import pandas as pd
pd.set_option('display.notebook_repr_html', False)

如果你希望将其设置为默认值,可以在iPython启动文件中添加这些行(参见[这里](http://ipython.org/ipython-doc/dev/config/))。

要获取DataFrame的信息,只需调用:

names.info()

0