如何在Canopy中显示关于数据框的信息
如何在Canopy中显示关于数据框的信息
我正在使用Canopy v1.4.1的免费版本。我有一个类似的问题,就像这里所述: http://stackoverflow.com/questions/11361985/output-data-from-all-columns-in-a-dataframe-in-pandas
但是与获取关于数据框的信息不同,我得到的是包含数据的实际表格:
我希望它看起来像这样:
In [373]: names Out[373]:Int64Index: 1690784 entries, 0 to 1690783 Data columns: name 1690784 non-null values sex 1690784 non-null values births 1690784 non-null values year 1690784 non-null values dtypes: int64(2), object(2)
我的代码:
import pandas as pd pieces = [] # 创建名字的字典 columns = ['name', 'sex', 'births'] # 指定列名 for year in years: path = 'yob%d.txt' % year frame = pd.read_csv(path, names = columns) frame['year'] = year pieces.append(frame) names = pd.concat(pieces, ignore_index = True) print names
在Canopy中展示DataFrame信息的问题是由以下原因引起的:1)你正在使用iPython,因为Canopy使用iPython,所以pandas默认在可以时使用HTML漂亮打印;2)你想要整个DataFrame的信息。
要关闭漂亮打印,请执行以下操作:
import pandas as pd pd.set_option('display.notebook_repr_html', False)
如果你希望将其设置为默认值,可以在iPython启动文件中添加这些行(参见[这里](http://ipython.org/ipython-doc/dev/config/))。
要获取DataFrame的信息,只需调用:
names.info()