如何在PySpark中仅打印DataFrame的特定列?
可以使用collect
或take
操作来打印DataFrame中的特定列吗?
这个
df.col.collect()
会报错
TypeError: 'Column' object is not callable
而这个:
df[df.col].take(2)
会报错
pyspark.sql.utils.AnalysisException: u"filter expression 'col' of type string is not a boolean.;"