我正在使用Spark 1.3.0和Python。我有一个数据框,我希望添加一个由其他列派生的额外列。像这样,
>>old_df.columns [col_1, col_2, ..., col_m] >>new_df.columns [col_1, col_2, ..., col_m, col_n]
其中
col_n = col_3 - col_4
我该如何在PySpark中完成这个操作?
用户名或电子邮箱地址
密码