使用PySpark从字典创建新列

14 浏览
0 Comments

使用PySpark从字典创建新列

我使用Spark 1.6,我有一个名为col1的Spark DataFrame列,它包含值A、B、C、DS、DNS、E、F、G和H。我想要创建一个新的列(称为col2),其中包含下面dict中的值。我该如何映射?(例如,'A'需要映射为'S'等等。)

dict = {'A': 'S', 'B': 'S', 'C': 'S', 'DS': 'S', 'DNS': 'S', 'E': 'NS', 'F': 'NS', 'G': 'NS', 'H': 'NS'}

0