PySpark - 对dataframe中的一列求和,并将结果返回为整数
- 论坛
- PySpark - 对dataframe中的一列求和,并将结果返回为整数
18 浏览
PySpark - 对dataframe中的一列求和,并将结果返回为整数
我有一个包含数字的pyspark dataframe。我需要对该列进行求和,然后将结果作为整数返回到python变量中。
df = spark.createDataFrame([("A", 20), ("B", 30), ("D", 80)],["Letter", "Number"])
我使用以下代码对该列进行求和。
df.groupBy().sum()
但是我得到了一个dataframe。
+-----------+ |sum(Number)| +-----------+ | 130| +-----------+
我想要将130作为整数存储在一个变量中,以便在程序的其他地方使用。
result = 130