PySpark - 对dataframe中的一列求和,并将结果返回为整数

18 浏览
0 Comments

PySpark - 对dataframe中的一列求和,并将结果返回为整数

我有一个包含数字的pyspark dataframe。我需要对该列进行求和,然后将结果作为整数返回到python变量中。

df = spark.createDataFrame([("A", 20), ("B", 30), ("D", 80)],["Letter", "Number"])

我使用以下代码对该列进行求和。

df.groupBy().sum()

但是我得到了一个dataframe。

+-----------+
|sum(Number)|
+-----------+
|        130|
+-----------+

我想要将130作为整数存储在一个变量中,以便在程序的其他地方使用。

result = 130

0