按日期计算最新id的金额总和 PySpark

10 浏览
0 Comments

按日期计算最新id的金额总和 PySpark

我有一个类似于数据框的数据,如下所示:

CommsId Id Amount Date
85 1 10 07/10/2020
72 1 15 09/09/2021
85 1 25 09/09/2021
70 1 30 09/09/2021
72 1 -15 05/11/2020
70 1 -30 05/11/2020

对于每个日期,我想找到截止到该日期的最新CommsId的金额总和。

预期输出如下所示:

Date Sum_Amount Id
07/10/2020 10 1
09/09/2021 70 1
05/11/2021 25 1
0