按日期计算最新id的金额总和 PySpark
- 论坛
- 按日期计算最新id的金额总和 PySpark
10 浏览
按日期计算最新id的金额总和 PySpark
我有一个类似于数据框的数据,如下所示:
CommsId | Id | Amount | Date |
---|---|---|---|
85 | 1 | 10 | 07/10/2020 |
72 | 1 | 15 | 09/09/2021 |
85 | 1 | 25 | 09/09/2021 |
70 | 1 | 30 | 09/09/2021 |
72 | 1 | -15 | 05/11/2020 |
70 | 1 | -30 | 05/11/2020 |
对于每个日期,我想找到截止到该日期的最新CommsId的金额总和。
预期输出如下所示:
Date | Sum_Amount | Id |
---|---|---|
07/10/2020 | 10 | 1 |
09/09/2021 | 70 | 1 |
05/11/2021 | 25 | 1 |