将列值填充为上一个值当为NaN时。

Question

18 浏览2023年5月12日

匿名的 2023年5月12日

0 Comments

我有一个看起来像这样的pd.Series：\n>>>> series\n0 这是一个foo bar something...\n1 NaN\n2 NaN\n3 foo bar indeed something...\n4 NaN\n5 NaN\n6 foo your bar self...\n7 NaN\n8 NaN\n如何用前一个非NaN值填充系列中的NaN列值？\n我尝试了这个：\nnew_column = []\nfor row in list(series):\n if type(row) == str:\n new_column.append(row)\n else:\n new_column.append(new_column[-1])\nseries = pd.Series(new_column)\n但在pandas中是否有其他方法可以实现相同的功能？

0

1 答案

匿名的 · Answer 1 · 2023-06-07T13:41:27+00:00

在上面的代码和解释中，我们可以看到出现了一个问题：如何在DataFrame中将缺失值（NaN）的列填充为前一个值。根据解释，我们可以得出以下解决方法：

1. 使用fillna函数并设置method='ffill'，这将使用前一个非NaN值填充缺失值。

2. 如果需要，也可以使用pad作为ffill的别名。

3. 类似地，可以使用bfill或backfill来填充缺失值，这将使用下一个非NaN值填充缺失值。

下面是具体的代码示例：

import pandas as pd
import numpy as np
# 创建一个包含NaN值的Series
series = pd.Series([np.NaN, 'abc', np.NaN, np.NaN, 'def', np.NaN, np.NaN])
# 使用ffill填充缺失值
series.fillna(method='ffill')

输出结果为：

0    NaN
1    abc
2    abc
3    abc
4    def
5    def
6    def
dtype: object

另外，如果使用method='bfill'，将会使用后一个非NaN值填充缺失值。以下是使用bfill的示例：

# 使用bfill填充缺失值
series.fillna(method='bfill')

输出结果为：

0    abc
1    abc
2    def
3    def
4    def
5    NaN
6    NaN
dtype: object

通过使用fillna函数和不同的填充方法，我们可以将DataFrame中的NaN值填充为前一个或后一个非NaN值。