基于“不在”条件从数据框中删除行

10 浏览
0 Comments

基于“不在”条件从数据框中删除行

这个问题已经有了答案

如何使用\'in\'和\'not in\'来过滤Pandas数据框,就像在SQL中一样

我想从Pandas数据框中删除日期列的值在日期列表中的行。以下代码不起作用:

a=['2015-01-01' , '2015-02-01']
df=df[df.datecolumn not in a]

我得到以下错误:

ValueError: Series的真值是不明确的。请使用a.empty、a.bool()、a.item()、a.any()或a.all()。

admin 更改状态以发布 2023年5月24日
0
0 Comments

您可以使用Series.isin

df = df[~df.datecolumn.isin(a)]

虽然错误消息建议使用all()any(),但它们只有在想要将结果缩减为单个布尔值时才有用。而您现在要做的是测试Series中所有值与外部列表的成员身份,并保持结果不变(即布尔Series,然后使用它来切片原始DataFrame)。

您可以在Gotchas中阅读更多信息。

0
0 Comments

你可以使用pandas.Dataframe.isin

pandas.Dateframe.isin将返回布尔值,具体取决于每个元素是否在列表a中。然后可以使用~来反转它,将True转换为False,反之亦然。

import pandas as pd
a = ['2015-01-01' , '2015-02-01']
df = pd.DataFrame(data={'date':['2015-01-01' , '2015-02-01', '2015-03-01' , '2015-04-01', '2015-05-01' , '2015-06-01']})
print(df)
#         date
#0  2015-01-01
#1  2015-02-01
#2  2015-03-01
#3  2015-04-01
#4  2015-05-01
#5  2015-06-01
df = df[~df['date'].isin(a)]
print(df)
#         date
#2  2015-03-01
#3  2015-04-01
#4  2015-05-01
#5  2015-06-01

0