基于“不在”条件从数据框中删除行
基于“不在”条件从数据框中删除行
这个问题已经有了答案:
我想从Pandas数据框中删除日期列的值在日期列表中的行。以下代码不起作用:
a=['2015-01-01' , '2015-02-01'] df=df[df.datecolumn not in a]
我得到以下错误:
ValueError: Series的真值是不明确的。请使用a.empty、a.bool()、a.item()、a.any()或a.all()。
admin 更改状态以发布 2023年5月24日
您可以使用Series.isin
:
df = df[~df.datecolumn.isin(a)]
虽然错误消息建议使用all()
或any()
,但它们只有在想要将结果缩减为单个布尔值时才有用。而您现在要做的是测试Series中所有值与外部列表的成员身份,并保持结果不变(即布尔Series,然后使用它来切片原始DataFrame)。
您可以在Gotchas中阅读更多信息。
你可以使用pandas.Dataframe.isin
。
pandas.Dateframe.isin
将返回布尔值,具体取决于每个元素是否在列表a
中。然后可以使用~
来反转它,将True
转换为False
,反之亦然。
import pandas as pd a = ['2015-01-01' , '2015-02-01'] df = pd.DataFrame(data={'date':['2015-01-01' , '2015-02-01', '2015-03-01' , '2015-04-01', '2015-05-01' , '2015-06-01']}) print(df) # date #0 2015-01-01 #1 2015-02-01 #2 2015-03-01 #3 2015-04-01 #4 2015-05-01 #5 2015-06-01 df = df[~df['date'].isin(a)] print(df) # date #2 2015-03-01 #3 2015-04-01 #4 2015-05-01 #5 2015-06-01