使用正则表达式匹配组在pandas数据框的替换函数中。

58 浏览
0 Comments

使用正则表达式匹配组在pandas数据框的替换函数中。

我正在学习Python/Pandas,喜欢它的强大和简洁。

在数据清洗过程中,我想在数据框的一列上使用正则表达式的替换操作,但我希望重新插入匹配的部分(组)。

简单示例:

姓,名 -> 名 姓

我尝试了以下代码(实际情况更复杂,所以请原谅简单的正则表达式):

df['Col1'].replace({'([A-Za-z])+, ([A-Za-z]+)' : '\2 \1'}, inplace=True, regex=True)

然而,这导致了空值。匹配部分按预期工作,但值部分没有。

我猜想这可以通过一些拆分和合并来实现,但我希望得到一个关于是否可以在替换操作中使用正则表达式组的一般答案。

0