Python非贪婪正则表达式

Question

21 浏览2023年3月16日

匿名的 2023年3月17日

0 Comments

如何制作一个类似于\"(.*)\"的Python正则表达式，以便于给定\"a (b) c (d) e\"，Python匹配\"b\"而不是\"b) c (d\"？\n我知道可以使用\"[^)]\"代替\".\"，但我正在寻找一个更通用的解决方案，以使我的正则表达式更简洁。有没有办法告诉Python“嘿，尽快匹配这个”？

0

3 答案

匿名的 · Answer 1 · 2023-06-23T16:40:19+00:00

Python中的正则表达式通常是贪婪的，即它们会尽可能多地匹配输入字符串。然而，在某些情况下，我们可能需要使用非贪婪模式来匹配尽可能少的字符。在Python中，我们可以使用非贪婪的正则表达式来实现这一点。

在Python中，我们可以使用.*?来表示非贪婪模式。这种模式会尽可能少地匹配输入字符串。例如，如果我们想要匹配括号内的内容，可以使用\$.*?\$的正则表达式。

然而，有时候使用.*?并不能按预期工作。这可能是由于正则表达式的其他部分导致的。在这种情况下，我们可以尝试使用其他的解决方法。

一种解决方法是使用具体的字符或字符集来代替.*?。例如，如果我们知道括号内只能包含字母，我们可以使用\$[a-zA-Z]*\$来匹配。这样，我们就可以避免贪婪匹配。

另一种解决方法是使用负向字符集来排除某些字符。例如，如果我们想要匹配括号内不包含数字的内容，可以使用\$[^0-9]*\$来匹配。这样，我们就可以确保括号内不包含数字。

总之，在Python中，我们可以使用非贪婪的正则表达式来尽可能少地匹配输入字符串。然而，如果非贪婪模式不能按预期工作，我们可以尝试使用具体的字符或字符集来替代.*?。另外，我们还可以使用负向字符集来排除某些字符。这些方法可以帮助我们解决非贪婪正则表达式的问题。

匿名的 · Answer 2 · 2023-05-19T21:19:52+00:00

在Python中，正则表达式使用贪婪模式进行匹配，即匹配尽可能多的文本。然而，在某些情况下，我们可能需要使用非贪婪模式，即匹配尽可能少的文本。上述代码中的问题就是由于贪婪模式导致的。

解决这个问题的方法是在正则表达式中使用问号?，即在匹配限定符（如*，+，?）后面加上问号?，以改变匹配模式为非贪婪模式。

例如，上述代码中的第一个例子re.search(r"$.*$", x).group()使用了贪婪模式，它匹配了整个字符串'(b) c (d) e'。而第二个例子re.search(r"$.*?$", x).group()使用了非贪婪模式，它只匹配了最小的文本'(b)'。

另外，代码中还提到了一个尝试使用非贪婪模式的例子re.search("\(.+?$", x).group()，但它仍然返回了贪婪匹配结果'(b) c (d) e'，而不是预期的从最后一个(到行尾的匹配。

根据最后一行代码的描述.*(.*?) should skip everything before the last (，我们可以使用.*(.*?)来跳过最后一个(之前的所有内容，实现从最后一个(到行尾的匹配。

如果我们想使用非贪婪模式，应在正则表达式中的匹配限定符后面加上问号?，以匹配尽可能少的文本。

匿名的 · Answer 3 · 2023-04-23T00:08:44+00:00

在Python中，正则表达式可以使用贪婪匹配（greedy）和非贪婪匹配（non-greedy）。贪婪匹配是指尽可能多地匹配字符，而非贪婪匹配则是尽可能少地匹配字符。本文将探讨非贪婪匹配在Python中的应用和解决方法。

非贪婪匹配可以通过使用非贪婪限定符（*?、+?、??或{m,n}?）来实现。这些限定符会匹配尽可能少的文本。在Python的正则表达式文档中，可以找到关于非贪婪匹配的详细说明。

然而，根据互联网档案馆（Internet Archive）的记录，原始链接指向的只是Python的"re"模块文档的一个副本。因此，Trey的链接同样有效。

那么，这个*?的常用英文名是什么呢？根据Boyd Smith的回答，它被称为"non greedy"限定符。这个限定符可以用来匹配尽可能少的字符。

我们可以通过使用非贪婪匹配来控制正则表达式的匹配行为。这在处理复杂的文本匹配问题时非常有用。通过使用非贪婪限定符，我们可以尽可能少地匹配字符，从而更精确地获取我们想要的结果。