使用正则表达式将字符串分成组?

57 浏览
0 Comments

使用正则表达式将字符串分成组?

我有一些可能包含不同数量"组"的字符串。我需要将它们拆分,但我在这方面遇到了麻烦。这些组总是以[A-Z]{2-5}开头,后面跟着一个:和一个长度和空格不定的字符串。组前面总是有一个空格。

示例字符串:

"YellowSky AA:Hello AB:1234 AC:1F 322 AD:hj21jkhjk23"
"Billy Bob Thorton AA:213231 AB:aaaa AC:ddddd 322 AD:hj2ffs   dsfdsfd1jkhjk23"

到目前为止,我的代码是:

import re
D = "Test1 AA:Hello AB:1234 AC:1F 322 AD:hj21jkhjk23"
g = re.compile("(?

如你所见...这对于以单词开头的字符串起作用,但对于多个单词则无效。

Works

但对于带有空格的情况则失败了:

Doesn't work

0