如何在Python中查找小说中所需的单词？

Question

24 浏览2023年5月21日

匿名的 2023年5月22日

0 Comments

我有一段文本，并且我在Python中使用读取模块得到了一个任务：

找出那些被称为Mr. XXX的人的名字。将结果保存在一个字典中，以名字作为键，使用次数作为值。例如：

如果小说中有Mr. Churchill，那么包括{'Churchill' : 2}
如果小说中有Mr. Frank Churchill，那么包括{'Frank Churchill' : 4}

文件是.txt格式，大约包含10-15个段落。

你有关于如何改进它的想法吗？（在一些单词后面它给我报错，我猜测错误是因为Mr. 出现在行尾。）

orig_text= open('emma.txt', encoding = 'UTF-8')
lines= orig_text.readlines()[32:16267]
counts = dict()
for line in lines:
    wordsdirty = line.split()
    try:
        print (wordsdirty[wordsdirty.index('Mr.') + 1])
    except ValueError:
        continue

0

2 答案

匿名的 · Answer 1 · 2023-08-11T12:13:08+00:00

在这个问题中，出现的原因是要在小说中找到特定的单词。解决方法是使用Python编程语言来实现。

首先，我们可以尝试使用正则表达式来找到包含特定单词的词组。在给定的示例中，我们使用了一个正则表达式模式来匹配以"Mr. "开头的词组。通过使用re.findall函数，我们可以找到所有匹配的词组，并将它们存储在一个列表中。

接下来，为了解决行的问题，我们需要读取整个文件的文本内容。可以使用file.read()函数来实现这一点。