使用NLTK进行停用词去除

16 浏览
0 Comments

使用NLTK进行停用词去除

我正在尝试使用nltk工具包去除停用词来处理用户输入的文本,但是在去除停用词的过程中会移除像'and'、'or'、'not'这样的词语。我希望这些词在去除停用词后仍然存在,因为它们是后续处理文本作为查询时所需的运算符。我不知道哪些词可以作为查询中的运算符,同时我也想从我的文本中移除不必要的词语。

0