在Python中,最佳的词干提取方法是什么?

11 浏览
0 Comments

在Python中,最佳的词干提取方法是什么?

我尝试了所有的nltk词干化方法,但它给了我一些词的奇怪结果。

举例来说,

它经常在不应该的地方切断单词的结尾:

  • poodle => poodl
  • article articl

或者词干化效果不太好:

  • easily 和 easy 不是同一个词的词干化形式
  • leaves, grows, fairly 没有被词干化

你知道在Python中有其他的词干化库,或者一个好的词典吗?

谢谢

0