如何在NLTK中对一个字符串句子进行分词?

8 浏览
0 Comments

如何在NLTK中对一个字符串句子进行分词?

我正在使用nltk,所以我想创建自己的自定义文本,就像nltk.books上的默认文本一样。然而,我只知道一种方法:

my_text = ['This', 'is', 'my', 'text']

我想知道是否有任何方法可以将我的"文本"输入为:

my_text = "This is my text, this is a nice way to input text."

哪种方法,Python的方法还是nltk的方法可以实现这一点?更重要的是,如何去除标点符号?

0