如何在NLTK中对一个字符串句子进行分词?
我正在使用nltk,所以我想创建自己的自定义文本,就像nltk.books上的默认文本一样。然而,我只知道一种方法:
my_text = ['This', 'is', 'my', 'text']
我想知道是否有任何方法可以将我的"文本"输入为:
my_text = "This is my text, this is a nice way to input text."
哪种方法,Python的方法还是nltk的方法可以实现这一点?更重要的是,如何去除标点符号?