统计 Pandas 数据帧中不重复的单词数

15 浏览
0 Comments

统计 Pandas 数据帧中不重复的单词数

我有一个Pandas数据框,其中一列包含文本。我想要获取整个列中出现的唯一单词列表(以空格为分隔符)。

import pandas as pd
r1=['我的昵称是ft.jgt','有人要去我的地方']
df=pd.DataFrame(r1,columns=['text'])

输出应该如下所示:

['我的','昵称','是','ft.jgt','有人','要去','地方']

如果能得到计数,那就更好了,但这不是必须的。

0