如何用有效的代码替换单词中的标点符号?
如何用有效的代码替换单词中的标点符号?
我一直在处理一个包含很多标点符号的文件,我们需要忽略这些标点符号,以便能够计算单词的实际长度。
例如:
Is this stack overflow! ---> Is this stack overflow
在处理过程中,我为每个标点符号编写了许多情况,这使得我的代码运行缓慢。因此,我正在寻找一种使用模块或函数来实现相同功能的有效方法。
代码片段:
with open(file_name,'r') as f: for line in f: for word in line.split(): #print word ''' 处理标点符号 ''' word = word.replace('.','') word = word.replace(',','') word = word.replace('!','') word = word.replace('(','') word = word.replace(')','') word = word.replace(':','') word = word.replace(';','') word = word.replace('/','') word = word.replace('[','') word = word.replace(']','') word = word.replace('-','')
根据这个逻辑,我写了这段代码,是否有办法将其最小化?