在Python中读取.tar.gz文件

11 浏览
0 Comments

在Python中读取.tar.gz文件

我有一个25GB的文本文件。所以我将其压缩成tar.gz格式,大小变为450MB。现在我想要用Python读取该文件并处理文本数据。我参考了这个问题。但是在我的情况下代码不起作用。代码如下:

import tarfile
import numpy as np 
tar = tarfile.open("filename.tar.gz", "r:gz")
for member in tar.getmembers():
     f=tar.extractfile(member)
     content = f.read()
     Data = np.loadtxt(content)

错误如下:

Traceback (most recent call last):
  File "dataExtPlot.py", line 21, in 
    content = f.read()
AttributeError: 'NoneType' object has no attribute 'read'

此外,是否有其他方法可以完成这个任务?

0