在Linux中从Excel数据透视表电子表格中提取数据

7 浏览
0 Comments

在Linux中从Excel数据透视表电子表格中提取数据

我有一个基于数据透视表的Excel电子表格,定期更新(每月一次),并上传到我的服务器(由一个非常不愿意更改输出内容的团队生成)。我想编写一个脚本,通过cron job运行,以处理并加载透视表的原始数据到我的数据库中。

然而,我无法找到在不手动进入Windows的情况下访问底层数据的方法。我需要打开Excel文件,双击总计单元格,获取一个包含填充该单元格的所有原始数据的新表格,并将该表格保存为CSV文件,然后通过某种语言(在我这里是Python)加载到我的数据库中。似乎应该有一种可编写脚本的方法来提取底层数据。

我只有Linux机器(在虚拟机中运行Windows/Office),但我希望找到一种不涉及Windows的解决方案。我熟悉像xls2csv这样的工具(无法访问原始数据),以及使用python-unoconv等工具从Python编辑OpenOffice文档。然而,即使是手动使用OpenOffice,我也找不到获取底层数据的方法。

编辑:在花了几个小时没有取得任何进展之后(在发布这篇文章之前),我现在开始通过unoconv将其转换为ODS,并可能能够使用python-odf来提取最后一个表格(名为“DPCache”)。

现在的问题是将ODS文件中的一个表格转换为CSV,这对我来说应该不难解决(尽管非常感谢提供帮助)。

0