如何根据特定日期获取最后修改的文件并导入到Python脚本中
如何根据特定日期获取最后修改的文件并导入到Python脚本中
我在我的Data文件夹中有一个文件列表。我可以获取list_of_files
:\nlist_of_files = glob.glob(r\'C:\\Users\\Desktop\\Data\\*.csv\')
\n我想使用pandas读取指定日期(例如05/31/2021)上最后修改的文件。在05/31/2021这一天,可能有多个文件被修改,我需要最后修改的那个文件latest_file
,然后导入到Python脚本中,像这样:\ndf = pd.read_csv(latest_file, usecols=[\'A\', \'B\', \'C\'])
\n如何实现这个目标?非常感谢。\n(如果您能让修改日期为某个月的最后一天,如04/30/2021、05/31/2021、6/30/2021等,那将更好。)
问题原因:该问题是由于需要根据特定日期获取最后修改的文件,并将其导入到Python脚本中,但作者不清楚如何实现这一功能。
解决方法:在这个代码示例中,作者定义了一个名为get_latest_file
的函数,该函数接受两个参数:日期时间和文件路径。函数使用Path
类从指定路径中获取所有以.csv
结尾的文件,并将其保存在一个DataFrame中。然后,函数将文件的修改日期时间转换为pd.Timestamp
格式,并与指定的日期时间进行比较。函数使用idxmax()
方法找到符合条件的最新修改日期时间的文件索引,并返回该文件的路径。
最后,函数将返回的文件路径传递给pd.read_csv
函数,以读取该文件的内容。
通过这种方法,作者成功地解决了根据特定日期获取最后修改的文件并导入到Python脚本的问题。