如何在pandas数据框中获取日期时间的最大值和最小值?

11 浏览
0 Comments

如何在pandas数据框中获取日期时间的最大值和最小值?

我正在使用pandas探索一些数据(我使用read_excel从Excel导入数据集)。\n我的一列是一个日期时间... 我如何选择这个日期时间列的最大值和最小值?\n这与这里的问题相同:\n从pandas dataframe获取最小和最大日期\n但是,在那里没有得到答案... 我的日期时间列不是我的索引(我只有默认索引0,1,2,3...)\n我尝试使用max(df[\'creation_date\']),但我不认为它识别出了日期,我得到了\n

\n\'31-10-2020 22:33:10\'\n

\n(在数据集中,我还有2021年的日期时间...)\n我如何选择最大和最小日期?我必须将日期作为索引才能实现吗?\n(我来自SQL背景... 当我执行df.info()时,日期时间的Dtype是object,我可以将数据帧的列的数据类型更改为datetime吗?)

0
0 Comments

问题:如何在pandas的数据框中获取日期时间的最大值和最小值?

原因:数据框中的日期时间列被默认为object类型,无法直接计算最大值和最小值。因此,需要将日期时间列的数据类型转换为datetime类型。

解决方法:可以通过以下步骤解决该问题:

1. 将日期时间列的数据类型由object转换为datetime类型,使用以下代码:

df['creation_date']=pd.to_datetime(df['creation_date'])

2. 计算最大日期值和最小日期值,使用以下代码:

df['creation_date'].max()
df['creation_date'].min()

3. 另外,还可以在导入数据时就将日期列转换为datetime类型,在pd.read_excel()方法中的parse_dates参数中传递包含日期格式的列的列表,示例如下:

df=pd.read_excel('your file.xlsx',engine='openpyxl',parse_dates=['creation_date'])

0