我有剔除数据,我想通过删除每天的第一行和最后一行来进行细化。原始数据帧的datetime64 [ns]索引格式为'%Y-%m-%d %H:%M:%S'
'%Y-%m-%d %H:%M:%S'
为此,我曾经
pd.resample('D').first() pd.resample('D').last()
并成功地采样了每天的第一行和最后一行。问题是当以天为单位进行重新采样时,原始日期时间索引会转换为'%Y-%m-%d'格式
如何使用重采样,使其保留原始的日期时间索引格式?还是有一种方法可以在新数据框中重新格式化日期时间索引以显示到几秒钟?
查看更多
您的问题是您每天都要重新采样并每天获得第一个值。但是,您想包括该第一个值的关联日期。
您还希望在索引中汇总日期。
df.assign(NewDate=df.index).resample('D').first().set_index('NewDate')
或者您可以resample索引并获取最小值
resample
df.loc[df.index.to_series().resample('D').min()]