Pandas 实战九:时序数据处理,日期筛选/统计分析一看就会
作者:互联网
2026-03-24
接上篇《Pandas 实战八:电商数据案例分析,从数据提取到可视化全流程》
什么是时序数据?简单说就是带日期/时间戳的数据,比如店铺每日销售额、APP用户登录日志、气象站 hourly 观测数据、打卡记录等。这类数据日常工作中超常见,比如老板让你“统计7月份每周的销售额”“筛选出3月10日-3月20日的用户行为”,用Pandas处理起来比Excel快10倍,新手也能轻松拿捏!

一、先搞懂:时序数据的“基础操作”(避免踩坑)
处理时序数据的第一步,是让Pandas“认识”日期——很多时候我们拿到的数据,日期是字符串格式(比如"2024-07-01"),没法直接按日期筛选,所以先学「日期格式转换」。
1. 准备数据+转换日期格式
先模拟一份“店铺7月销售数据”(新手直接复制代码就能跑):
2. 进阶:把日期设为“索引”(更方便操作)
将日期列设为索引后,筛选、统计会更简洁,新手建议养成这个习惯:
运行结果会看到,日期跑到了最左边(索引列),后续操作更直观~
二、核心技能1:按日期筛选(新手最常用)
筛选时序数据的场景太多了!比如“筛选7月5日之后的数据”“筛选每周一的记录”,下面是3个高频场景,直接套用就行:
场景1:按“具体日期/时间段”筛选
场景2:按“年/月/日”筛选(比如筛选7月份所有数据)
场景3:按“季度/星期”筛选(进阶)
三、核心技能2:时序数据统计(按周期汇总)
统计需求比如“按日/周/月统计销售额总和”“计算每周平均客流量”,用resample()函数一键搞定,新手记好这几个常用周期就行:
- 日:D(Day)
- 周:W(Week)
- 月:M(Month)
- 季度:Q(Quarter)
示例:按周/月统计销售数据
运行结果会自动按周期分组,比如“2024-07-07”代表第一周(截至周日),不用自己手动分组,超方便!
四、实战案例:分析7月销售趋势
学完基础操作,咱们来个完整实战——用7月销售数据做“趋势分析”,还能生成简单图表(新手也能跟着跑):
需求:
- 计算7月每日销售额的滚动平均值(5日滚动,平滑波动);
- 统计每周销售额占比;
- 绘制“每日销售额+滚动平均值”折线图。
运行后会弹出一个折线图,能清晰看到每日销售额的波动和整体趋势,滚动平均值还能帮我们排除偶然波动,找到真实趋势~
五、新手避坑指南(3个常见问题)
1. 日期格式不统一
比如数据里有"2024-07-01"和"2024/07/01",用pd.to_datetime()时加errors="coerce",无法转换的会变成NaT(缺失日期),避免报错:
2. 筛选时“左闭右开”?
用索引切片df_indexed["2024-07-01":"2024-07-05"]是左闭右闭(包含7月5日),但resample("W")默认以周日为一周结束,记得确认周期范围。
3. 缺失日期补全
如果数据有缺失(比如7月6日没记录),用resample("D").asfreq()补全日期,缺失值用fillna(0)填充:
六、总结
今天咱们学会了时序数据的核心操作:日期格式转换、按日期/周期筛选、时序统计和趋势分析,这些技能足够应对日常工作中的大部分场景啦!
时序数据是数据分析的重要分支,比如后续做库存预测、用户活跃度分析,都离不开这些基础。
相关标签:
相关推荐
专题
+ 收藏
+ 收藏
+ 收藏
+ 收藏
+ 收藏
最新数据
相关文章
NanoClaw 开源轻量级个人AI助手 安全可靠的OpenClaw替代方案
MonsterClaw 采用 OpenClaw 技术打造的本地化AI运行平台
TinyClaw 由TinyAGI推出的开源轻量级多智能体协作框架
携程酒店业务借助NebulaGraph实现月均风控止损逾百万元
稀宇科技开源MiniMax Office Skills生产级办公文档引擎
ToClaw由ToDesk打造的专业定制AI智能体
TypeNo 免费开源的中文AI语音输入法 无需配置直接使用
Sub2API 开源人工智能API中转网关平台 具备多账户管理功能
阿里通义推出视频生成音频框架PrismAudio
Luma AI发布Uni-1模型实现图像理解与生成一体化
AI精选
