时序建模属实是一个令人困惑的抽象概念因为它被不分场合的混用 (统计学、机器学习、深度学习)术语定义也较为模糊。1、什么是时序建模时序建模就是处理带有时间顺序的数据并且利用时间顺序处理问题预测、分类和异常检测。需要满足的关键特征(满足以下几点审稿人就很难攻击你的工作不是时序建模)数据点之间不是独立存在的顺序很重要存在时间依赖关系2、三种时序建模时序建模主要分为三种统计学、机器学习和深度学习。2.1 统计学这是最经典的时序建模关注统计规律自回归模型AR、移动平均模型MA、ARIMA和状态空间模型。特点参数少可解释性强适合线性关系2.2 机器学习引入更多特征工程和传统算法将时序问题转化为监督学习问题。例如特征工程 (提取滞后特征、滑动窗口统计、季节性特征)、算法线性回归、XGBoost/LightGBM、SVM特点需要大量特征工程非线性能力有限2.3 深度学习能够进一步的处理更加复杂的非线性问题其实2.1~2.3也就是一个非线性应对能力增长的过程从2.1统计学的线性回归到2.3的非线性模型例如RNN/LSTM/GRU、TCN、Tranformer时序建模的核心任务类型时序建模任务 ├── 预测任务最常见 │ ├── 单步预测预测下一个时间点 │ ├── 多步预测预测未来多个时间点 │ ├── 序列到序列输入序列 → 输出序列 │ └── 滚动预测不断用新观测值更新预测 │ ├── 分类任务 │ ├── 序列分类整条时间序列的类别如心电图分类 │ └── 时间点分类每个时间点的类别如动作识别 │ ├── 异常检测 │ ├── 点异常单个时间点的异常 │ └── 集体异常连续时间段的异常 │ └── 生成任务 ├── 数据增强生成类似的时间序列 └── 补全任务填补缺失的时间点实际项目中的时序建模流程1.问题定义 ↓2.数据探索和预处理 │-处理缺失值 │-平稳性检验 │-季节性分析 ↓3.构建监督学习数据集 │-创建滞后特征 │-定义时间窗口 │-划分训练/验证/测试集按时间顺序 ↓4.模型选择 │-简单任务传统方法ARIMA │-中等复杂度树模型XGBoost │-复杂序列深度学习LSTM/Transformer ↓5.模型训练和评估 │-使用时间序列交叉验证 │-评估指标MAE,RMSE,MAPE ↓6.部署和监控后记本人在摸索学习的过程中踩过不少奇奇怪怪的坑大部分都是自己一厢情愿和固有认知导致的左脚绊右脚例如时序建模不仅仅是预测未来的曲线走向还能完成其他任务深度学习不一定比统计学好例如数据量不足和规律明显时就别硬上造创新点不算注意避免数据泄露让代码陪着自己骗自己(哈哈)RNN/LSTM/GRU这几个卧龙凤雏是一起的Transformer和他们不一样。