当前位置:网站首页>时间序列的数据分析(一):主要成分
时间序列的数据分析(一):主要成分
2022-07-23 05:43:00 【-派神-】
时间序列是一组按照时间发生先后顺序进行排列,并且包含一些信息的数据点序列,在时间序列数据中通常包含了数据的发展趋势(向上、向下、保持)和数据的变化规律(季节性)等特征。而这些特征往往具有一定的规律性和可预测性,具体来说时间序列数据具有如下几种特点:
- 趋势性:某个变量随着时间进展或自变量变化,呈现一种比较缓慢而长期的持续上升、下降、保存不变的趋向,但变动幅度可能不相等。
- 季节性:某因素由于外部影响如随着自然季节的交替出现高峰与低谷的规律。
- 随机性:个别时刻呈现随机变动,整体呈统计规律。
在某些应用场景中需要对时间序列数据进行预测,比如在零售,电商等行业需要对未来一段时间的销售金额,客流量,订单量等进行预测,准确的预测结果可以为企业的领导层提供决策参考,并有助于提高企业的人效,为企业带来更多的利润。
一,趋势(Trend)
时间序列的数据往往包含了一定的数据发展趋势,比如下图中的数据有非常明显的趋势:

二,季节性(Seasonal)
时间序列数据中的季节性指的是数据中包含的周期性变化的规律,这些周期性变化规律往往和年度,月,季度,周等季节性时间点有密切的关系。通常季节性因子又可以分为1.加法季节性,2.乘法季节性。
2.1 加法季节性(Additive)
所谓加法季节性是指时间序列数据周期性变化的幅度不会随着时间的发展而发生变化,换句话说数据变化的幅度不受时间的影响(幅度保持不变)如下图所示:

从上图中可以看到,数据呈现出季节性变化规律,但是这种变化的幅度没有随着时间的发展而发生变化,即时间对季节性变化没有影响。
2.2 乘法季节性(Multiplicative)
所谓乘法季节性是指时间序列数据周期性变化的幅度会随着时间的发展而发生变化,换句话说数据变化的幅度和时间呈现线性关系如下图所示:

从上图中可以看到,数据呈现出季节性变化规律,并且这种季节性变化的幅度随着时间的发展而发生变化(比如逐渐变大或变小)。
三,残差(Residual)
残差是指当时间序列数据中删除了趋势和季节性特征以后剩余的部分,我们一般认为具有季节性特征的时间序列数据的残差的服从均值为0的正太分布,残差一般被认为是一种白噪声信号,我们可以通过逐步删除时间序列数据中的趋势和季节性特征来得到残差:

如上图所示当从原始数据中删除了趋势以后,剩余的成分就是:季节性+残差,接下来我们要从季节性+残差的成分中删除季节性成分后得到残差。

下面我们通过python的第三方类库statsmodes的seasonal_decompose来分解时间序列数据:
from statsmodels.tsa.seasonal import seasonal_decompose
df=pd.read_csv("airline_Passengers.csv")
df.set_index('Period',inplace=True)
df.index = pd.to_datetime(df.index)
data = df["#Passengers"]
seasonal_decomp = seasonal_decompose(data, model="additive")
seasonal_decomp.plot();总结
时间序列数据的主要成分包含: 趋势、季节性、残差。季节性又分为加法季节性和乘法季节性。可以使用statsmodes包的seasonal_decompose方法来分解时间序列。
参考资料
边栏推荐
- DBA command
- A hundred schools of thought contend at the 2021 trusted privacy computing Summit Forum and data security industry summit
- 使用飞桨的paddleX-yoloV3对钢材缺陷检测开发和部署
- Comparison between pytorch and paddlepaddle -- Taking the implementation of dcgan network as an example
- 读写文件数据
- How to build a liquid cooling data center is supported by blue ocean brain liquid cooling technology
- 数字经济“双碳”目标下,“东数西算”数据中心为何依靠液冷散热技术节能减排?
- 虚函数
- strand
- NVIDIA 英伟达发布H100 GPU,水冷服务器适配在路上
猜你喜欢

笔记 | 百度飞浆AI达人创造营:深度学习模型训练和关键参数调优详解

CPC客户端的安装教程

Green data center: comprehensive analysis of air-cooled GPU server and water-cooled GPU server

如何进行强制类型转换?

A hundred schools of thought contend at the 2021 trusted privacy computing Summit Forum and data security industry summit

知识图谱、图数据平台、图技术如何助力零售业飞速发展

飞桨高层API实现人脸关键点检测

笔记 | 百度飞浆AI达人创造营:数据获取与处理(以CV任务为主)

深度卷积生成对抗网络

“東數西算”下數據中心的液冷GPU服務器如何發展?
随机推荐
Introduction and use of Ninja
Iterative display of.H5 files, h5py data operation
Chaoslibrary · UE4 pit opening notes
BST tree
怎么建立数据分析思维
對.h5文件的迭代顯示,h5py數據操作
百变冰冰!使用飞桨的PaddleGAN实现妆容迁移
BST树
Summary of common mathematical knowledge
《数据中心白皮书 2022》“东数西算”下数据中心高性能计算的六大趋势八大技术
Compile Ninja with makefile
Accordion effect
笔记 | 百度飞浆AI达人创造营:让人拍案叫绝的创意都是如何诞生的?
All kinds of ice! Use paddegan of the propeller to realize makeup migration
链栈
使用pycaret来进行数据挖掘:关联规则挖掘
The green data center "counting from the east to the west" was fully launched
Service服务
对.h5文件的迭代显示,h5py数据操作
使用飞桨的paddleX-yoloV3对钢材缺陷检测开发和部署
