1 / 55

时间序列分析 中国人民大学统计学院 中国人民大学统计咨询研究中心 易丹辉

时间序列分析 中国人民大学统计学院 中国人民大学统计咨询研究中心 易丹辉. 二 ○ ○ 五年七月. 概 述. 时间序列的含义 时间单位 年 季 月 周 日 时 低频数据 高频数据 时序数据特点. 数据量 足够数量的数据反映变化规律 支持模型的建立 数据量并不是越大越好 注意延伸到未来的规律

booth
Download Presentation

时间序列分析 中国人民大学统计学院 中国人民大学统计咨询研究中心 易丹辉

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 时间序列分析中国人民大学统计学院中国人民大学统计咨询研究中心 易丹辉 二○ ○五年七月

  2. 概 述 时间序列的含义 时间单位 年 季 月 周 日 时 低频数据 高频数据 时序数据特点

  3. 数据量 足够数量的数据反映变化规律 支持模型的建立 数据量并不是越大越好 注意延伸到未来的规律 数据管理 ——数据库 数据的更新

  4. 10000 8000 6000 4000 2000 0 80 82 84 86 88 90 92 94 96 98 Y

  5. 9000 8000 7000 6000 5000 4000 95:1 95:3 96:1 96:3 97:1 97:3 98:1 98:3 99:1 Y

  6. 数据表现 观察数据的变化 是否有异常数据出现 原因分析 规律分析 是否有冲击或干扰 瞬间 持续

  7. 140000 120000 100000 80000 60000 98 99 00 01 02 03 Y

  8. 3.5E+09 3.0E+09 2.5E+09 2.0E+09 1.5E+09 1.0E+09 5.0E+08 99:01 99:07 00:01 00:07 01:01 01:07 02:01 02:07 Y

  9. 单变量时间序列分析 趋势模型 确定型趋势模型 平滑模型 季节模型 水平模型 加法模型 乘法模型

  10. ARMA模型 ARIMA模型 (G)ARCH类模型

  11. 多变量时间序列分析 多变量时间序列回归模型 误差修正(ECM)模型 向量自回归(VAR)模型 向量误差修正(VEC)模型 Panel Data 模型

  12. 一、单变量时间序列分析 (一)模型的选择 1. 数据量和时间单位 数据量足够多 —— ARMA、ARIMA、GARCH 数据量不够多 ——确定型趋势模型 平滑模型

  13. 月、季数据量足够多 ——季节模型 ARMA、ARIMA、GARCH 年数据量不够多 ——确定型趋势模型 平滑模型 月、季、年数据量不够多 ——平滑模型

  14. 2. 定性与定量结合 根据时间序列数据特点 实际现象的变化 例:我国社会商品零售总额 我国商品价格指数 观察时序图 分析变化特点

  15. 3. 趋势类型判断 —— 自相关函数 —— 单位根检验 例:我国商品零售量指数

  16. (三)模型分析与评价 1. 检验 各种不同模型有不同的检验 关键——模型已提取所有信息 2. 对历史数据拟合的分析 直观判断法图、表 误差分析法 MAPE 3. 对未来趋势反映的分析 近期趋势的反映直观判断 误差分析 试预测 预测结果的可能性分析

  17. 二、ARMA模型 (一)模型的引进 多元线性回归 自回归 移动平均模型 简单平均:序列平稳 围绕均值波动 = = = =

  18. 移动平均:近期数据对预测的影响更重要 加进新数据,则删除远离现在的数据 = = = = T的作用:平滑数据 T的取值:自然数 数值大小对结果的影响

  19. 以均值替代 有 = + ( ) = + 特点:利用误差修正,调整前期预测值 跟踪数据变化 时间序列可以用过去的误差项表出 = + +……+ +

  20. (二)方法性工具 1. 自相关 含义:时间序列诸项之间的简单相关 自相关系数: 计算公式 取值 作用 自相关函数 抽样分布

  21. 2.偏自相关 含义:时间序列 ,在给定了 , ,……, 的条件下, 与 之间的条件相关。 偏自相关系数: 计算公式取值作用 偏自相关函数

  22. (三)时序特性分析 1. 平稳性分析 (1) 平稳时序 描述性定义:序列的统计特征不随时间而变化 均值恒为常数;自相关系数只与时间间隔有关,与时间起始点无关。 自相关的特点: 自相关系数 在K等于2或3后迅速趋于零。

  23. (2) 趋势消除 差分(逐期、短差) 2. 季节性分析 (1) 自相关的特点 注意时滞 (2) 季节差分 3. 随机性

  24. (四)ARMA模型及其改进 1. 自回归模型AR(p) 模型的一般形式 AR (p) 序列的自相关和偏自相关 :拖尾性 :截尾性 =

  25. 2. 移动平均模型MA( q ) 模型的一般形式 MA (q) 序列的自相关和偏自相关 = 截尾性 : :拖尾性

  26. AR与MA间的对偶性 相互表出 AR(P) 可以用既往的 有限加权和表出 可以用既往的 无限加权和表出 = = MA (q) = = 可以用既往的 有限加权和表出 可以用既往的 无限加权和表出

  27. 相关函数 平稳与可逆 若一个序列可以用无限阶的自回归模型逼近,即逆函数存在,称为具有可逆性,也就是可逆的。

  28. 3. 自回归移动平均混合模型 ARMA( p, q ) 模型的一般形式 ARMA (p , q) 序列 的自相关和偏自相关 4. 改进的ARMA模型 ARIMA( p , d , q ) ARIMA (P,D,Q ARIMA(p,d,q) (P,D,Q

  29. (五) 模型的建立 1. 模型识别 选择各个阶数 d ,D p, q P,Q 2. 参数估计 3.模型检验 残差序列的自相关检验 直观判断 残差序列的自相关系数是否落入随机区间

  30. 统计检验 检验法 m个独立N(0,1)随机变量的平方和,服从自由度 为m的 分布。如果将残差序列的自相关函数作为一 个整体考虑,当模型选择合适时,可以证明: Q = n (e) 为近似的 (m – p – q )分布。其中,m 是最大时 滞数,n 为计算 (e)的数据个数。

  31. (六)预测 1. 最小方差预测: 使时间序列未来值的预测误差尽可能小 预测误差 (L)= - (L)的方差 E( (L) = E( - (L) 应达到最小 。

  32. 也就是要使选择的时间序列L步预测值(L)与时间序列实际值之间距离比其它任何一点都短。也就是要使选择的时间序列L步预测值(L)与时间序列实际值之间距离比其它任何一点都短。 2. 预测的递推形式

  33. (七)单位根过程 • 问题的提出 • 用于预测的线性平稳模型: • AR(p)模型 (B) = 方程(B)= 0称为过程的特征方程,过程平稳的条件是,特征方程所有根的绝对值都必须大于1,即在单位圆外。

  34. 2. 单位根的定义 随机过程{ ,t = 1,2,......},若 = t = 1,2,...... 其中,= 1,{ }为一稳定过程,且E( )= 0, cov ( , ) = < , 这里 s = 0,1,2,......,则该过程称为单位根过程(unit root process)。 + +

  35. 特别地,若 = + t = 1,2,...... 其中,{ }为独立同分布,且E( ) = 0, D( ) = < ,则{ }为一随机游动过程(random waik process)。可以看出,随机游动过程是单位根过程的一个特例。

  36. 若随机过程{ }的一阶差分过程( = )为一稳定过程,则{ }服从单位根过程。 分别以I(1)和I(0)表示单位根过程和稳定过程, 则可将 和 记为 ~ I(1)~ I(0)

  37. 3.趋势类型 确定性趋势模型趋势平稳 时间序列中的趋势有不同的表现形式,如,带趋势的稳定过程 = c + t + 其中,f ( t ) = c + t,表示时间序列{ }的确定性趋势(deterministic trend)。 的期望是时间t的线性函数,其值在c + t周围波动。 为一稳定过程。

  38. 随机性趋势模型差分平稳 带常数项的单位根过程 = c + + 其中,c是常数项。对 不断地向后迭代,得到 = c + (c + + )+ = ....... = ct + 确定的时间趋势ct ,是由单位根过程中的常数项积累而成

  39. 时间序列的趋势大体有以下三种基本类型: (1)(1)序列不含常数项、时间趋势项 = + 若 =1 ,序列为一单位根过程;若< 1, 序列为一稳定过程。 (2)序列含常数项、不含时间趋势项 = c + + 若 =1 ,序列为一带常数项的单位根过程; 若< 1,序列为一带常数项的稳定过程。

  40. (3)序列带常数项和时间趋势项 = c + + t + 若 =1 ,序列为一带常数项和时间趋势项的 单位根过程; 若< 1,序列为一带常数项和时间趋势项的稳定过程。

  41. 4. 单位根检验 (1)迪基—福勒(DF)检验 一阶自回归模型 = + := 1 为真时 最小二乘估计的t统计量为 t = 式中,为 的最小二乘估计,SE( )为 的标准差。

  42. 检验标准: t统计量有非标准和非对称的极限分布, 记作 ,对于给定的样本量n和显著性水平 , 若统计量的实际计算值 小于临界值,则拒绝原假设 。

  43. (2)ADF检验 DF检验只对存在一阶自相关的序列适用。 ADF检验适用于存在高阶滞后相关的序列。 = + 表述为 = + 存在高阶滞后相关的序列,经过处理可以表述为 = + + + ....... + + 上式中,检验假设为 或加带常数项,或加带趋势项,或加带常数项和趋势项, := 0 检验标准同DF检验。

  44. 示 例 我国工业总产值预测 计算机实现 1.建立工作文件 File/New/Workfile 月度数据,点选M,输入起始时间和终止时间 1990:01 1997:12 2.读入数据 File/Import/Excel 找到文件存储路径(如A盘或D盘),然后在对 话框中,输入变量的个数1,点击OK。

  45. 3.绘制时序图 Quick/Graph/Line Graph/y 观察序列的特点 4.选择模型 季节乘法模型 ARIMA模型 保留一年数据,作为试预测用。在窗口输入 SMPL 1990:01 1996:12

  46. (1)季节性交乘趋向模型 输入时间变量t(可调入,也可直接输入) 建立趋势方程: LS Y C t 在回归结果窗口,点选Forcast,命名预测值序列,例如为YF,则YF为各期趋势值。 求各期季节比: GENR V=Y/YF

  47. 求理论季节指数: Quick/Series Statistics/Seasonal Adjustment 在对话框中点选乘法,并为因子命名,如S, 点击OK,屏幕出现结果,S同时保存在内存中。 求估计值: GENR YT=YF*S 若记住参数(截距、斜率)的数值,也可以直接定义 GENR YT=(1374.9597+35.5915* t )*S

  48. 模型分析评价: 绘制时间序列实际值与预测值曲线图 Quick/Graph/Line Graph/Y YT 计算MAPE GENR APE=ABS((Y-YT)/Y) Quick/ Series Statistics/Histogram and Stats 观察均值Mean,乘以100则为MAPE。

  49. 试预测: 扩展样本期 SMPL 1990:01 1997:12 GENR YT=(1374.9597+35.5915* t )*S 注意:时间变量是否已经输入完整 分析试预测的结果,与实际值比较。 绘制曲线图 计算MAPE

  50. (2)ARIMA模型 1)时间序列特性分析: Quick/ Series Statistics/Correlogram 观察时序自相关,决定处理方式。 一阶逐期差分: GENR IY=Y-Y(-1) 观察一阶逐期差分序列自相关 Quick/ Series Statistics/Correlogram/IY

More Related