350 likes | 572 Views
第二节 描述性统计量及检验. 2.1. 描述性 统计量 随机变量的期望: =E(X) 随机变量的方差: 2 =E[(X- ) 2 ] k- 阶矩: E(X k ) k- 阶中心矩: E[(X - ) k ] 偏度 (skewness) : S=E[(X- ) 3 / 3 ] 峰度 (kurtosis) : K = E[(X- ) 4 / 4 ]. 第二节 描述性统计量及检验. 偏度和峰度都是用来测定收益率分布的形状,且都以正态分布为基准的。 正态分布:偏度 =0 ,峰度 =3 。. 第二节 描述性统计量及检验.
E N D
第二节 描述性统计量及检验 2.1. 描述性统计量 • 随机变量的期望: =E(X) • 随机变量的方差: 2=E[(X- )2] • k-阶矩:E(Xk) • k-阶中心矩:E[(X-)k] • 偏度(skewness):S=E[(X-)3/3] • 峰度(kurtosis): K=E[(X-)4/4]
第二节 描述性统计量及检验 • 偏度和峰度都是用来测定收益率分布的形状,且都以正态分布为基准的。 • 正态分布:偏度=0,峰度=3。
第二节 描述性统计量及检验 • 偏度的符号反映了分布偏斜的方向: • 当偏度S 值=0时,序列分布是对称的。 • 当偏度S>0时,称为正偏,意味着序列分布有长的右拖尾。 • 当偏度S<0时,称为负偏,意味着序列分布有长的左拖尾。 • 偏度的大小反映了分布偏斜的程度。
第二节 描述性统计量及检验 S=0 S>0 S<0 均值=中位数 均值>中位数 均值<中位数
第二节 描述性统计量及检验 • 峰度反应分布隆起的程度: • 当峰度K>3时,序列分布曲线的凸起程度大于正态分布,即相对于正态分布更隆起; • 当峰度K<3时,序列分布曲线的凸起程度小于正态分布,即相对于正态分布更平坦。 • 正态分布的峰度K=3。
第二节 描述性统计量及检验 K=3 K>3 K<3 正态分布的峰度=3
第二节 描述性统计量及检验 • 峰度也反映了分布尾部的厚薄。 • 正态分布的峰度K=3。K-3称为超出峰度。 • 具有正的超出峰度的分布称为尖峰分布。 • 尖峰分布具有厚尾性,即该分布在其支撑的尾部有比正态分布更大的概率。 • 用公式表示为:P{ <c}>p{X<c},c是一个比较小的数。 服从尖峰分布随机变量,X服从正态分布。
第二节 描述性统计量及检验 • 在实际中,意味着来自于尖峰分布的随机样本会有更多的极端值。 • 如果小概率事件发生的可能性大于正态分布所描述的情形,那该变量的分布应当用尖峰分布来描述。 • 这在金融市场风险研究中有着重要的意义。
第二节 描述性统计量及检验 • 样本均值 • 样本方差 • 样本偏度 • 样本峰度
第二节 描述性统计量及检验 • Eviews操作: • 主菜单:File/New/Filework • 工作窗口: • Unstructured/Deservation/OK • 主菜单窗口: • Data/空格/变量名/回车 • 工作窗口: • 导入数据/view/Descriptive Ststistics(描述统计量) /Histogram and Stats(直方图和统计量)
第二节 描述性统计量及检验 • 例2.1 右表是我国1992-2003年的实际GDP增长率(可比价格),对其进行描述性统计分析。
第二节 描述性统计量及检验 • 例2.1中GDP增长率的偏度是0.78,峰度K为2.14 , • 说明GDP增长率的分布是不对称的,相对于正态分布也是平坦的。
第二节 描述性统计量及检验 2.2. 统计量的检验 • Jarque-Bera检验 • 统计量 • 其中n是样本个数,S是偏度,K是峰度 • 由于正态分布的偏度S=0,峰度K=3,所以 JB 统计量是用来衡量偏度和峰度偏离0和3的程度。 • JB 统计量是用来检验时间序列是否服从正态分布的。
第二节 描述性统计量及检验 • 检验步骤: • 原假设:时间序列服从正态分布。 • 计算S、K,并计算JB统计量。 • 在原假设下,JB 统计量服从自由度为2的X^2分布,即JB~ X^2(2)。以检验水平5%为例,对应的临界值=5.99,即P(X>5.99)=0.05。 • 若计算的JB >5.99,则拒绝原假设,分布不是正态分布。否则接受原假设。
第二节 描述性统计量及检验 • Quantile—Quantile图 • Q-Q图是借助分位数来比较两个分布的一种简单而重要的工具(比JB统计量的用途更加广泛)。 • 分位数(Quantile):对于介于0,1之间的数 q,满足如下条件的数 x(q)称为 q 的分位数: P( x< x(q) ) < q
第二节 描述性统计量及检验 • 分位数的计算: • 对于一组观察值,取概率:Pi=(i-0.5)/n ,i=1,…,n。 • 与Pi对应的分位数是把数据从小到大排列后的第i个数,记为Q(Pi)。 • 对任意概率P:Pi <P< Pi+1,有P=Pi +a( Pi+1-Pi),那么 Q(P)=(1-a)Q(Pi) +aQ(Pi+1)
第二节 描述性统计量及检验 • 例:数据为 1.1,3.1,0.9,4.2,0.7 • 从小到大排列为:0.7,0.9,1.1,3.1,4.2 • 与概率P对应的分位数: • P1=(1-0.5)/5=0.1, ,P2=0.3, P3=0.5, P4=0.7, P5=0.9 • Q(0.1)=0.7, Q(0.3)=0.9, Q(0.5)=1.1, Q(0.7)=3.1,Q(0.9)=4.2 • 对于概率0.2,由于介于P1和P2之间,且有 • 0.2=0.1+0.5X (0.3-0.1), • 所以 • Q(0.2)=(1-0.5) X Q(0.1)+0.5X Q(0.3)=0.5X0.7+0.5X0.9=0.8
第二节 描述性统计量及检验 • 随机变量分位数的计算: • 若已知某个随机变量的分布函数,给定概率q,由公式 • P( x< x(q) )=q • 即可求解出分位数 x(q)
第二节 描述性统计量及检验 • Q-Q图----把已知分布的分位数标在纵轴上,样本分位数标在横轴上,所得到的图形称为Q-Q图 • Q-Q图方法是根据Q-Q图的形状来判定样本数据分布是否与已知分布相同: • 若样本数据分布与已知分布相同,则Q-Q图在一条直线上。 • 若Q-Q图不在一条直线上,则样本数据分布与已知分布不相同。
第二节 描述性统计量及检验 Q-Q图的Eviews 6 操作: • 双击文件名(sh), 选择View/Graph … /Quantile-Quantile • 点击QQ graph中的options
第二节 描述性统计量及检验 Q-Q图的Eviews 6 操作: • 双击文件名(sh), 选择View/Graph … /Quantile-Quantile • 点击QQ graph中的options, 出现右边的对话框
第二节 描述性统计量及检验 Q-Q图的Eviews 6 操作: 双击文件名(sh), 选择View/Graph … /Quantile-Quantile • 点击QQ graph中的options, 在出现对话框中distribution 选择对比的分布,如Normal
第二节 描述性统计量及检验 • 可选与如下的理论分布的分位数相比较: • Normal(正态)分布:钟形并且对称的分布. • Uniform(均匀)分布:矩形密度函数分布. • Exponential(指数)分布:联合指数分布是一个有着一条长右尾的正态分布. • Logistic(逻辑)分布:除比正态分布有更长的尾外是一种近似于正态的对称分布. • Extreme value(极值)分布:I型极小值分布是有一条左长尾的负偏分布,它非常近似于对数正态分布. • 可以在工作文件中选择一些序列来与这些典型序列的分位数相比较,也可以在编辑框中键入序列或组的名称来选择对照的序列或组,EViews将针对列出的每个序列计算出QQ图。
第二节 描述性统计量及检验 • Q-Q图的Eviews 6 操作: • 双击文件名(sh), 选择View/Graph … /Quantile-Quantile • 点击QQ graph中的options, 在出现对话框中distribution 选择对比的分布,如Normal
第二节 描述性统计量及检验 Q-Q图的Eviews 6 操作:双击文件名(sh), 选择View/Graph … /Quantile-Quantile • 点击QQ graph中的options, 在出现对话框中distribution 选择对比的分布,如Normal • 点击OK,再点击确定,即出现上证综指收盘价sh与正态分布的QQ图
第二节 描述性统计量及检验 Q-Q图的Eviews 6 操作:双击文件名(sh), 选择View/Graph … /Quantile-Quantile • 点击QQ graph中的options, 在出现对话框中distribution 选择对比的分布,如Normal • 点击OK,再点击确定,即出现上证综指收盘价sh与指数分布的QQ图
第二节 描述性统计量及检验 Q-Q图的Eviews 6 操作:双击文件名(sh), 选择View/Graph … /Quantile-Quantile • 点击QQ graph中的options, 在出现对话框中distribution 选择对比的分布,如Normal • 点击OK,再点击确定,即出现上证综指收盘价sh与正态分布的QQ图
第二节 描述性统计量及检验 • Excel表格的编辑 • 表格的编辑