第二节描述性统计量及检验

第二节描述性统计量及检验 2.1. 描述性统计量 • 随机变量的期望： =E(X) • 随机变量的方差： 2=E[(X- )2] • k-阶矩：E(Xk) • k-阶中心矩：E[(X－)k] • 偏度(skewness)：S=E[(X-)3/3] • 峰度(kurtosis)： K＝E[(X-)4/4]

第二节描述性统计量及检验 • 偏度和峰度都是用来测定收益率分布的形状，且都以正态分布为基准的。 • 正态分布：偏度=0，峰度=3。

第二节描述性统计量及检验 • 偏度的符号反映了分布偏斜的方向： • 当偏度S 值=0时，序列分布是对称的。 • 当偏度S>0时，称为正偏，意味着序列分布有长的右拖尾。 • 当偏度S<0时，称为负偏，意味着序列分布有长的左拖尾。 • 偏度的大小反映了分布偏斜的程度。

第二节描述性统计量及检验 S=0 S>0 S<0 均值＝中位数均值>中位数均值<中位数

第二节描述性统计量及检验 • 峰度反应分布隆起的程度： • 当峰度K>3时，序列分布曲线的凸起程度大于正态分布，即相对于正态分布更隆起； • 当峰度K<3时，序列分布曲线的凸起程度小于正态分布，即相对于正态分布更平坦。 • 正态分布的峰度K=3。

第二节描述性统计量及检验 K=3 K>3 K<3 正态分布的峰度＝3

第二节描述性统计量及检验 • 峰度也反映了分布尾部的厚薄。 • 正态分布的峰度K=3。K-3称为超出峰度。 • 具有正的超出峰度的分布称为尖峰分布。 • 尖峰分布具有厚尾性，即该分布在其支撑的尾部有比正态分布更大的概率。 • 用公式表示为：P{ <c}>p{X<c}，c是一个比较小的数。服从尖峰分布随机变量，X服从正态分布。

第二节描述性统计量及检验 • 在实际中，意味着来自于尖峰分布的随机样本会有更多的极端值。 • 如果小概率事件发生的可能性大于正态分布所描述的情形，那该变量的分布应当用尖峰分布来描述。 • 这在金融市场风险研究中有着重要的意义。

第二节描述性统计量及检验 • 样本均值 • 样本方差 • 样本偏度 • 样本峰度

第二节描述性统计量及检验 • Eviews操作： • 主菜单：File/New/Filework • 工作窗口: • Unstructured/Deservation/OK • 主菜单窗口： • Data/空格/变量名/回车 • 工作窗口： • 导入数据/view/Descriptive Ststistics（描述统计量） /Histogram and Stats（直方图和统计量）

第二节描述性统计量及检验 • 例2.1 右表是我国1992-2003年的实际GDP增长率（可比价格），对其进行描述性统计分析。

例2.1中GDP增长率的统计量：

第二节描述性统计量及检验 • 例2.1中GDP增长率的偏度是0.78，峰度K为2.14 ， • 说明GDP增长率的分布是不对称的，相对于正态分布也是平坦的。

第二节描述性统计量及检验 2.2. 统计量的检验 • Jarque-Bera检验 • 统计量 • 其中n是样本个数，S是偏度，K是峰度 • 由于正态分布的偏度S=0，峰度K=3，所以 JB 统计量是用来衡量偏度和峰度偏离0和3的程度。 • JB 统计量是用来检验时间序列是否服从正态分布的。

第二节描述性统计量及检验 • 检验步骤： • 原假设：时间序列服从正态分布。 • 计算S、K，并计算JB统计量。 • 在原假设下，JB 统计量服从自由度为2的X^2分布，即JB~ X^2(2)。以检验水平5%为例，对应的临界值=5.99，即P(X>5.99)=0.05。 • 若计算的JB >5.99，则拒绝原假设，分布不是正态分布。否则接受原假设。

上证综合指数收盘价曲线

上证综合指数收盘价曲线统计量

上证综合指数收益率曲线

上证综合指数收益率统计量

第二节描述性统计量及检验 • Quantile—Quantile图 • Q-Q图是借助分位数来比较两个分布的一种简单而重要的工具（比JB统计量的用途更加广泛）。 • 分位数（Quantile）：对于介于0，1之间的数 q，满足如下条件的数 x(q)称为 q 的分位数： P( x< x(q) ) < q

第二节描述性统计量及检验 • 分位数的计算： • 对于一组观察值，取概率：Pi=(i-0.5)/n ，i=1,…,n。 • 与Pi对应的分位数是把数据从小到大排列后的第i个数，记为Q(Pi)。 • 对任意概率P：Pi <P< Pi+1,有P=Pi +a( Pi+1-Pi)，那么 Q(P)=(1-a)Q(Pi) +aQ(Pi+1)

第二节描述性统计量及检验 • 例：数据为 1.1，3.1，0.9，4.2，0.7 • 从小到大排列为：0.7，0.9，1.1，3.1，4.2 • 与概率P对应的分位数： • P1=(1-0.5)/5=0.1, ，P2=0.3， P3=0.5， P4=0.7， P5=0.9 • Q(0.1)=0.7， Q(0.3)=0.9， Q(0.5)=1.1， Q(0.7)=3.1，Q(0.9)=4.2 • 对于概率0.2，由于介于P1和P2之间，且有 • 0.2=0.1+0.5X (0.3-0.1)， • 所以 • Q(0.2)=(1-0.5) X Q(0.1)+0.5X Q(0.3)=0.5X0.7+0.5X0.9=0.8

第二节描述性统计量及检验 • 随机变量分位数的计算： • 若已知某个随机变量的分布函数，给定概率q，由公式 • P( x< x(q) )=q • 即可求解出分位数 x(q)

第二节描述性统计量及检验 • Q-Q图----把已知分布的分位数标在纵轴上，样本分位数标在横轴上，所得到的图形称为Q-Q图 • Q-Q图方法是根据Q-Q图的形状来判定样本数据分布是否与已知分布相同： • 若样本数据分布与已知分布相同，则Q-Q图在一条直线上。 • 若Q-Q图不在一条直线上，则样本数据分布与已知分布不相同。

第二节描述性统计量及检验 Q-Q图的Eviews 6 操作： • 双击文件名(sh), 选择View/Graph … /Quantile-Quantile • 点击QQ graph中的options

第二节描述性统计量及检验 Q-Q图的Eviews 6 操作： • 双击文件名(sh), 选择View/Graph … /Quantile-Quantile • 点击QQ graph中的options，出现右边的对话框

第二节描述性统计量及检验 Q-Q图的Eviews 6 操作：双击文件名(sh), 选择View/Graph … /Quantile-Quantile • 点击QQ graph中的options，在出现对话框中distribution 选择对比的分布，如Normal

第二节描述性统计量及检验 • 可选与如下的理论分布的分位数相比较: • Normal(正态)分布：钟形并且对称的分布. • Uniform(均匀)分布：矩形密度函数分布. • Exponential(指数)分布：联合指数分布是一个有着一条长右尾的正态分布. • Logistic(逻辑)分布：除比正态分布有更长的尾外是一种近似于正态的对称分布. • Extreme value(极值)分布：I型极小值分布是有一条左长尾的负偏分布,它非常近似于对数正态分布. • 可以在工作文件中选择一些序列来与这些典型序列的分位数相比较，也可以在编辑框中键入序列或组的名称来选择对照的序列或组，EViews将针对列出的每个序列计算出QQ图。

第二节描述性统计量及检验 • Q-Q图的Eviews 6 操作： • 双击文件名(sh), 选择View/Graph … /Quantile-Quantile • 点击QQ graph中的options，在出现对话框中distribution 选择对比的分布，如Normal

第二节描述性统计量及检验 Q-Q图的Eviews 6 操作：双击文件名(sh), 选择View/Graph … /Quantile-Quantile • 点击QQ graph中的options，在出现对话框中distribution 选择对比的分布，如Normal • 点击OK，再点击确定，即出现上证综指收盘价sh与正态分布的QQ图

第二节描述性统计量及检验 Q-Q图的Eviews 6 操作：双击文件名(sh), 选择View/Graph … /Quantile-Quantile • 点击QQ graph中的options，在出现对话框中distribution 选择对比的分布，如Normal • 点击OK，再点击确定，即出现上证综指收盘价sh与指数分布的QQ图

第二节描述性统计量及检验 Q-Q图的Eviews 6 操作：双击文件名(sh), 选择View/Graph … /Quantile-Quantile • 点击QQ graph中的options，在出现对话框中distribution 选择对比的分布，如Normal • 点击OK，再点击确定，即出现上证综指收盘价sh与正态分布的QQ图

第二节描述性统计量及检验 • Excel表格的编辑 • 表格的编辑

第二节 描述性统计量及检验