470 likes | 738 Views
第六章 异方差. Heteroskedasticity. 本章主要内容. 第一节 异方差的概念 第二节 异方差的后果 第三节 异方差的检验 第四节 异方差的处理. 第一节 异方差的概念. 同方差性 假定的意义是指每个 i 围绕其零平均值的变差,并不随解释变量 X 的变化而变化,不论解释变量观测值是大还是小,每个 i 的方差保持相同,即 i 2 = 常数 在 异方差 的情况下, i 2 已不是常数,它随 X 的变化而变化,即 i 2 =f(X i ). 异方差一般可归结为三种类型:
E N D
第六章 异方差 Heteroskedasticity
本章主要内容 • 第一节 异方差的概念 • 第二节异方差的后果 • 第三节 异方差的检验 • 第四节 异方差的处理
同方差性假定的意义是指每个i围绕其零平均值的变差,并不随解释变量X的变化而变化,不论解释变量观测值是大还是小,每个i的方差保持相同,即同方差性假定的意义是指每个i围绕其零平均值的变差,并不随解释变量X的变化而变化,不论解释变量观测值是大还是小,每个i的方差保持相同,即 i2 =常数 • 在异方差的情况下, i2已不是常数,它随X的变化而变化,即 i2 =f(Xi)
异方差一般可归结为三种类型: (1)单调递增型: i2随X的增大而增大; (2)单调递减型: i2随X的增大而减小; (3)复 杂 型: i2与X的变化呈复杂形式。
注意 • 当线性回归模型存在解释变量缺落、函数形式不准和参数改变等模型定式误差问题时也会表现出与异方差相似的特征,容易与由误差项变动幅度变化引起的真正异方差混淆。 • 例如两个变量有真实关系 其中误差项满足线性回归模型的所有假设。 • 但如果误以为Y 和X 之间的关系是: • 并认为 ,那么
注意(续) • 若记 ,则 • 因此 是 的函数,即模型表现出异方差性。 • 这种异方差本质上与误差项波动变化的异方差是不同的,是模型误差项均值非零的系统偏差导致的,我们称这种异方差为“假性的”。
实际经济问题中的异方差 • 例如:在截面资料下研究居民家庭的储蓄行为 • Yi=0+1Xi+i • Yi和Xi分别为第i个家庭的储蓄额和可支配收入。 在该模型中,i的同方差假定往往不符合实际情况。对高收入家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律性(如为某一特定目的而储蓄),差异较小。 因此,i的方差往往随Xi的增加而增加,呈单调递增型变化。
例如,以绝对收入假设为理论假设、以截面数据作样本建立居民消费函数:例如,以绝对收入假设为理论假设、以截面数据作样本建立居民消费函数: • Ci= 0+1Yi+i • 将居民按照收入等距离分成n组,取组平均数为样本观测值。 • 一般情况下:居民收入服从正态分布,处于中等收入组中的人数最多,处于两端收入组中的人数最少。而人数多的组平均数的误差小,人数少的组平均数的误差大。所以样本观测值的观测误差随着解释变量观测值的增大而先减后增。
例如,以某一行业的企业为样本建立企业生产函数模型Yi=Ai1Ki2Li3eI例如,以某一行业的企业为样本建立企业生产函数模型Yi=Ai1Ki2Li3eI • 产出量为被解释变量,选择资本、劳动、技术等投入要素为解释变量,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。 由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,为复杂型的一种。
第二节异方差的后果 • 1. 参数估计量非有效 • 2. 变量的t检验失去意义 • 3. 模型的预测失效
1. 参数估计量非有效 • 普通最小二乘法参数估计量仍然具有无偏性,但不具有有效性。 • 而且,在大样本情况下,参数估计量仍然不具有渐近有效性,这就是说参数估计量不具有一致性。
以两变量线性回归模型为例进行说明: • (1)仍存在无偏性:证明过程与方差无关 由于Y = + X + 的参数的OLS估计量b为:
3. 模型的预测失效 • 一方面,由于上述后果,使得模型不具有良好的统计性质; • 另一方面,在预测值的置信区间中也包含有随机误差项共同的方差2。 • 所以,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
第三节 异方差的检验 • 1. 残差序列图分析 • 2. 戈德菲尔德-夸特检验 • 3. 戈里瑟检验 • 4. 怀特异方差检验
检验方法的共同思路 • 由于异方差就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么检验异方差,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。
1. 残差序列图分析 • 利用模型回归残差序列图的分布形态进行分析,是发现和判断异方差问题的基本方法。 • 以i 或 为横轴,残差e为纵轴,作残差序列的分布图形,那么模型不存在异方差问题时,回归残差应该均匀地分布在横轴上下的一定范围内,如图6.2(a)。 • 如果残差序列的分布形态如图6.2(b), 的分布有随着 的增大而越分散的趋势,那么应该怀疑存在异方差性,而且是递增异方差。
图6.2 异方差的发现和识别 (a) (b)
如果残差序列分布形态如图6.2(c)或(d),应该考虑递减异方差或复杂异方差的可能性。如果残差序列分布形态如图6.2(c)或(d),应该考虑递减异方差或复杂异方差的可能性。 • 如果残差序列分布形态如图6.2(e)或(f),应该考虑假性异方差,也就是参数变化或函数设定偏差的可能性等。
图6.2 异方差的发现和识别 (c) (d)
图6.2 异方差的发现和识别 (e) (f)
2. 戈德菲尔德-夸特检验 • 这种方法适合检验样本容量较大的线性回归模型的递增或递减型异方差性。 • 我们以递增异方差为例说明戈-夸检验的思路和方法。 • 模型存在递增异方差时会在回归残差序列的分布中反映出来,表现为其发散程度随某个解释变量的增大而不断增大。 • 如果将样本按 Xi排序,那么对应较小Xi的回归残差,平均将明显小于对应较大的Xi的回归残差。
检验步骤: • ①把观测样本按Xi排序。 • ②去掉中间占样本总数大约1/4到1/3的部分样本,同时注意使剩余样本数为偶数。 • ③对两个子样本分别进行回归,并计算这两组样本各自的回归残差平方和。
④用上述两个残差平方和可以构造F统计量 • 其中 表示对应较小 样本的残差平方和。 • 则表示对应较大 样本的残差平方和,c是去掉的中间部分样本数目。 • 这个F 统计量服从两自由度为 的F分布。
⑤如果1≤ F ≤ Fλ,则认为误差项没有明显的异方差性;F >Fλ,则表明存在递增异方差,F越大,则表明异方差越严重。 • ⑥检验递减异方差性的方法是相似的。只要把前面构造的F统计量的分子分母互换,就完全可以用同样的程序检验模型是否存在递减型异方差问题。 • 注:对于复杂形态的异方差性,戈-夸检验无法应用。
3. 戈里瑟检验 • 戈-夸检验有一个缺点,就是无法确定异方差的具体模式,即方差是如何随解释变量或样本序数而变化的。 • 由于异方差的具体模式对于克服异方差有重要作用,因此戈-夸检验这方面的弱点对它的价值有很大影响。 • “戈里瑟(Gleiser)检验”或与它相似的其他检验方法,在识别、确定异方差类型方面比戈-夸检验更有效,但在判断异方差的存在性方面也许略微不如戈-夸检验。
戈里瑟检验的思路是:模型误差项的异方差性会在回归残差序列的分布中反映出来,通常表现为随解释变量(或某个解释变量)变化的某种规律性。 • 因为方差与误差项的符号无关,因此考察 的分布情况。那么在存在明显异方差性时, 会有明显的随解释变量变化的趋势。
可以通过回归方法拟合 与 之间的关系。如果经过检验确定两者之间确实存在显著的函数关系,那么表明异方差确实存在。 • 通常拟合的回归模型是 ,其中l 根据图6.3中的分布形态,可以在 中选择。
当 时,先作一个简单变换,然后用最小二乘法估计 和 的估计值,对 的显著性检验等价于对模型误差项是否存在异方差性的检验。 • 如果 确实存在显著性,说明模型确实存在异方差性。 • 异方差的具体模式也可以根据上述回归方程判断。
与戈里瑟检验相似的另一种检验方法,是根据对残差序列和残差平方序列的直观分析,采用适当的 函数形式,对模型 • 进行回归拟合 与 的关系,并通过检验它们之间是否存在显著关系判断原模型误差项是否有异方差问题。 • 的函数形式反映原模型异方差的模式。
4. 怀特异方差检验 设:yi=b0+b1x1i+b2x2i+εi White检验的具体步骤为: (1)估计回归模型,并计算e2i; (2)估计辅助回归模型(含交叉项); (3)计算辅助回归模型的R2;
(4)可以证明,在同方差的假设下,nR2~χ2(q)(4)可以证明,在同方差的假设下,nR2~χ2(q) q为辅助回归模型中的自变量个数(此时q=5)。 (5)给定显著性水平α,若nR2>χ2α(q),存在异方差性;反之,不存在。 操作演示
第四节 异方差的处理 • 处理异方差,首先可以利用增长率具有消除随着数据数值增大而波动幅度增大问题的作用,通过改用增长模型来消除或避免异方差问题。 • 但这些方法比较盲目,效果如何需要事后的检验评价判断。 • 处理异方差更主要的方法,是根据异方差的具体形式,通过对模型的相应变换等,针对性地克服异方差问题。
如线性回归模型 经检验,知误差项有如下形式的异方差性: 可以用 除模型的各项,得到
新模型误差项的方差为: • 显然已经不存在异方差问题。用这个新模型进行线性回归分析,可以克服原模型的异方差问题,同样可以得到原模型所有参数的估计。
考察上述新模型最小二乘估计的回归残差平方和:考察上述新模型最小二乘估计的回归残差平方和: • 可以发现该残差平方和相当于原模型最小二乘估计残差平方和,每一项都乘一个权重的加权平方和,其中权重即
因此通过上述模型变换得到的参数估计量也称为“加权最小二乘估计”。 • 加权最小二乘估计正是克服线性回归模型异方差性的针对性方法,这种方法的实质可以理解为对方差较小部分的样本数据的信息更加重视。
加权最小二乘法(WLS) ωi是权数 ωi有两个作用:一是权重,二是为了消除异方差。 由于在极小化过程中对通常意义的残差平方加上了权数ωi,所以称为加权最小二乘法(Weighted Least Square—WLS。注意权数的变化趋势应与异方差的变化趋势相反。)
加权最小二乘法回归残差图 操作演示