440 likes | 604 Views
高等学校经济学类核心课程. 计 量 经 济 学. Econometrics. 云南财经大学数量经济系. 第四章 放宽基本假定的模型. § 4.1 异方差性 § 4.2 序列相关性 § 4.3 多重共线性 § 4.4 随机解释变量. 本章说明. 1 、违背基本假定的情形: 随机误差项 μ i 的方差不一致 —— 异方差性 ; 随机误差项 μ i 之间存在相关 —— 序列相关性 ; 解释变量 X 之间存在相关 —— 多重共线性 ; 解释变量 X 是随机变量 —— 随机解释变量问题 ; 模型形式设定错误 —— 设定偏误问题
E N D
高等学校经济学类核心课程 计 量 经 济 学 Econometrics 云南财经大学数量经济系
第四章 放宽基本假定的模型 § 4.1 异方差性 § 4.2 序列相关性 § 4.3 多重共线性 § 4.4 随机解释变量
本章说明 • 1、违背基本假定的情形: • 随机误差项 μi的方差不一致——异方差性; • 随机误差项 μi之间存在相关——序列相关性; • 解释变量 X之间存在相关——多重共线性; • 解释变量 X是随机变量——随机解释变量问题; • 模型形式设定错误——设定偏误问题 • 解释变量的方差不随样本容量的增加而收敛——伪回归问题 • 2、对于每一种情形: • 表现形式是什么? • 产生的原因何在? • 造成的后果如何? • 如何检验其存在? • 如何解决和处理?
§4.1 异方差性 一、异方差的概念与类型 二、实际经济问题中的异方差性 三、异方差性的后果 四、异方差性的检验 五、异方差性的修正 六、案例
一、异方差性的概念 • 对于模型: 如果出现 即:对于不同的样本点,随机误差项的方差不再是同一个常数,而互不相同,则认为出现了异方差性(Heteroskedasticity)。 注意:此处讨论异方差性时,并未改变其它基本假设,此时随机误差项仍然满足:E(µi)=0,cov((µi,µj)=0。
# 异方差下随机误差项的方差-协方差阵 在其他假设不变的情况下,异方差意味着: 此时,随机误差项之间的方差-协方差阵为:
#异方差的类型 1、同方差假定: var(μi)=2(常数) f(Xi) 即:每个样本点上的 μi围绕其均值0的分布与解释变量X无关 2、异方差时:var(μi)=i2 = f(Xi) 即:每个样本点上的 μi 的方差随X的变化而变化 3、异方差一般可归结为三种类型: (1)单调递增型: i2随X的增大而增大 (2)单调递减型: i2随X的增大而减小 (3)复 杂 型: i2与X的变化呈复杂形式
二、实际经济问题中的异方差性 【例4.1.1】:居民家庭储蓄行为(截面资料) Yi=0+1Xi+i Yi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入 • 分析: • 高收入家庭:储蓄的差异较大 • 低收入家庭:储蓄则更有规律性,差异较小 • i的方差随收入的增加而增加,呈现单调递增型变化
【例4.1.2】:居民消费函数(截面资料) 以绝对收入假设为理论假设: Ci=0+1Yi+I 将居民按照收入等距离分成n组,取组平均数为样本观测值。 • 分析: • 一般情况下,居民收入服从正态分布:中等收入组人数多,两端收入组人数少。而人数多的组平均数的误差小,人数少的组平均数的误差大。 • 所以样本观测值的观测误差随着解释变量观测值的不同而不同,往往引起异方差性。 • i的方差随Y的增加而呈U型变化,属于复杂型
【例4.1.3】:企业生产函数模型(截面资料) Yi= β0 Ai1 Ki2Li3 eI 被解释变量:产出量Y 解释变量:资本K、劳动L、技术A 分析: • 每个企业所处的外部环境对产出量的影响被包含在随机误差项中。 • 每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。 • 这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。
#经验总结 一般而言: 对于采用截面数据作样本的计量经济学问题,由于在不同样本点上解释变量以外的其他因素的差异较大,所以往往存在异方差性
三、异方差性的后果 计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果: 1、参数估计量仍然无偏,但非有效 因为在有效性证明中利用:E(’)=2I 而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。 这意味着,在异方差情形下,如果仍采用OLS估计,则可能低估或高估参数估计量的方差。
2、变量的显著性检验失去意义 变量的显著性检验中,构造了t统计量 其他检验也是如此。
3、模型的预测失效 一方面,由于上述后果,使得模型不具有良好的统计性质; 另一方面,在预测值的置信区间中也包含有误差方差的估计量: 所以: 当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
四、异方差性的检验 • 检验思路: • 由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差 • 检验异方差性,也就是检验随机误差项的方差Var(μi)与解释变量X观测值之间的相关性 问题:用什么来表示随机误差项的方差?
(一)图示检验法 • 常用的三种图形: ——看散点图是否具有水平直线趋势
——看散点图是否存在明显的扩大、缩小或复杂趋势——看散点图是否存在明显的扩大、缩小或复杂趋势
以 或 为被解释变量,以原模型的某一个解释变量 为 解释变量,尝试建立方程: (二)帕克检验与戈里瑟检验 由帕克(Park)和戈里瑟(Gleiser)在1969年提出。采用辅助回归方法进行判断 • 基本思想: 或 选择关于变量X的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。
帕克提出如下假定函数形式: 戈里瑟提出如下假定函数形式: 如果上述方程能够显著成立,或者某一回归系数能够显著不为0,则认为存在异方差性
(三)戈德菲尔德-匡特检验(GQ检验) G-Q检验由戈德菲尔德(Goldfeld)和匡特(Quandt)在1965年提出 G-Q检验以F检验为基础,适用于样本容量较大(一般在参数个数的两倍以上)、异方差递增或递减的情况。 • 基本思想 • 如果随机误差项的方差与某一解释变量X相关且呈现递增变化,则在X值较大的样本点上进行回归,其回归残差平方和∑ei2应该比在X值较小的样本点上施行同样的回归所得到的残差平方和要大,反之前者的残差平方和应该较后者要小。 • 在按某一解释变量对样本排序,再将排序后的样本一分为二,对子样①和子样②分别作OLS回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。
G-Q检验的步骤 1、排序——将n组样本观察值(Xi,Yi)按观察值Xi的大小排序(X为某一 被认为有可能引起异方差的解释变量) 2、划分——将序列中间的c=n/4个观察值除去(也可以不去除,视样本资料的丰富程度而定),并将剩下的观察值划分为前、后两个容量相同的子样本,每个子样本容量均为(n-c)/2 3、回归——对每个子样本分别进行OLS回归,并计算各自的残差平方和, 分别用 和 表示较小的残差平方和和 较大的残差平方和,其自由度均为:
G-Q检验的步骤 4、构造统计量——在同方差性假定下(H0:ui同方差),构造如下满足F分布的统计量(注意:RSS大/RSS小) 5、检验结论——给定显著性水平,确定临界值:F(v1,v2),若F>F(v1,v2)则拒绝同方差性假设,表明存在异方差。 (右侧检验) 注:可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差。
(四)怀特检验(White) 由怀特(White)在1980年提出,通过辅助回归模型判断,怀特检验不需要排序,适合任何形式的异方差 1、怀特检验的基本思想与步骤(以二元为例): (1)对二元回归模型: 作OLS回归,得到 (2)然后做如下辅助回归 得到拟合优度:R2
(3)可以证明,在同方差假设(H0:模型同方差)下:(3)可以证明,在同方差假设(H0:模型同方差)下: R2为辅助回归的可决系数 h为辅助回归解释变量的个数(不含常数项),该例h=5) (4)由此,可在大样本下,对统计量进行相应的卡方检验(右侧检验),如果超出临界值,则表明辅助回归的拟合优度较高,拒绝同方差假设,即存在异方差性
# 怀特检验的说明 • 1、辅助回归中的次数问题 • 辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方,但通常只是使用至2次项 • 2、辅助回归中的交叉项问题 • 多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项,由此有两种检验模式: • 无交叉项的White检验(without cross terms) • 带交叉项的White检验(with cross terms)
五、异方差的修正 • 检验结果证实存在异方差性时,需要针对不同的情况进行修正: • (1)如果异方差性是由于模型遗漏了重要的解释变量,或者模型的 • 函数形式设立错误引起 • ——增补变量或改变模型设定形式 • (2)如果异方差性仅仅是由样本观测值引起的 • ——变换变量的形式或者采用合适的估计方法 • 常用的估计方法:加权最小二乘法(Weighted Least Square, • WLS)
(一)模型的对数变换 • 如果模型: 存在异方差 则对Y和X进行对数变换,拟合以下模型: 这通常可以降低异方差性的影响 • 原因在于: • 对数变换能使测定变量值的尺度缩小,将两个数值之间的10倍差异缩小到大约只有2倍的差异 • 变换后的模型,其残差表示相对误差,而相对误差往往具有较小的差异 • 实际上这一变换相当于改变了模型的设定形式 • 上述模型称为双对数模型,类似地可以建立单对数模型
(二)加权最小二乘法 1、对原模型进行加权,使之变成一个新的不存在异方差性的模型,然后再采用OLS估计参数 • 2、基本思想: • 误差方差较小的点,偏离总体回归线的程度小,代表性强 • 误差方差较大的点,偏离总体回归线的程度大,代表性弱 • 对误差方差较小的点(代表性较强的点)赋予较大的权数,对误差方差较小的点(代表性较弱的点)赋予较小的权数,以反映代表性不同的样本点在拟合过程中的重要性 • 3、实质:最小化加权后的残差平方和:
1. 已知异方差形式时,ωi的选择——模型变换法 对于多元线性回归模型: • 如果已知模型存在异方差性,且有: 即:误差方差与某个解释变量Xj呈现确定的函数关系:f(Xj) • 则取: 即用ωi去乘原模型,得到:
则原模型变为: (无常数项的回归) 则新的模型具有同方差性,可以采用OLS估计。事实上:
# 模型变换法的说明 • 模型变换法中的 f(X) 可以利用帕克检验或者戈里瑟检验予以寻找。 • 一般 f(X) 可以取如下形式: • 注意变换后的模型参数与原模型参数的对应关系
2、未知异方差形式时,ωi的选择——直接加权法2、未知异方差形式时,ωi的选择——直接加权法 对于多元线性回归模型: • 如果仅知模型存在异方差性,即有: 即用ωi去乘原模型,得到: • 则直接取: (无常数项的回归) 则有: 即:新模型具有同方差性(且误差方差均为1),可以采用OLS估计
# 直接加权法的说明 • 实际中,可以采用|ei|作为бi的估计,即权数可以取为: • 采用直接加权法后,所得模型的异方差性消除地较为彻底,所得模型的拟合优度往往大为提高,但这种将误差方差强制性归1的方法仍值得商榷。
# 加权最小二乘法的一般过程(矩阵表示) 对于模型: Y=X+(X为设计矩阵,Y、β、μ为列向量) 如果存在异方差性,则 随机误差项的方差-协 方差阵可以表示为: 易知:W是一对称正定矩阵,存在一可逆矩阵D使得: W=DD’ 用D-1左乘 Y=X+两边,得到一个新的模型: 记为:
该新模型具有同方差性。因为 这就是原模型 Y=X+的加权最小二乘估计量(WLSE),是无偏、有效的估计量。 上述过程中的D-1称为加权矩阵,它来自于原模型残差项的方差-协方差矩阵б2W。
# 如何得到加权矩阵D-1? 1、对原模型进行OLS估计,得到随机误差项的近似估计量 ,以此构成随机误差项的方差-协方差阵的估计量,即 2、这时D-1取为:
六、案例(中国农村居民人均消费函数) 【例4.1.4】:中国农村居民人均消费支出主要由人均纯收入来决定。 农村人均纯收入包括(1)从事农业经营的收入,(2)包括从事其他产业的经营性收入(3)工资性收入、(4)财产收入(4)转移支付收入。 考察从事农业经营的收入(X1)和其他收入(X2)对中国农村居民消费支出(Y)增长的影响:
1、普通最小二乘法的估计结果: 2、异方差检验 (1)图示检验
(2) G-Q检验 1)将原始数据按X2排成升序; 2)去掉中间的7个数据,得两个容量为12的子样本 3)对两个子样本分别作OLS回归,求各自的残差平方和RSS1和 RSS2: 子样本1: (3.18) (4.13) (0.94) R2=0.7068, RSS1=0.0648 子样本2: (0.43) (0.73) (6.53) R2=0.8339, RSS2=0.2729
4)计算F统计量: F= RSS2/RSS1=0.2792/0.0648=4.31 5)给定=5%,查得临界值 F0.05(9,9)=2.97 6)判断:F> F0.05(9,9) 否定两组子样方差相同的假设, 该总体随机项存在递增异方差性。 • # Eviews程序: • Sort lnx2 #按lnX2排序 • Smpl 1 12 #选定第1组样本(1-12号样本点) • Ls lny c lnx1 lnx2 #进行回归,记录RSS1 • Smpl 20 31 #选定第2组样本(20-31号样本点) • Ls lny c lnx1 lnx2 #进行回归,记录RSS2
(3) White检验 1)作辅助回归: (-0.04) (0.10) (0.21) (-0.12) (1.47) (-1.11) R2 =0.4638 2)似乎没有哪个参数的t检验是显著的 。但 n R2 =31*0.4638=14.38 3)=5%下,临界值 20.05(5)=11.07,拒绝同方差性 即:原模型存在异方差性 • # Eviews程序: • Ls lny c lnx1 lnx2 #进行回归,出现方程窗口 • 在方程窗口依次选择:Views → Residual Test → White Hetro…
3、模型修正——WLS(直接加权法) (1)对原模型进行OLS估计, # Ls lnY c lnX1 lnX2 得到回归残差ěi # resid (2)取ωi=1/|ei|, # Genr a=1/abs(resid) (3)进行加权最小二乘 #Ls(w=a) lnY c lnX1 lnX2