多元回归分析：推断

多元回归分析：推断 y = b0 + b1x1 + b2x2 + . . . bkxk + u 计量经济学导论刘愿

关于假设检验 • 考虑一个选举问题：假定在一次选举中有两个候选人A和B。据报道，候选人A已得到42%的选票，候选人B得到58%的选票。姑且把这个百分比看成选民总体的真正百分比。候选人A深信更多的民众会投他的票，因此想调查选举是否有作弊情况，并雇用一个咨询机构随机抽取100名选举人的样本，所收集的样本中有53人投了候选人A的票。这一样本估计值53%明显超过所报告的总体值42%，候选人A应否据此作出结论说选举存在作弊？计量经济学导论刘愿

设立一个假设检验（hypothesis test），令Θ代表赞成候选人A的总体真实比例，令所报告的结果为真实的假设，陈述为： H0:Θ=0.42 虚拟假设（null hypothesis） H1: Θ>0.42 对立假设（alternative hypothesis) 在上例中，100个随机样本中究竟有多少人投候选人A的票才能够足以使A能否作出H0错误而H1正确的结论？（合理的勿容置疑的证据）计量经济学导论刘愿

假设检验中会犯的两种错误： 第Ⅰ类错误：拒绝一个其实是真实的虚拟假设第Ⅱ类错误：未拒绝一个实际上是错误的虚拟假设检验的显著性水平：犯第Ⅰ类错误的概率其含义为：当H0为真实时拒绝H0的概率计量经济学导论刘愿

经典的假设检验要求设定a值，从而量化我们对第Ⅰ类错误的容忍度。通常a值有0.10，0.05，0.01。经典的假设检验要求设定a值，从而量化我们对第Ⅰ类错误的容忍度。通常a值有0.10，0.05，0.01。 • 一旦选定显著水平，检验的目标是把第Ⅱ类错误的概率减到最小。即对所有有意义的对立情况使一个检验的功效最大。一个检验的功效是1减去第Ⅱ类错误的概率。数学上表示为：计量经济学导论刘愿

检验关于正态总体均值的假设 • 为了相对于一个对立假设而检验一个虚拟假设，需要挑选一个检验统计量和一个临界值。 • 给定一个统计量，即可定义一个拒绝规则来决定什么时候舍弃H0而选取H1.所有拒绝规则都是拿一个检验统计量的值t来同一个临界值c做比较作为依据的。 • 拒绝域：所有导致拒绝虚拟假设的t值的全体。计量经济学导论刘愿

检验来自一个 总体的关于均值的假设。虚拟假设单侧对立假设双侧对立假设计量经济学导论刘愿

当样本均值 “足够”地大于 时，我们便应拒绝H0而接受H1。如何确定已大到足以在选定的显著水平上拒绝H0？ • 检验统计量t：在虚拟假设下，随机变量t有一个tn-1分布。 • 临界值c：5%的显著水平计量经济学导论刘愿

拒绝规则： t>c （c为tn-1分布中的第100(1-a)百分位数）计量经济学导论刘愿

双尾检验（two tailed test) • 拒绝规则： | t |>c 给出100a%显著水平的检验（c为tn-1分布中的第100(1-a/2)百分位数）计量经济学导论刘愿

经典线性模型假定 • 给定高斯-马尔科夫假定，OLS是最优线性无偏估计。 • 为了做经典的假设检验，我们需要添加额外一个假定，即MLR.6:u独立于x1, x2,…, xk，且u服从标准正态分布，即u ~ Normal(0,s2) • MLR.1-MLR.6: 经典线性模型假设（CLM）计量经济学导论刘愿

经典线性回归假设（续） • 在经典线性回归假设下，OLS 不仅是最优线性无偏的，而且是方差最小的无偏估计。 • 经典线性回归总体假设： y|x ~ Normal(b0 + b1x1 +…+ bkxk, s2) • 虽然我们假设u服从正态分布，但有时候并非如此： u中的众多因素可能各有极为不同的总体分布； u是不可观测因素的一个复杂函数，而非线性可加；假定u的正态性，实际上是一个经验性问题。 • 大样本能够让u近似的满足正态性。计量经济学导论刘愿

简单回归的同方差正态分布 y f(y|x) . E(y|x) = b0 + b1x . Normal distributions x1 x2 计量经济学导论刘愿

定理4.1 正态抽样分布 计量经济学导论刘愿

定理4.1推广： 计量经济学导论刘愿

4.2 t检验 计量经济学导论刘愿

t检验（续） • 标准化参数的样本分布使得我们可以进行假设检验。 • 从虚拟假设开始，如H0: bj=0；如果接受虚拟假设，则意味着在控制其他因素不变的情况下，xj对y没有效应。计量经济学导论刘愿

t检验（续） 计量经济学导论刘愿

t检验：单侧备选假设 • 除了虚拟假设H0之外，我们还需要一个备选假设H1和一个显著性水平或当H0为真时拒绝它的概率。 • H1可以是单侧的，也可以是双侧的。 H1: bj > 0 及H1: bj < 0 都是单侧备选假设； H1: bj 0 是双侧备选假设。 • 如果我们想在5%的概率下拒绝一个为真的虚拟假设H0,那么我们的显著性水平为5%。计量经济学导论刘愿

单侧备选假设（续） • 选定一个显著性水平a,在一个自由度为n-k-1的t分布中将得到(1 –a)th百分数，称之为临界值c。 • 我们可以拒绝虚拟假设，如果t统计量大于临界值C. • 如果t小于临界值C，则无法拒绝虚拟假设。计量经济学导论刘愿

单侧备选假设（续） yi = b0 + b1xi1 + … + bkxik + ui H0: bj = 0 H1: bj > 0 无法拒绝拒绝 (1 - a) a c 0 计量经济学导论刘愿

单侧还是双侧假设 • t分布是对称的，检验H1: bj < 0 是非常直观的，临界值变成负数。 • 我们可以拒绝虚拟假设，如果t < –c,如果t > –c,则我们无法拒绝虚拟假设。 • 当bj的符号在理论中是不明确的话，双侧对立假设就是有用的。 • 对双侧检验来说，我们是根据a/2来确定临界值，如果t的绝对值大于C，则拒绝H1: bj 0 。计量经济学导论刘愿

双侧对立假设 yi = b0 + b1Xi1 + … + bkXik + ui H0: bj = 0 H1: bj≠0 无法拒绝拒绝拒绝 (1 - a) a/2 a/2 -c c 0 计量经济学导论刘愿

总结：H0: bj = 0 • 除非特别说明，对立假设均假定为双侧的。 • 如果我们拒绝虚拟假设，通常我们会说：“在a %的水平上，xj在统计上显著异于零。” • 如果我们无法拒绝虚拟假设，通常我们说“在a % 的水平上，xj在统计上不显著。” 计量经济学导论刘愿

例子4.2：学生成绩及学校规模 计量经济学导论刘愿

例子4.3 大学城GPA的决定因素 计量经济学导论刘愿

检验其他假设 • T检验的更一般形式是：H0: bj = aj • 在这种情况下，t统计量的表述是计量经济学导论刘愿

H0：b1=1; H1：b1>1 • 例子：校园犯罪与注册人数由4.14可见，犯罪对注册人数的估计弹性1.27在对立假设b1>1的方向上。但是否有足够的证据断定b1>1呢？计量经济学导论刘愿

计算t检验的p值 • 事前指定一个显著性水平的不足之处：不存在一个“正确的”的显著性水平；可能隐藏假设检验结果方面的有用信息 t=1.85， c（40，5%）=2.021， c（40，10%）=1.684， • 检验p值：给定t统计量的观测值，能拒绝虚拟假设的最小显著性水平是多少？计量经济学导论刘愿

1.t表示一个自由度为n-k-1的t分布随机变量；t表示该检验统计量的数值。1.t表示一个自由度为n-k-1的t分布随机变量；t表示该检验统计量的数值。 2.p值的解释：观察到一个t统计量至少和虚拟假设正确时的t统计量一样大的概率：（以t为临界值时的显著性水平）小p值是拒绝虚拟假设的证据；大p值不能提供拒绝虚拟假设的证据。计量经济学导论刘愿

计量经济学导论刘愿

一般情况的拒绝规则 • a表示检验的显著性水平； p值<a，则拒绝虚拟假设；否则，在100a%的显著性水平下，就不能拒绝H0。 • 单侧对立假设检验p值： 1.考虑参数估计值方向与对立假设的关系； 2.将双侧对立假设的p值除以2即得到单侧对立假设的p值。计量经济学导论刘愿

统计检验值得注意的问题 • 当H0未被拒绝时，应该如何表述：我们通常说“在a%的水平上我们不能拒绝H0” 而不能说“在a%的水平上我们接受了H0。” 计量经济学导论刘愿

经济或实际显著性与统计显著性 统计显著性：t值经济显著性： 1.统计显著并不意味着实际作用显著 2.实际作用显著并不意味着统计显著 3.大样本选择较小的显著性水平，反之亦然。计量经济学导论刘愿

例子4.6: 401（K）养老金计划的参与率 计量经济学导论刘愿

例子4.7 在职培训津贴对企业废品率的影响 计量经济学导论刘愿

总结 • 检查统计显著性：如果该变量是统计显著的，讨论系数的大小，以对其实际或经济上的重要性有所认识。 • 如果一个变量在通常的显著性水平上不是统计显著的，仍需考察该变量对y是否有预期的影响及其实际的经济重要性，如果重要则计算p值。 • 一个显著的变量却拥有非预期的符号，并且在经济上具有重要性，则问题更加麻烦。计量经济学导论刘愿

置信区间 • 使用经典统计检验的另一个方法是用在双侧检验中同样的临界值构建一个置信区间Another way to use classical statistical testing is 。 • 一个对未知参数(1 - a) % 的置信区间定义如下：计量经济学导论刘愿

置信区间的上界和下界是： 置信区间的含义：如果一次又一次地获得随机样本，每次计算出上界和下界，那么未知的总体参数将在95%的置信区间中出现。计量经济学导论刘愿

如何构建一个置信区间 • 需要三个量： • 对于95%显著性水平的置信区间，一个简单的拇指法则是： • 双侧对立假设的置信区间检验规则：aj是否落入95%水平的置信区间，落入则无法拒绝，未落入则拒绝。计量经济学导论刘愿

Example 4.8 Hedonic Price Model for Houses 计量经济学导论刘愿

检验关于参数的一个线性组合 • 假设现在不是检验b1等于一个常数，而是是否等于另一个参数，即H0 : b1 = b2, and H1 : b1<b2。计量经济学导论刘愿

使用同样的基本程序形成t统计量： 计量经济学导论刘愿

检验线性组合（续） 计量经济学导论刘愿

检验线性组合（续） • 需要s12,但标准的输出结果没有这一项。 • 很多统计软件包有选项获取这一协方差，或者直接进行检验。 • 在Stata中，执行y对x1，x2，… xk的回归，键入“test x1 = x2”可得该检验的p值。 • 更一般地，我们可以重新表述这个问题来进行检验。计量经济学导论刘愿

定义一个新的参数，新的检验是: 计量经济学导论刘愿

针对单侧对立假设4.19，p值大概是0.075，因 此有证据但不是很强的证据拒绝虚拟假设4.18。计量经济学导论刘愿

对多个线性约束的检验：F检验 • 目前我们仅涉及检验一个单一的线性约束，如b1 = 0或b1 = b2。 • 然而，我们希望对参数的多个假设进行联合检验。 • 经典例子是检验“排除性约束”：一组参数是否等于零。计量经济学导论刘愿

检验排除性约束 • 虚拟假设H0: bk-q+1 = 0, ... , bk = 0; • 对立假设是H1: H0 不正确（即至少有一个参数不为零）. • 可否单独检验每一个t统计量? 由于我们希望了解q个参数的联合显著性，单独检验t无法做到这一点。计量经济学导论刘愿

排除性约束检验（续） • 分别估计受约束模型和不受约束模型。 • 直观的，我们希望了解两个模型残差平方和的变化是否足够大以确定是否应该包括被排除掉的变量xk-q+1,, …, xk.。计量经济学导论刘愿

多元回归分析：推断

多元回归分析：推断

Presentation Transcript