第三章两变量线性回归

第三章两变量线性回归

本章主要内容 • 第一节两变量线性回归模型 • 第二节参数估计 • 第三节最小二乘估计量的性质 • 第四节回归拟合度评价和决定系数 • 第五节统计推断 • 第六节预测

第一节两变量线性回归模型 • 为什么学习两变量线性回归模型 • 1.模型建立 • 2.模型假设

1.模型建立 • 建立两变量线性回归模型必须有理论和现实根据 • 一个例子：凯恩斯绝对收入假设消费理论：消费（Y）是由收入（X ）唯一决定的，是收入的线性函数： Y =  +  X 要利用经验和数据分布情况来判断变量间的关系是否是线性关系。

例3-1 上海市人均居民收入和人均消费支出数据（1981-2002）

上海市人均居民收入和人均消费支出数据的散点图（Eviews软件应用演示）上海市人均居民收入和人均消费支出数据的散点图（Eviews软件应用演示）

非线性函数的处理 ⑴变量置换例如，描述税收与税率关系的拉弗曲线：抛物线 s = a + b r + c r2 c<0 s：税收； r：税率设X1 = r，X2 = r2，则原方程变换为 s = a + b X1 + c X2 c<0 变量置换仅用于变量非线性的情况。

非线性函数的处理(续) ⑵函数变换例如，Cobb-Dauglas生产函数：幂函数 Q = AKL Q：产出量，K：投入的资本；L：投入的劳动方程两边取对数： Ln Q = Ln A +  Ln K +  Ln L

非线性函数的处理(续) (3)级数展开例如，不变替代弹性CES生产函数：方程两边取对数后，得到：对在ρ=0处展开泰勒级数，取关于ρ的线性项，即得到一个线性近似式。

非线性函数的处理(续) (3)级数展开(续）变量置换得到

结论 • 实际经济活动中的许多问题，都可以最终化为线性问题，所以，线性回归模型有其普遍意义。 • 即使对于无法采取任何变换方法使之变成线性的非线性模型，目前使用得较多的参数估计方法——非线性最小二乘法，其原理仍然是以线性估计方法为基础。 • 线性模型理论是计量经济学的基础。

变量关系的随机性 (1)在经济问题中精确的因果关系实际上不存在。人类经济行为本身的随机性；两变量线性关系通常只是抓了主要矛盾，而忽略的其他众多因素的影响。 (2)正确的计量经济模型应该是随机模型： Y =  +  X + ；   为随机扰动项。其中，线性函数 Y =  +  X也称为“趋势部分”，是研究的主要目标和对象，随机误差项  代表影响Y的各种较小因素的综合。 (3)线性回归分析的对象是随机线性函数关系这点很重要。因为变量关系不是严格的函数关系，因此这种关系生成的数据多数不会落在同一条直线上。

变量关系随机性的原因 • 客观现象本身的随机性。 • 模型本身的局限性。 • 模型函数形式的设定误差。 • 数据的测量与归并误差。 • 随机因素的影响（如自然灾害等）

2.模型假设 (1)变量间存在随机函数关系Y= + X +，对两变量的所有观察数据组(xi yi)(i=1,2…,n)都成立，其中是随机误差项； (2)对应每组变量观测值数据的误差项i，都为零均值的随机变量，即i数学期望E(i)=0, 对i=1,…n都成立； (3)误差项i方差为常数，即Var(i)=E(i-E(i))2=E(i2) =σ2； (4)误差序列不相关，Cov(i, j)=0 i≠j ,j=1,2, …,n； (5)X是确定性的，非随机变量； (6)误差项 i 服从正态分布。

对假设的深入讨论 1.前五条假设是古典线性回归模型的基本假定； 2.假设（2）的含义是 3.假设（3）的意义是对应不同观测数据组误差项分布的发散趋势相同，或有相同形状的概率密度函数

假设（2）:误差项均值为零的情形 Y f(Y) E(Yi|Xi) = α + bXi . X1 X

违反假设（2）的情形 Y f(Y) . E(Yi|Xi) = α + bXi X1 X

假设（3）:同方差情形 Y f(Y) . E(Yi|Xi) = α + bXi . X1 X2 X

违反假设（3）的情形 Y f(Y) . E(Yi|Xi) = α + bXi . X1 X2 X

对假设的深入讨论(续) 4.假设（4）的意义是对应不同观测值的误差项之间没有相关性； 5.假设（5）和（6）都是为了回归分析和统计推断的方便而要求的的假设。

重要提示 • 几乎没有哪个实际问题能够同时满足所有基本假设； • 通过模型理论方法的发展，可以克服违背基本假设带来的问题； • 对违背基本假设问题的处理构成了单方程线性计量经济学理论方法的主要内容：异方差问题（违背同方差假设）序列相关问题（违背序列不相关假设）共线性问题（违背解释变量不相关假设）随机解释变量（违背解释变量确定性假设） • 0均值、正态性假设是由模型的数理统计理论决定。

第二节参数估计 • 1.最小二乘估计 • 2.消费函数参数估计

1.最小二乘估计(OLS) 给定一组样本观测值Xi, Yi（i=1,2,…n），要求样本回归函数尽可能好地拟合这组值，即样本回归线上的点与真实观测点的“总体误差”尽可能地小。

1.最小二乘估计(OLS)(续)

利用残差记号ei可以把正规方程组写为： 1.最小二乘估计(OLS)(续) 正规方程组

参数α和β的最小二乘估计量a和b 由正规方程组得到：解得：

一个重要的推论 由残差记号ei表示的正规方程组可知：

2.消费函数参数估计 • 两变量的线性回归模型为： Y =  +  X + ； • 例3-1操作演示 • (1) 根据最小二乘估计量公式手动计算和的估计值(Excel软件操作演示) • (2) Eviews软件操作演示

第三节最小二乘估计量的性质 • 1.最小二乘估计的线性性 • 2.最小二乘估计的无偏性 • 3.最小二乘估计的最小方差性 • 4.最小二乘估计的一致性

高斯—马尔可夫定理 • (Gauss-Markov theorem) 在满足古典线性回归模型的基本假定(前五条假设)条件下，最小二乘估计量是具有最小方差的线性无偏估计量。

1.最小二乘估计的线性性 • 参数估计量a和b可以表示为被解释变量观测值Yi的线性组合。 • 意义：参数估计量与被解释变量服从相同名称的分布，与误差项服从相同的分布。

1.最小二乘估计的线性性(续)

2.最小二乘估计的无偏性

2.最小二乘估计的无偏性(续)

3.最小二乘估计的最小方差性

3.最小二乘估计的最小方差性(续)

小结最小二乘估计量具有线性性、无偏性、最小方差性优良性质。具有这些优良性质的估计量又称为最佳线性无偏估计量，即BLUE估计量（the Best Linear Unbiased Estimators）。显然这些优良的性质依赖于对模型的基本假设。

4.最小二乘估计的一致性

4.最小二乘估计的一致性(续)

第四节回归拟合度评价和决定系数 • 1.拟合度评价的意义 • 2.决定系数(拟合优度)

1.拟合度评价的意义 • 模型假设成立时，最小二乘估计是两变量线性回归参数比较理想的估计。 • 但在模型假设成立前提下的最小二乘估计的性质并不能保证以最小二乘估计为核心的回归分析的可靠性和价值。 • 评价回归分析、参数估计优劣的根本标准，是回归直线对样本数据的吻合程度，也称为“拟合度” 。 • 拟合度是检验模型变量关系真实性，判断模型假设是否成立的重要方法。

2.决定系数(拟合优度) • (1)离差分解

证明：SST = SSE + SSR

2.决定系数(拟合优度)(续) • (2)决定系数(拟合优度)R2的定义 • Excel软件操作演示与Eviews软件操作演示

第五节统计推断 • 1.最小二乘估计量a,b的分布 • 2.误差项方差的估计 • 3.置信区间估计 • 4.假设检验

1.最小二乘估计量a,b的分布

第三章两变量线性回归