920 likes | 1.02k Views
高等学校应用型特色规划教材. 统 计 学. STATISTICS. 清华大学出版社. 第八章 相关与回归分析. 【 学习目标 】 通过对本章的学习,重点掌握回归分析的估计和检验方法;掌握相关分析的种类及三种相关系数的计算方法;在此基础上能够运用相关分析和回归分析的基本方法解释实际社会经济问题。重点与难点:相关系数的计算及其检验;多元线性回归分析。. 第一节 相关与回归分析的基本概念. 第二节 相关分析. 第三节 一元线性回归分析. 第四节 多元线性回归分析. 第五节 非线性回归分析. 第八章 相关与回归分析. 第一节 相关与回归分析的基本概念.
E N D
高等学校应用型特色规划教材 统 计 学 STATISTICS 清华大学出版社
第八章 相关与回归分析 【学习目标】通过对本章的学习,重点掌握回归分析的估计和检验方法;掌握相关分析的种类及三种相关系数的计算方法;在此基础上能够运用相关分析和回归分析的基本方法解释实际社会经济问题。重点与难点:相关系数的计算及其检验;多元线性回归分析。 第一节 相关与回归分析的基本概念 第二节相关分析 第三节一元线性回归分析 第四节多元线性回归分析 第五节非线性回归分析
第八章 相关与回归分析 第一节 相关与回归分析的基本概念 一、相关关系与函数关系 (一)函数关系 函数关系是指现象之间存在着严格的依存关系,亦即当其它条件不变时,对于某一自变量或几个自变量的每一数值,都有因变量的一个的确定值与之相对应,并且这种关系可以用一个确定的数学表达式反映出来。
第八章 相关与回归分析 相关关系 因果关系 第一节 相关与回归分析的基本概念 一、相关关系与函数关系 (二)统计关系 统计关系不同于函数关系,当重复观测时,观测点不是完全落在统计关系曲线上,而是围绕统计关系曲线散布。统计关系可以表示为确定部分和随机性部分二者之和,这是回归分析的基础。
相关关系与因果关系 案例分析 一家研究机构有一项惊人的发现:统计数据显示,脚长的儿童拼写能力比脚短的儿童强。 原来他们调查的是一群年龄不同的儿童,脚长的儿童比脚短的儿童年龄大! 赶快回去量一下儿子的脚长 我要把脚拉长一点!
第八章 相关与回归分析 直线相关 单相关 曲线相关 复相关 正相关 偏相关 负相关 二、相关分析的种类 ⒈按涉及变量的多少分为 相关关系的种类 ⒉按照表现形式不同分为 ⒊按照变化方向不同分为
第八章 相关与回归分析 完全相关 不完全相关 不相关 单向因果相关 双向因果相关 虚假相关 相关关系的种类 4. 按相关的程度分为 5.按变量之间因果 关系的方向分为
第八章 相关与回归分析 第一节 相关与回归分析的基本概念 三、相关分析与回归分析 回归分析是关于研究一个叫做因变量的变量对另一个或多个叫做解释变量的依赖关系。 相关分析是测度两个变量之间的线性关联度的,并用一些指数(相关系数)表示相关程度。
第八章 相关与回归分析 第一节 相关与回归分析的基本概念 三、相关分析与回归分析 区别: • 相关分析中x与y对等,回归分析中x与y要确定自变量和因变量; • 相关分析中x、y均为随机变量,回归分析中只有y为随机变量; • 相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。
第八章 相关与回归分析 第一节 相关与回归分析的基本概念 三、相关分析与回归分析 联系: • 相关分析是回归分析的基础和前提。 • 回归分析是相关分析的深入和继续。
第八章 相关与回归分析 第一节 相关与回归分析的基本概念 四、相关表与相关图 (一) 简单相关表 将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便得到简单的相关表。
第八章 相关与回归分析 第一节 相关与回归分析的基本概念 八个同类工业企业的月产量与生产费用
第八章 相关与回归分析 第一节 相关与回归分析的基本概念 四、相关表与相关图 (二) 分组相关表 • 单变量分组表 • 双变量分组表 • 三变量分组表。
第八章 相关与回归分析 第一节 相关与回归分析的基本概念 1. 单变量分组表 表 某纺织厂工人看管织机台数和时劳动生产率相关表
第八章 相关与回归分析 第一节 相关与回归分析的基本概念 2. 双变量分组表 表 居住时间与对百货商场的熟悉程度的双变量分组表
第八章 相关与回归分析 第一节 相关与回归分析的基本概念 3. 三变量分组表 假定对于某项私家车购买意向的调查,最初以教育水平和私家车拥有情况进行分析,对1000人调查的结果用二维列联表表示如:
第八章 相关与回归分析 第一节 相关与回归分析的基本概念 3. 三变量分组表 表 教育程度和私家车拥有状况的双变量分析
第八章 相关与回归分析 从上表中可以看出,文化程度越高的人拥有私家车的比例越高,这和实际情况不太相符,于是我们引入收入变量,作三变量的交叉列表分析: 教育程度、收入与私家车拥有状况的三变量分析
第八章 相关与回归分析 y y y y x x x x (三)相关图 正 相 关 负 相 关 曲线相关 不 相 关
第八章 相关与回归分析 第二节 相关分析 一、简单相关系数及其检验 (一) 简单相关系数的定义 简单相关系数简称相关系数,是测量两个变量之间线性相关的方向和程度的指标。 总体相关系数的表达式为: 式中: 为变量X与变量Y的协方差 为变量X的方差 为变量Y的方差
第八章 相关与回归分析 第五节 相关分析 一、简单相关系数及其检验 (一) 简单相关系数的定义 是总体相关系数 的估计值。 样本相关系数 简单相关系数通常采用下面的计算公式:
第八章 相关与回归分析 相关系数r的取值范围:-1≤r≤1 r>0 为正相关,r < 0 为负相关; |r|=0 表示不存在线性关系; |r|=1 表示完全线性相关; 0<|r|<1表示存在不同程度线性相关: |r|<0.4 为低度线性相关; 0.4≤ |r| <0.7为显著性线性相关; 0.7≤|r| <1.0为高度显著性线性相关。
第八章 相关与回归分析 第五节 相关分析 一、简单相关系数及其检验 (二)简单相关系数的检验 • 样本相关系数的检验有两种方法: • 直接检验法, • 检验法。
第八章 相关与回归分析 ⒈提出假设: ⒉构造检验统计量: 相关系数的显著性检验(t检验法) 检验总体两变量间线性相关性是否显著 目的 步 骤
第八章 相关与回归分析 相关系数的显著性检验(t检验法) 步 骤 ⒊ 根据给定的显著性水平,确定临界值 ; ⒋ 确定原假设的拒绝规则: 若 ,则接受H0 ,表示总体两变量间线性相关性不显著; 若 ,则拒绝H0 ,表示总体两变量间线性相关性显著 ⒌ 计算检验统计量并做出决策。
第八章 相关与回归分析 【例】检验生产量与生产费用之间的线性相关性是否显著。 当 成立时,则统计量
第八章 相关与回归分析 第五节 相关分析 二、复相关系数 复相关系数是测量一个变量与其它多个变量之间线性相关程度的指标。 为了测定一个变量y与其它多个变量 之间的相关系数,可以考虑构造一个关于的线性组合,通过计算该线性组合与之间的简单相关系数作为变量与之间的复相关系数。具体计算过程如下: 第一步,用 y 对 作回归,得
第八章 相关与回归分析 第五节 相关分析 第二步,计算 y 和 的简单相关系数,此简单相关系数即为y与 之间的复相关系数。 复相关系数的计算公式为: ;
第八章 相关与回归分析 第五节 相关分析 二、复相关系数 复相关系数与简单相关系数的区别是简单相关系数的取值范围是[-1,1],而复相关系数的取值范围是[0,1]。这是因为,在两个变量的情况下,回归系数有正负之分,所以在研究相关时,也有正相关和负相关之分;但在多个变量时,偏回归系数有两个或两个以上,其符号有正有负,不能按正负来区别,所以复相关系数也就只取正值。 ;
第八章 相关与回归分析 第五节 相关分析 三、偏相关系数 当两个变量同时受其它变量影响时,有必要研究当控制其它变量不变时,该两个变量之间的相关关系。这种相关关系被称为偏相关关系。 ; 计算偏相关系数的原因在于任何两个变量这间的相关关系都可能受其余变量的影响。要考察两个变量之间的纯相关关系,必须排除其余变量的影响,或者说必须使其余变量保持不变。
第八章 相关与回归分析 为 保持不变时, 与 之间的相关系数; 为 保持不变时, 与 之间的相关系数; 为 保持不变时, 与 之间的相关系数; 第五节 相关分析 三、偏相关系数 偏相关系数的计算是以回归分析为基础的。以三个变量的情形为例,此种情况下,的偏相关系数有三个,分别记作 、 和 之间的相关系数;
第八章 相关与回归分析 第五节 相关分析 第一步,求 对 的回归估计式 计算残差 此时 中不再含有 对 的影响。 第二步,求 对 的回归估计式 计算残差 对 的影响。 此时 中不再含有
第八章 相关与回归分析 第五节 相关分析 的简单相关系数 第三步,计算 和 由于 和 中都不再包含 的影响,因此 和 的简单相关系数就是 保持不变时, 与 之间的相关系数。 所以偏相关系数
第八章 相关与回归分析 第五节 相关分析 三、偏相关系数 可以证明,
第八章 相关与回归分析 第五节 相关分析 三、偏相关系数 类似的 当变量个数多于3个时,求偏相关系数的原则不变,即应先排除其余变量对所考察两个变量的影响,然后求这两个变量之间的简单相关系数。只是变量越多,数学处理以及偏相关系数的表达式就越复杂。
第八章 相关与回归分析 第二节 一元线性回归分析 一、一元线性回归分析随机误差项的基本假定 在回归分析中,最简单最基本的单方程模型为一元线性回归模型。 一元线性回归分析的总体回归模型为: 为常数项或截距项, 为斜率系数 , 是随机误差 项,又称随机干扰项 。
第八章 相关与回归分析 第二节 一元线性回归分析 一、一元线性回归分析随机误差项的基本假定 在线性回归模型中加入随机误差项是基于以下原因: 第一,模型不可能包含所有的解释变量。 第二,模型的设定误差。 第三,测量误差的影响。 第四,其他随机因素的影响。
第八章 相关与回归分析 第二节 一元线性回归分析 一、一元线性回归分析随机误差项的基本假定 线性回归模型由两部分构成,确定性部分和随机性部分, 为确定性部分,称为对于给定值的期望值,可以写为: 上式被称为总体线性回归方程。
第八章 相关与回归分析 第二节 一元线性回归分析 一、一元线性回归分析随机误差项的基本假定 满足以下假定的线性回归模型称为古典(或经典)线性回归模型 假定1:回归模型是正确设定的 假定2:解释变量是非随机的 假定3:随机误差项的均值为零 假定4:随机误差项的方差为一个不变的常数(等方差假定) 假定5:随机误差项的观测值互不相关(非序列相关假定) 假定6:解释变量与随机误差项不相关 假定7:随机误差项服从正态分布 假定8:没有一个解释变量是其他任何解释变量的完全线性组合(无多重共线性假定,只适用于多元线性回归模型)
第八章 相关与回归分析 一般用 、 分别表 分别表示参数的估计 达到最小来确定 、 第二节 一元线性回归分析 二、一元线性回归模型的估计 为样本回归方程。 为了得到这些估计值而最为广泛使用的方法就是普通最小二乘法 最小二乘法的意义在于使 称为回归残差
第八章 相关与回归分析 第二节 一元线性回归分析 二、一元线性回归模型的估计 根据微积分的极值定理,对 求相应于 、 的偏导数,并令其等于0,即可求得 :
第八章 相关与回归分析 r>0 r<0 r=0 b>0 b<0 b=0 b与r的关系:
第八章 相关与回归分析 第二节 一元线性回归分析 二、一元线性回归模型的估计 样本回归直线具有下述性质: 第一、它通过 y 和 x 的样本平均数 和 确定的那一点; 第二、 的平均值和 的平均值相等; 第三、残差的平均值是零; 第四、残差和 不相关; 第五、残差与x不相关。
第八章 相关与回归分析 【分析】因为工业总产值与能源消耗量之间存在高度正相关关系( ),所以可以拟合工业总产值对能源消耗量的线性回归方程。 解:设线性回归方程为 【例】建立工业总产值对能源消耗量的线性回归方程。
第八章 相关与回归分析 即线性回归方程为: 计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(十万吨),工业总产值将增加0.7961个单位(亿元)。
第八章 相关与回归分析 第二节 一元线性回归分析 二、一元线性回归模型的估计 在回归分析中,不要试着对常数项进行解释,原因有两点: 首先,随机误差项部分地是由于忽略了许多边缘自变量而生成的,这些变量的平均效应被置于常数项中。 其次,常数项是当所有自变量与误差项为0时,因变量的值,但是自变量与随机误差项的值几乎从不等于0,因为用作经济分析的变量通常是正的。
第八章 相关与回归分析 第二节 一元线性回归分析 二、一元线性回归模型的估计 (二)一元线性回归模型最小二乘估计量的性质 2. 大样本性质 1. 小样本性质 线性 渐近无偏性 无偏性 一致性 有效性
第八章 相关与回归分析 第二节 一元线性回归分析 三、一元线性回归模型的拟合程度分析 (一)一元线性回归模型的判定系数