1 / 102

第九章 回归分析和方差分析

第九章 回归分析和方差分析. 关键词: 单因素试验 一元线性回归 回归诊断. 方差分析 (Analysis of variance, 简称 :ANOVA), 是由英国统计学家费歇尔 (Fisher) 在 20 世纪 20 年代提出的 , 可用于推断两个或两个以上总体均值是否有差异的显著性检验. §9.1 单因素方差分析.

owen-brewer
Download Presentation

第九章 回归分析和方差分析

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第九章 回归分析和方差分析 关键词: 单因素试验 一元线性回归 回归诊断

  2. 方差分析(Analysis of variance, 简称:ANOVA),是由英国统计学家费歇尔(Fisher)在20世纪20年代提出的,可用于推断两个或两个以上总体均值是否有差异的显著性检验.

  3. §9.1单因素方差分析 例:为了比较三种不同类型日光灯管的寿命(小时), 现将从每种类型日光灯管中抽取 8个, 总共 24 个日光灯管进行老化试验,根据下面经老化试验后测算得出的各个日光灯管的寿命(小时),试判断三种不同类型日光灯管的寿命是不是有存在差异.

  4. 日光灯管的寿命(小时) 引起日光灯管寿命不同的原因有二个方面: • 其一, 由于日光灯类型不同,而引起寿命不同. • 其二,同一种类型日光灯管,由于其它随机因素的影响, 也使其寿命不同.

  5. 在方差分析中, 通常把研究对象的特征值, 即所考察的试验结果( 例如日光灯管的寿命)称为 试验指标. 对试验指标产生影响的原因称为 因素, “日光灯管类型” 即为因素. 因素中各个不同状态称为 水平, 如日光灯管三个不同的类型, 即为三个水平.

  6. 单因素方差分析 仅考虑有一个因素A对试验指标的影响. 假如因素 A有r 个水平, 分别在第 i 水平下进行了 多次独立观测, 所得到的试验指标的数据

  7. 每个总体相互独立. 因此, 可写成如下的 数学模型:

  8. 方差分析的目的就是要比较因素A 的r 个水平下试验指标理论均值的差异, 问题可归结为比较这r个总体的均值差异.

  9. 检验假设

  10. 假设等价于

  11. 为给出上面的检验,主要采用的方法是平方和分解。即为给出上面的检验,主要采用的方法是平方和分解。即 假设数据总的差异用总离差平方和 分解为二个部分: 一部分是由于因素 A引起的差异, 即效应平方和 ,另一部分则由随机误差所引起的差异, 即误差平方和 。

  12. 证明:

  13. 定理9.1.1

  14. 单因素试验方差分析表

  15. 例1 设有5种治疗荨麻疹的药,要比较它们的疗效。假设将30个病人分成5组,每组6人,令同组病人使用一种药,并记录病人从使用药物开始到痊愈所需时间,得到下面的记录:(=0.05)

  16. 药物x 治愈所需天数y 1 5,8,7,7,10,8 2 4,6,6,3,5,6 3 6,4,4,5,4,3 4 7,4,6,6,3,5 5 9,3,5,7,7,6

  17. 这里药物是因子,共有5个水平,这是一个单因素方差分析问题,要检验的假设是“所有药物的效果都没有差别”。这里药物是因子,共有5个水平,这是一个单因素方差分析问题,要检验的假设是“所有药物的效果都没有差别”。

  18. 未知参数的估计

  19. 在Excel上实现方差分析 • 先加载''数据分析" 这个模块,方法如下: • 在excel工作表中点击主菜单中 “工具” 点击下拉式菜单中“加载宏” 就会出现一个“加载宏” 的框. • 在 “分析工具库” 前的框内打勾点击“确定”. 这时候再点击下拉式菜单会新出现 “数据分析”. 然后就可以进行统计分析了.

  20. 以下面的例子来说明用Excel进行方差分析的方法:以下面的例子来说明用Excel进行方差分析的方法: • 保险公司某一险种在四个不同地区一年的索赔额情况记录如表所示. 试判断在四个不同地区索赔额有无显著的差异?

  21. 在Excel工作表中输入上面的数据点击主菜单中 “工具”点击下拉式菜单中“数据分析” 就会出现一个“数据分析” 的框. 点击菜单中“方差分析:单因素方差分析”点击“确定”, 出现“方差分析:单因素方差分析” 框.

  22. 在“输入区域”中标定你已经输入的数据的位置根据你输入数据分组情况(是按行分或按列分)确定分组.在“输入区域”中标定你已经输入的数据的位置根据你输入数据分组情况(是按行分或按列分)确定分组. 选定方差分析中F检验的显著水平选定输出结果的位置点击“确定”. 在你指定的区域中出现如下方差分析表:

  23. 方差分析表

  24. 根据Excel给出的方差分析表,假设H0的判别有二种方法:根据Excel给出的方差分析表,假设H0的判别有二种方法:

  25. 方差分析的前提

  26. 方差分析和其它统计推断一样, 样本的独立性对方差分析是非常重要的, 在实际应用中会经常遇到非随机样本的情况, 这时使用方差分析得出的结论不可靠. 因此, 在安排试验或采集数据的过程中, 一定要注意样本的独立性问题.

  27. 在实际中, 没有一个总体真正服从正态分布的, 但方差分析却依赖于正态性的假设. 但经验可知, 方差分析F. 检验对正态性的假设并不是非常敏感, 也就是说, 实际所得到的数据, 如果没有异常值和偏性, 或者说, 数据显示的分布比较对称的话, 即使样本容量比较小(如每个水平下的样本容量仅为5左右), 方差分析的结果仍是值得依赖的.

  28. 方差齐性对于方差分析是非常重要的, 因此在方差分析之前往往要进行方差齐性的诊断,即检验假设通常可采用Barlett检验. 方差齐性检验也可采用如下的经验准则:当最大样本标准差不超过最小样本标准差的两倍时, 方差分析F检验结果近似正确.

  29. §3 一元线性回归分析 变量与变量之间的关系 一、确定性关系: 当自变量给定一个值时,就确定应变量的值与之对应。如:在自由落体中,物体下落的高度h与下落时间t之间有函数关系:

  30. 二、相关性关系: 变量之间的关系并不确定,而是表现为具有随机性的一种“趋势”。即对自变量x的同一值,在不同的观测中,因变量Y可以取不同的值,而且取值是随机的,但对应x在一定范围的不同值,对Y进行观测时,可以观察到Y随x的变化而呈现有一定趋势的变化。

  31. 如:身高与体重,不存在这样的函数可以由身高计算出体重,但从统计意义上来说,身高者,体也重。如:身高与体重,不存在这样的函数可以由身高计算出体重,但从统计意义上来说,身高者,体也重。 如:父亲的身高与儿子的身高之间也有一定联系, 通常父亲高,儿子也高。

  32. 我们以一个例子来建立回归模型 • 某户人家打算安装太阳能热水器. 为了了解室外温度与燃气消耗的关系, 记录了16个月燃气的消耗量, 数据见下表.

  33. 在回归分析时, 我们称“燃气消耗量”为响应变量记为Y,“室外温度”为解释变量记为X, 由所得数据计算相关系数得r=0.995,表明室外温度与燃气消耗之间有非常好的线性相关性. • 如果以室外温度作为横轴, 以消耗燃气量作为纵轴,得到散点图的形状大致呈线形.

More Related