1 / 29

第六章 方差分析

第六章 方差分析. 第一节 方差分析的基本问题 第二节 单因素方差分析 第三节 双因素方差分析. 第一节 方差分析的基本问题. 一、方差分析问题的提出 问题:消费者与供应厂商间经常出现纠纷。纠纷发生后,消费者经常会向消费者协会投诉。消协对以下几个行业分别抽取几家企业,统计最近一年中投诉次数,以确定这几个行业的服务质量是否有显著的差异。结果如下表:. 二、概念:方差分析简称 ANOV ( Analysis of Variance ),该统计分析方法能一次性地检验多个总体均值是否存在显著差异。 H0 : H1 : 不全等。.

sachi
Download Presentation

第六章 方差分析

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第六章 方差分析 • 第一节 方差分析的基本问题 • 第二节 单因素方差分析 • 第三节 双因素方差分析

  2. 第一节 方差分析的基本问题 • 一、方差分析问题的提出 • 问题:消费者与供应厂商间经常出现纠纷。纠纷发生后,消费者经常会向消费者协会投诉。消协对以下几个行业分别抽取几家企业,统计最近一年中投诉次数,以确定这几个行业的服务质量是否有显著的差异。结果如下表:

  3. 二、概念:方差分析简称ANOV(Analysis of Variance),该统计分析方法能一次性地检验多个总体均值是否存在显著差异。 • H0: • H1: 不全等。

  4. (一)因素。因素又称因子,是在实验中或在抽样时发生变化的“量”,通常用A、B、C、…表示。方差分析的目的就是分析因子对实验或抽样的结果有无显著影响。如果在实验中变化的因素只有一个,这时的方差分析称为单因素方差分析;在实验中变化的因素不只一个时,就称多因素方差分析。双因素方差分析是多因素方差分析的最简单情形。

  5. (二)水平。因子在实验中的不同状态称作水平。如果因子A有r个不同状态,就称它有 r 个水平,可用表示。我们都针对因素的不同水平或水平的组合,进行实验或抽取样本,以便了解因子的影响。

  6. (三)交互影响。当方差分析的影响因子不唯一时,必要注意这些因子间的相互影响。如果因子间存在相互影响,我们称之为“交互影响”;如果因子间是相互独立的,则称为无交互影响。交互影响有时也称为交互作用,是对实验结果产生作用的一个新因素,分析过程中,有必要将它的影响作用也单独分离开来。(三)交互影响。当方差分析的影响因子不唯一时,必要注意这些因子间的相互影响。如果因子间存在相互影响,我们称之为“交互影响”;如果因子间是相互独立的,则称为无交互影响。交互影响有时也称为交互作用,是对实验结果产生作用的一个新因素,分析过程中,有必要将它的影响作用也单独分离开来。

  7. 三、方差分析的原理 • (一)方差的分解。样本数据波动就有二个来源:一个是随机波动,一个是因子影响。样本数据的波动,可通过离差平方和来反映,这个离差平方和可分解为组间方差与组内方差两部分。组间方差反映出不同的因子对样本波动的影响;组内方差则是不考虑组间方差的纯随机影响。

  8. 离差平方和的分解是我们进入方差分析的“切入点”,这种方差的构成形式为我们分析现象变化提供了重要的信息。如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因子是引起波动的主要原因,可以认为因子对实验的结果存在显著的影响;反之,如果波动的主要部分来自组内方差,则因子的影响就不明显,没有充足理由认为因子对实验或抽样结果有显著作用。离差平方和的分解是我们进入方差分析的“切入点”,这种方差的构成形式为我们分析现象变化提供了重要的信息。如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因子是引起波动的主要原因,可以认为因子对实验的结果存在显著的影响;反之,如果波动的主要部分来自组内方差,则因子的影响就不明显,没有充足理由认为因子对实验或抽样结果有显著作用。

  9. (二)均方差与自由度 • 因素或因素间“交互作用”对观测结果的影响是否显著,关键要看组间方差与组内方差的比较结果。当然,产生方差的独立变量的个数对方差大小也有影响,独立变量个数越多,方差就有可能越大;独立变量个数越少,方差就有可能越小。为了消除独立变量个数对方差大小的影响,我们用方差除以独立变量个数,得到“均方差(Mean Square)”,作为不同来源方差比较的基础。引起方差的独立变量的个数,称作“自由度”。

  10. 检验因子影响是否显著的统计量是一个F统计量:检验因子影响是否显著的统计量是一个F统计量: • F统计量越大,越说明组间方差是主要方差来源,因子影响越显著;F越小,越说明随机方差是主要的方差来源,因子的影响越不显著。

  11. 第二节 单因素方差分析 • 一、单因素条件下离差平方和的分解 数据结构如下:

  12. 总离差平方和 SST=SSE+SSA

  13. 二、因素作用显著性的检验 • 自由度的确定:SST是由于的波动引起的方差,但是,这里所有的nr个变量并不独立,它们满足一个约束条件,真正独立的变量只有nr-1个,自由度是nr-1。SSA是因子在不同水平上的均值变化而产生的方差。但是,r个均值并不是独立的,它们满足一个约束条件,因此也丢失一个自由度,它的自由度是r-1。SSE是由所有的在各因素水平上的围绕均值波动产生,它们满足的约束条件一共r个,失去了r个自由度,所以SSE的自由度是nr-r。SST、SSA和SSE的自由度满足如下关系: • nr-1=(r-1)+(nr-r)

  14. 检验统计量是: 式中:

  15. F值越大,越说明总的方差波动中,组间方差是主要部分,有利于拒绝原假设接受备选假设;反之,F值越小,越说明随机方差是主要的方差来源,有利于接受原假设,有充分证据说明待检验的因素对总体波动有显著影响。因此,检验的拒绝域安排在右侧。F值越大,越说明总的方差波动中,组间方差是主要部分,有利于拒绝原假设接受备选假设;反之,F值越小,越说明随机方差是主要的方差来源,有利于接受原假设,有充分证据说明待检验的因素对总体波动有显著影响。因此,检验的拒绝域安排在右侧。

  16. α 接受域 拒绝域

  17. 投诉问题的解

  18. 第三节 双因素方差分析 • (一)无交互影响:

  19. 数据的离差平方和分解形式为: • SST=SSA+SSB+SSE

  20. SSA表示的是因素A的组间方差总和,SSB是因素B的组间方差总和,都是各因素在不同水平下各自均值差异引起的;SSE仍是组内方差部分,由随机误差产生。各个方差的自由度是:SST的自由度为nr-1,SSA的自由度为r-1,SSB的自由度为n-1,SSE的自由度为nr-r-n-1=(r-1)(n-1)。SSA表示的是因素A的组间方差总和,SSB是因素B的组间方差总和,都是各因素在不同水平下各自均值差异引起的;SSE仍是组内方差部分,由随机误差产生。各个方差的自由度是:SST的自由度为nr-1,SSA的自由度为r-1,SSB的自由度为n-1,SSE的自由度为nr-r-n-1=(r-1)(n-1)。

  21. 各个方差对应的均方差是: • 对因素A而言: • 对因素B而言: • 对随机误差项而言:

  22. 我们得到检验因素A与B影响是否显著的统计量分别是:我们得到检验因素A与B影响是否显著的统计量分别是:

  23. (二)有交互影响

  24. 离差平方和分解形式: • SST=SSA+SSB+SSAB+SSE

  25. 上式中

  26. 离差平方和SST、SSA、SSB、SSAB和SSE的自由度分别是rnm-1、r-1、n-1、(r-1)(n-1)和rn(m-1)。离差平方和SST、SSA、SSB、SSAB和SSE的自由度分别是rnm-1、r-1、n-1、(r-1)(n-1)和rn(m-1)。

  27. 相应的均方差是

  28. 检验因素A与B影响是否显著的统计量分别是 : • 检验交互影响是否显著的统计量度是:

More Related