290 likes | 495 Views
第六章 方差分析. 第一节 方差分析的基本问题 第二节 单因素方差分析 第三节 双因素方差分析. 第一节 方差分析的基本问题. 一、方差分析问题的提出 问题:消费者与供应厂商间经常出现纠纷。纠纷发生后,消费者经常会向消费者协会投诉。消协对以下几个行业分别抽取几家企业,统计最近一年中投诉次数,以确定这几个行业的服务质量是否有显著的差异。结果如下表:. 二、概念:方差分析简称 ANOV ( Analysis of Variance ),该统计分析方法能一次性地检验多个总体均值是否存在显著差异。 H0 : H1 : 不全等。.
E N D
第六章 方差分析 • 第一节 方差分析的基本问题 • 第二节 单因素方差分析 • 第三节 双因素方差分析
第一节 方差分析的基本问题 • 一、方差分析问题的提出 • 问题:消费者与供应厂商间经常出现纠纷。纠纷发生后,消费者经常会向消费者协会投诉。消协对以下几个行业分别抽取几家企业,统计最近一年中投诉次数,以确定这几个行业的服务质量是否有显著的差异。结果如下表:
二、概念:方差分析简称ANOV(Analysis of Variance),该统计分析方法能一次性地检验多个总体均值是否存在显著差异。 • H0: • H1: 不全等。
(二)水平。因子在实验中的不同状态称作水平。如果因子A有r个不同状态,就称它有 r 个水平,可用表示。我们都针对因素的不同水平或水平的组合,进行实验或抽取样本,以便了解因子的影响。
(三)交互影响。当方差分析的影响因子不唯一时,必要注意这些因子间的相互影响。如果因子间存在相互影响,我们称之为“交互影响”;如果因子间是相互独立的,则称为无交互影响。交互影响有时也称为交互作用,是对实验结果产生作用的一个新因素,分析过程中,有必要将它的影响作用也单独分离开来。(三)交互影响。当方差分析的影响因子不唯一时,必要注意这些因子间的相互影响。如果因子间存在相互影响,我们称之为“交互影响”;如果因子间是相互独立的,则称为无交互影响。交互影响有时也称为交互作用,是对实验结果产生作用的一个新因素,分析过程中,有必要将它的影响作用也单独分离开来。
三、方差分析的原理 • (一)方差的分解。样本数据波动就有二个来源:一个是随机波动,一个是因子影响。样本数据的波动,可通过离差平方和来反映,这个离差平方和可分解为组间方差与组内方差两部分。组间方差反映出不同的因子对样本波动的影响;组内方差则是不考虑组间方差的纯随机影响。
离差平方和的分解是我们进入方差分析的“切入点”,这种方差的构成形式为我们分析现象变化提供了重要的信息。如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因子是引起波动的主要原因,可以认为因子对实验的结果存在显著的影响;反之,如果波动的主要部分来自组内方差,则因子的影响就不明显,没有充足理由认为因子对实验或抽样结果有显著作用。离差平方和的分解是我们进入方差分析的“切入点”,这种方差的构成形式为我们分析现象变化提供了重要的信息。如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因子是引起波动的主要原因,可以认为因子对实验的结果存在显著的影响;反之,如果波动的主要部分来自组内方差,则因子的影响就不明显,没有充足理由认为因子对实验或抽样结果有显著作用。
(二)均方差与自由度 • 因素或因素间“交互作用”对观测结果的影响是否显著,关键要看组间方差与组内方差的比较结果。当然,产生方差的独立变量的个数对方差大小也有影响,独立变量个数越多,方差就有可能越大;独立变量个数越少,方差就有可能越小。为了消除独立变量个数对方差大小的影响,我们用方差除以独立变量个数,得到“均方差(Mean Square)”,作为不同来源方差比较的基础。引起方差的独立变量的个数,称作“自由度”。
检验因子影响是否显著的统计量是一个F统计量:检验因子影响是否显著的统计量是一个F统计量: • F统计量越大,越说明组间方差是主要方差来源,因子影响越显著;F越小,越说明随机方差是主要的方差来源,因子的影响越不显著。
第二节 单因素方差分析 • 一、单因素条件下离差平方和的分解 数据结构如下:
二、因素作用显著性的检验 • 自由度的确定:SST是由于的波动引起的方差,但是,这里所有的nr个变量并不独立,它们满足一个约束条件,真正独立的变量只有nr-1个,自由度是nr-1。SSA是因子在不同水平上的均值变化而产生的方差。但是,r个均值并不是独立的,它们满足一个约束条件,因此也丢失一个自由度,它的自由度是r-1。SSE是由所有的在各因素水平上的围绕均值波动产生,它们满足的约束条件一共r个,失去了r个自由度,所以SSE的自由度是nr-r。SST、SSA和SSE的自由度满足如下关系: • nr-1=(r-1)+(nr-r)
检验统计量是: 式中:
F值越大,越说明总的方差波动中,组间方差是主要部分,有利于拒绝原假设接受备选假设;反之,F值越小,越说明随机方差是主要的方差来源,有利于接受原假设,有充分证据说明待检验的因素对总体波动有显著影响。因此,检验的拒绝域安排在右侧。F值越大,越说明总的方差波动中,组间方差是主要部分,有利于拒绝原假设接受备选假设;反之,F值越小,越说明随机方差是主要的方差来源,有利于接受原假设,有充分证据说明待检验的因素对总体波动有显著影响。因此,检验的拒绝域安排在右侧。
α 接受域 拒绝域
第三节 双因素方差分析 • (一)无交互影响:
数据的离差平方和分解形式为: • SST=SSA+SSB+SSE
SSA表示的是因素A的组间方差总和,SSB是因素B的组间方差总和,都是各因素在不同水平下各自均值差异引起的;SSE仍是组内方差部分,由随机误差产生。各个方差的自由度是:SST的自由度为nr-1,SSA的自由度为r-1,SSB的自由度为n-1,SSE的自由度为nr-r-n-1=(r-1)(n-1)。SSA表示的是因素A的组间方差总和,SSB是因素B的组间方差总和,都是各因素在不同水平下各自均值差异引起的;SSE仍是组内方差部分,由随机误差产生。各个方差的自由度是:SST的自由度为nr-1,SSA的自由度为r-1,SSB的自由度为n-1,SSE的自由度为nr-r-n-1=(r-1)(n-1)。
各个方差对应的均方差是: • 对因素A而言: • 对因素B而言: • 对随机误差项而言:
我们得到检验因素A与B影响是否显著的统计量分别是:我们得到检验因素A与B影响是否显著的统计量分别是:
离差平方和分解形式: • SST=SSA+SSB+SSAB+SSE
离差平方和SST、SSA、SSB、SSAB和SSE的自由度分别是rnm-1、r-1、n-1、(r-1)(n-1)和rn(m-1)。离差平方和SST、SSA、SSB、SSAB和SSE的自由度分别是rnm-1、r-1、n-1、(r-1)(n-1)和rn(m-1)。
检验因素A与B影响是否显著的统计量分别是 : • 检验交互影响是否显著的统计量度是: