780 likes | 1.11k Views
第八章 假设检验. 一 . 本章提要. 1. 假设检验问题. · 统计假设的基本概念. · 假设检验的思想和方法. · 参数假设检验与区间估计的关系. · 假设检验的两类错误. 2. 单个正态总体参数的检验. · 的假设检验. · 的假设检验. 3. 两个正态总体参数的假设检验. · 关于 的假设检验. · 关于 的假设检验. 4. 大样本检验法. · 两总体均值差的大样本检验法. · 二项分布参数的大样本检验法. 二 . 基本要求. · 理解假设检验的概念和思想方法,以及参数假设检验与.
E N D
第八章 假设检验 一.本章提要 1.假设检验问题 ·统计假设的基本概念 ·假设检验的思想和方法 ·参数假设检验与区间估计的关系 ·假设检验的两类错误 2.单个正态总体参数的检验 · 的假设检验 · 的假设检验 3.两个正态总体参数的假设检验 ·关于 的假设检验 ·关于 的假设检验
4.大样本检验法 ·两总体均值差的大样本检验法 ·二项分布参数的大样本检验法 二.基本要求 ·理解假设检验的概念和思想方法,以及参数假设检验与 区间估计的关系;了解假设检验中的两类错误. ·熟练掌握单个正态总体关于均值 以及方差 的 假设检验. ·熟练掌握关于两个正态总体均值 以及方差 的 假设检验. ·领会大样本检验法. 三.重点、难点 正态总体均值与方差的假设检验.
8.1 假设检验问题 8.1.1假设检验的基本概念 在实际问题中,经常需要对总体的分布形式或分布中的未 知参数的某个陈述或命题进行判断,数理统计学将这些有待验 证的陈述或命题称为统计假设,简称假设;利用样本对假设的 真假进行判断称为假设检验;若总体的分布已知,对分布中的 未知参数作假设并进行检验,称为参数假设检验;若总体的分 布未知,对总体的分布形式或参数作假设并进行检验,称为非 参数假设检验,被检验的假设称为原假设或零假设,记为 , 其对立面称为对立假设,记为 。
8.1.2假设检验的思想和方法 小概率原理 概率很小的事件在一次试验中不会发生,如 果小概率事件在一次试验中发生了,则实属反常,一定有导致 反常的特别的原因,所以有理由怀疑试验的原定条件不成立。 概率反证法 欲判断假设 的真假,先假设 真,在此前 题下构造一个能说明问题的小概率事件 ,试验取样,由样本 信息确定 是否发生,若 发生,则与小概率原理相违背,说 明假设 不成立,则拒绝 ,接受 ;若小概率事件 没有发 生,没有理拒绝 ,只好接受 。
小概率事件 的概率到底多小由实际问题的不同需要来定, 我们用 记小概率,一般取 等,在假设检验中 为检验水平,或显著性水平。 例1.已知某炼铁厂的铁水含碳量 现改变了工 艺条件测得10炉铁水的平均含碳量 假设方差无变化, 问:总体的均值 是否明显改变?(取 ) 解:由问题提出假设: 若 成立,则 与4.55应很接近,未知,用其无偏估计 代替, 若 较大,则可以认为 ,所以若 成立,
事件 不太可能发生,即 很小, 令 来确定 由 知 因此,若 成立 显然 统计量 因此 即 则 因此确定了小概率事件 由 ,得
由于 ,说明小概率事件 发生 因此接受假设 ,即认为 。 一般地,若拒绝接受 样本观察值 其中 是 维空间 中的区域, 则称 为假设 的拒绝域或否定域, 的接受域,检查中的所用的统计量成为检 称 的补集 查统计量,拒绝域分别位于同例的假设检验称为双侧假设检验。
假设检验的步骤如下: (1)提出假设:根据问题的要求,提出原假设 与对立假设 确定显著水平 及样本容量 。 (2)确定拒绝域:用参数 的一个好的估计量 (通常取 的 无偏估计)来代替 ,分析拒绝域 的形式,构造检验统计量 在 成立的前提下确定 的概率分布,通过等式 确定 。 (3)执行统计判决:求统计量的值,并查表求出有关数据,判 断小概率时间是否发生,由此作出判决。
拒绝域的形式一般有原假设与对立假设共同确定,当给定拒绝域的形式一般有原假设与对立假设共同确定,当给定 原假设 时,其对立的形式可能有多个,得到的拒绝域也可能 不同。 例2.数据同例1,问:总体的期望 是否明显大于4.55? 解:此题的合理假设为 用 的无偏估计 来代替 在例1中,拒绝 时接受的是 所以拒绝域为 而在本例中,拒绝 时接受的是 因而拒绝域为
发生的概率应很小 若 成立,事件 设 统计量 由 得 所以拒绝域为 由于 所以接受 。
8.1.3参数假设检验与区间估计的关系 参数假设检验的关键是找一个确定性的区域(拒绝域) 使得 成立时,事件 是小概率事件, 旦抽样结果使小概率事件发生,就否定原假设 。 参数的区间估计是找一个随机区间 ,使 包含待估参数 是个大概率事件。 这两类问题都是利用样本对参数作判断:一个是由小概率 事件否定参数 属于某范围,另一个则是依大概率时间确信某 区域包含参数 的真值,两者本质上殊途同归。
8.1.4假设检验的两类错误 对于小概率事件 ,无论其概率多小,还是有可能发生的, 所以利用“概率反证法”进行假设检验,可能作出错误的判断,有 以下两种情形: (1)原假设 实际是正确的,但却拒绝了 ,这样就犯了 “弃真”的错误,通常称为第一类错误.仅当小概率事件 发生时 才拒绝 ,所以犯第一类错误的概率为 。 (2)原假设 实际是不正确的,但却接受了 ,这样就犯了 “取协”的错误,通常称为第二类错误,其概率记为 。
习题8-1 1.在假设检验中,显著性水平 的意义是( ) A.原假设 成立,经检验被拒绝的概率 B.原假设 成立,经检验被不能被拒绝的概率 C.原假设 不成立,经检验被拒绝的概率 D.原假设 不成立,经检验被不能被拒绝的概率 2.试述检验假设的步骤. 为其一个样本 3.设总体 , 为未知参数, 取拒绝域为: 对下述假设检验问题 , 试求常数 ,使得该检验的显著水平为0.05.
参考答案 1. A 2. 略 3. 可以
8.2单个正态总体参数的假设检验 设总体 ,抽取容量为 的样本 , 样本均值与样本分别是 为叙述简明,我们把各个不同的 假设检验中有关的原假设 ,备择假设 ,以及在显著性水平 的拒绝域分别列成相应表,这些表中,当原假设 成立时,所 有统计量及其分布都可以从第6章中的有关定理中得到. 8.2.1关于正态总体均值 的假设检验 1.若已知 ,则取统计量 ; 2.若 未知,则取统计量 . 综和上述情况得表8-1
表8-1正态总体均值的假设检验表 在显著水平 下关于 的拒绝域 ① ② ①若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。 ②若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。
例1.某工厂生产的某中钢索的断裂强度(单位: )服从分布 ,其中 ,现从一批此种钢索的容量为9的一个 样本测得断裂强度平均值 ,与以往正常生产时的 相比, 较 大 , 设总体方差不变,则在显著性水平 下能 否认为这批钢索质量有显著提高? 解:本题是对参数 的单侧检验问题 (1)提出假设 (2)选取检验统计量
(3)拒绝域为 (4)取 ,查表得 由 得 (5)检验:由于 故接受假设 ,认为这批钢材质量没有显著提高。 例2.某产品的一项指标 服从分布 ,现从中抽取容量 为26的样本,样本均值 ,能否认为这种产品的期望值 ?
解:本题双侧检验问题 (1)假设 (2)选取统计量 (3)拒绝域为 查表得 (4)取 , 得 由 , (5) ,所以接受 即认为这种产品在显著水平 下的期望值为1600。
例3.一个手机生产厂家在其宣传广告中声称他们生产的某中品牌例3.一个手机生产厂家在其宣传广告中声称他们生产的某中品牌 的手机待机时间的平均值至少为71.5小时,一质检部门抽查了该 厂生产的此品牌的手机6部,得到的待机时间为: 69,68,72,70,66,75, 设手机的待机时间 ,由这些数据能否说明其广告有欺 骗消费者的嫌疑 ? 解:(1)假设 (2)由于方差 未知,用检验统计量 (3)拒绝域为 (4)计算得
(5)查 分布表得 (6)统计判决 故接受 ,即不能认为该厂广告有欺骗消费者之嫌疑. 8.2.2关于正态总体方差 的假设检验 1.若已知 ,则取检验统计量 2.若未知 ,则取检验统计量 表8-2列出了正态总体方差假设检验的几种情况
表8-2正态总体方差的假设检验表 在显著水平 下关于 的拒绝域 ① ② ①若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。 ②若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。
例4.某打包机包装糖出厂,已知每包糖的质量 ,按 设计要求,方差 不能超过100,现从中抽取11包,测得样本方 差 ,问:该打包机的精度是否符合要求? 解:(1)提出假设 (2)选取统计量 (3)拒绝域为 或 (4)由 ,查 分布表得 计算 所以接受假设 因为 , 即该打包机精度符合要求。
例5.某炼铁厂铁水含碳量 ,现对设备进行了维修, 然后抽测了5炉炉水,测得含碳量 的样本方差 ,问: 是否可以认为设备维修后的铁水含碳量的方差仍旧是 ? 解:(1)提出假设 (2)选取统计量 (3)拒绝域 (4)由 ,查表得 计算 (5)因为 ,所以拒绝 即设备维修后铁水含碳量的方差有改变。
习题8-2 A 1.某批矿砂的5个样品中镍含量为(%): 3.25,3.27,3.24, 3.26,3.24,设测定值服从正态分布,问:能否认为这批矿 砂的镍含量为3.25%? 2.用传统工艺加工的某中水果罐头中,每瓶平均维生素 的含 量为19 ,现改进了加工工艺,抽查了16瓶罐头,测得维生素 含量 为:18,23,20.5,21,22,20,22.5,19,20,23 ,20.5,18.8,20,19.5,22,23,已知维生素 含量服从正 态分布,分别在方差 和 未知的情况下,问:新工艺下维 生素 含量是否比旧工艺下维生素 含量有显著提高?
3.设来自正态总体 ,容量为100的样本,样本均值 未知,而 ,检验下列假设 (1) (2) 4.某种导线,要求其电阻的标准差不超过 ,今在生产的 一批导线中抽取9根,测得样本标准差 ,设总体服从 正态分布,能认为这批导线的标准差显著偏大吗?
习题8-2 B 1.检测站对某条河流每日的溶解氧浓度纪录了30个数据,并由 此算得 ,已知这条河流的每日溶解氧浓度服从 ,试检验 2.从一批轴料中取15件测量其椭圆度,计算得 问:该批轴料椭圆度的总体方差与规定的 有无显著差异 ( ,椭圆度服从正态分布)?
经较长时间储存,取9 3.有一批枪弹,出厂时初速 发进行测试,得样本值 :914,920,910,953,945,912 924,940,据检验,枪弹经储存,其初速 仍服从正态分布, 且 可认为不变,问:是否可以认为这批枪弹的 显著降 底 ? 4.电池在货架上滞留时间不能太长,下面给出某商店随机选取 的8只电池的货架滞留时间(以天计): 108,124,124,106,138,163,159,134 设数据来自总体 未知,试检验假设 取
参考答案 A: 1.含镍量为3.25% 2.有显著提高 3. 4. 检验得 B: 1. 2.有显著提高 3.显著降低 4.
8.3两个正态总体参数的假设检验 设总体 总体 从两个总体中分别抽 取样本 及 样本均值与样本方差分别是 及 ,以下是有关参数 的某些假设。 8.3.1关于两个正态总体均值 的假设检验 1.若已知 及 ,则取统计量 2.若未知 及 ,假定 ,取统计量 其中 于是得到表8-3所列的两个正态总体均值的假设检验
表8-3两个正态总体均值的假设检验 在显著水平 下关于 的拒绝域 ① ② ①若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。 ②若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。
例1.某香烟厂向化验室送去两批烟丝样本,要化验尼古丁的含量,例1.某香烟厂向化验室送去两批烟丝样本,要化验尼古丁的含量, 各抽取重量相同的5例化验,得尼古丁含量分别为A:24,27,26, 21,24,B:27,28,23,31,26.设化验数据服从正态分布,A批 方差为5,B批方差为8,在显著性水平 下,检验两批烟丝 的尼古丁含量是否有显著差异。 解:提出假设 拒绝域为 选取统计量 由 计算 查表得
由于 ,所以接受 即认为两批烟丝的尼古丁含量没有显著差异。 8.3.2关于两个正态总体方差 的假设检验 1.已知 及 检验假设 设 则 作分子, 作 已知,则 已知,取 分母得统计量 其中 及 分别为 统计量 的分子及分母的样本容量。
对于显著性水平 ,由 分布表查得 及 使得 若由样本观测值计算得 ,则拒绝 ,但由 于 总大于1,而从 分布表可知,当取较小的值 时,总有 所以统计量 的值不可能小于 , 因此在显著水平 下的拒绝域只能是 。 2.若未知 及 ,则与1类似取统计量 关于单侧假设检验的拒绝域的讨论与双侧假设检验完全类似 于是,得到两个正态总体方差的假设检验表。(表8-4)
表8-4两个正态总体方差的假设检验表 在显著水平 下关于 的拒绝域 ① ② ①若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。 ②若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。
例2.某中物品在处理前后分别取样分析其含脂率(%)得数据:例2.某中物品在处理前后分别取样分析其含脂率(%)得数据: 处理前:0.29,0.18,0.31,0.30,0.36,0.32,0.28,0.12, 0.30,0.27; 处理后:0.15,0.13,0.09,0.07,0.24,0.19,0.04,0.08, 0.20,0.12,0.24。 假设处理前后含脂率都服从 正态分布,检验处理前后含脂率的 方差是否不变。 解:提出假设 计算得
由于 选取统计量 取 查表得 计算得 则接受 由于 即认为处理前后方差没有显著变化。 例3.测得两批电子器材的电阻(单位: )分别为: A批:0.140,0.138,0.134,0.142,0.144,0.137 B批:0.135,0.140,0.142,0.132,0.138,0.140 设两批器材的电阻分别服从正态分布 且
相互独立,则对于显著性水平 能否认为两器材电阻 值相等? 解:本题两正态总体均值的双侧检验问题,且方差未知, 所以要分两步讨论 (1)检验假设 计算得 且 取 查 分布表得 由于 所以接受 即认为 。
(2)检验假设 查 分布表得 所以接受 即认为这两批器材电阻均值相等。
习题8-3 A 1.设总体 ,总体 ,其中, 已知, 与 是分别来自 与 的样本,两样本 ,其检验统计量 相互独立,对假设检验 ,拒绝域 。 2.甲、乙两台车床加工同种产品,从这两台机床中随机抽取若 干件,测得产品直径 甲:20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9 乙:19.7,20.8,20.5,19.8,19.4,20.6,19.2 假设两台机床加工的产品直径都服从正态分布且总体方差相等, 问:甲、乙两台车床加工的产品直径有无显著差异?
3.两家工厂用同样的生产过程生产塑料,假定两个工厂的塑料3.两家工厂用同样的生产过程生产塑料,假定两个工厂的塑料 强度都服从正态分布,生产已定型且方差都已知,收集到的数 据如下: 问:两个塑料的平均强度是否相等? 4.改进某中金属的热处理方法,要检验抗拉强度 有无显著 提高,在改进前后各取12个样品,测量并计算得改进前 改进后 假定热处理前后抗拉强度都服从正态分布,取 ,问: (1)处理前后总体方差是否相等? (2)处理后抗拉强度有无显著提高?
习题8-3 B 1.设总体 ,总体 ,其中, 已知, 与 是分别来自 与 的样本,两样本 相互独立,对假设检验 其检验 统计量 ,拒绝域 . 2.针织品漂白工艺中,要考察温度对针织品断裂强度的影响, 为比较 与 的影响有无差别,在这两个温度下,分别重 复做了8次实验,得数据 时的温度:20.5,18.7,19.8,20.9,21.5,17.5,21.0, 21.2
时的温度:17.7,20.3,20.0,18.8,19.0,20.1,20.0,时的温度:17.7,20.3,20.0,18.8,19.0,20.1,20.0, 19.1 已知断裂强力服从正态分布且方差不变,问:在 时强力与在 时的强力下是否有显著差别 ? 3.两台机床生产同一种滚珠(滚珠直径服从正态分布),从中 分别抽取8个和9个比较两台车床生产的滚珠直径的方差是否有 明显差异 ? 甲车床:15.0,14.5,15.2,15.5,14.8,15.1,15.2,14.8 乙车床:15.2,15.0,14.8,15.2,15.0,15.0,14.8,15.1 14.8。
4.设有甲、乙两种安眠药,比较它们的治疗效果,以 表示失 眠者服用甲药后睡眠延长的时数,以 表示失眠者服用乙药后 睡眠延长的时数,现独立观察20个失眠者,其中10人服用甲药, 另10人服用乙药,延时纪录如下: 1.9 0.8 1.1 0.1 0.1 4.4 5.5 1.6 4.6 3.4 0.7 -1.6 -0.2 -0.1 -1.2 3.4 3.7 0.8 0.0 2.0 假定 ,试问:这两种药的疗效有无显 著差异。
5.某中橡胶配方中,原用氧化锌 ,现改为 ,今分别对两 种配方各种若干试验,测得橡胶伸长率为: 原配方:540,530,525,520,545,531,541,529,534 现配方:565,577,580,575,556,542,560,532,575,561 设同一批橡胶伸长率服从正态分布,问:在两种配方下,橡胶 率是否服从同一分布 ?
参考答案 A: 1. 2.无显著差异 3.平均强度不相等 4.方差相等,抗拉强度有显著提高 B: 1. 2.有显著差异 3.没有显著差别 4.先检验方差得方差相等;再检验均值得没有显著差别 5.(1)方差相等 (2)均值不同,则伸长率分布不同
8.4 大样本检验法 前面讨论的假设检验问题,都已知有关统计量的分布,并 由此确定拒绝域,但在许多问题中,很难得到检验统计量的分 布,有时即使能求出,使用上也很不方便,实际应用中往往求 助于统计量的极限分布.若抽取大量样本(大样本),并用检 验统计量的极限分布来近似作为其分布,由此得到的检验方法 称为大样本检验法。 8.4.1两总体均值差的大样本检验法
设有两个独立总体 ,其均值和方差分别为 和 现从每一总体中各抽取一样本,其样本容量、样本均值、样本 并且 很大,给定显著水平 方差分别记为 和 ,检验假设 若两总体均为正态分布,当 已知时,可用 检验法来检验; 当 未知但 时,可用 检验法来检验,此处总体分布未 知,即使总体为正态分布,由于 未知且 不一定相等,因 而不能用 检验,下面用大样本的方法给出此假设的检验法。
当 很大时,由中心极限定理知: ,即 近似 近似 同理,当 很大时, 近似 独立,所以 近似 分别是 的很好近似值,用 代替 ,用 代替 仍有:
近似 由此得拒绝域为 ( 很大) (1)