1 / 78

第八章 假设检验

第八章 假设检验. 一 . 本章提要. 1. 假设检验问题. · 统计假设的基本概念. · 假设检验的思想和方法. · 参数假设检验与区间估计的关系. · 假设检验的两类错误. 2. 单个正态总体参数的检验. · 的假设检验. · 的假设检验. 3. 两个正态总体参数的假设检验. · 关于 的假设检验. · 关于 的假设检验. 4. 大样本检验法. · 两总体均值差的大样本检验法. · 二项分布参数的大样本检验法. 二 . 基本要求. · 理解假设检验的概念和思想方法,以及参数假设检验与.

diata
Download Presentation

第八章 假设检验

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第八章 假设检验 一.本章提要 1.假设检验问题 ·统计假设的基本概念 ·假设检验的思想和方法 ·参数假设检验与区间估计的关系 ·假设检验的两类错误 2.单个正态总体参数的检验 · 的假设检验 · 的假设检验 3.两个正态总体参数的假设检验 ·关于 的假设检验 ·关于 的假设检验

  2. 4.大样本检验法 ·两总体均值差的大样本检验法 ·二项分布参数的大样本检验法 二.基本要求 ·理解假设检验的概念和思想方法,以及参数假设检验与 区间估计的关系;了解假设检验中的两类错误. ·熟练掌握单个正态总体关于均值 以及方差 的 假设检验. ·熟练掌握关于两个正态总体均值 以及方差 的 假设检验. ·领会大样本检验法. 三.重点、难点 正态总体均值与方差的假设检验.

  3. 8.1 假设检验问题 8.1.1假设检验的基本概念 在实际问题中,经常需要对总体的分布形式或分布中的未 知参数的某个陈述或命题进行判断,数理统计学将这些有待验 证的陈述或命题称为统计假设,简称假设;利用样本对假设的 真假进行判断称为假设检验;若总体的分布已知,对分布中的 未知参数作假设并进行检验,称为参数假设检验;若总体的分 布未知,对总体的分布形式或参数作假设并进行检验,称为非 参数假设检验,被检验的假设称为原假设或零假设,记为 , 其对立面称为对立假设,记为 。

  4. 8.1.2假设检验的思想和方法 小概率原理 概率很小的事件在一次试验中不会发生,如 果小概率事件在一次试验中发生了,则实属反常,一定有导致 反常的特别的原因,所以有理由怀疑试验的原定条件不成立。 概率反证法 欲判断假设 的真假,先假设 真,在此前 题下构造一个能说明问题的小概率事件 ,试验取样,由样本 信息确定 是否发生,若 发生,则与小概率原理相违背,说 明假设 不成立,则拒绝 ,接受 ;若小概率事件 没有发 生,没有理拒绝 ,只好接受 。

  5. 小概率事件 的概率到底多小由实际问题的不同需要来定, 我们用 记小概率,一般取 等,在假设检验中 为检验水平,或显著性水平。 例1.已知某炼铁厂的铁水含碳量 现改变了工 艺条件测得10炉铁水的平均含碳量 假设方差无变化, 问:总体的均值 是否明显改变?(取 ) 解:由问题提出假设: 若 成立,则 与4.55应很接近,未知,用其无偏估计 代替, 若 较大,则可以认为 ,所以若 成立,

  6. 事件 不太可能发生,即 很小, 令 来确定 由 知 因此,若 成立 显然 统计量 因此 即 则 因此确定了小概率事件 由 ,得

  7. 由于 ,说明小概率事件 发生 因此接受假设 ,即认为 。 一般地,若拒绝接受 样本观察值 其中 是 维空间 中的区域, 则称 为假设 的拒绝域或否定域, 的接受域,检查中的所用的统计量成为检 称 的补集 查统计量,拒绝域分别位于同例的假设检验称为双侧假设检验。

  8. 假设检验的步骤如下: (1)提出假设:根据问题的要求,提出原假设 与对立假设 确定显著水平 及样本容量 。 (2)确定拒绝域:用参数 的一个好的估计量 (通常取 的 无偏估计)来代替 ,分析拒绝域 的形式,构造检验统计量 在 成立的前提下确定 的概率分布,通过等式 确定 。 (3)执行统计判决:求统计量的值,并查表求出有关数据,判 断小概率时间是否发生,由此作出判决。

  9. 拒绝域的形式一般有原假设与对立假设共同确定,当给定拒绝域的形式一般有原假设与对立假设共同确定,当给定 原假设 时,其对立的形式可能有多个,得到的拒绝域也可能 不同。 例2.数据同例1,问:总体的期望 是否明显大于4.55? 解:此题的合理假设为 用 的无偏估计 来代替 在例1中,拒绝 时接受的是 所以拒绝域为 而在本例中,拒绝 时接受的是 因而拒绝域为

  10. 发生的概率应很小 若 成立,事件 设 统计量 由 得 所以拒绝域为 由于 所以接受 。

  11. 8.1.3参数假设检验与区间估计的关系 参数假设检验的关键是找一个确定性的区域(拒绝域) 使得 成立时,事件 是小概率事件, 旦抽样结果使小概率事件发生,就否定原假设 。 参数的区间估计是找一个随机区间 ,使 包含待估参数 是个大概率事件。 这两类问题都是利用样本对参数作判断:一个是由小概率 事件否定参数 属于某范围,另一个则是依大概率时间确信某 区域包含参数 的真值,两者本质上殊途同归。

  12. 8.1.4假设检验的两类错误 对于小概率事件 ,无论其概率多小,还是有可能发生的, 所以利用“概率反证法”进行假设检验,可能作出错误的判断,有 以下两种情形: (1)原假设 实际是正确的,但却拒绝了 ,这样就犯了 “弃真”的错误,通常称为第一类错误.仅当小概率事件 发生时 才拒绝 ,所以犯第一类错误的概率为 。 (2)原假设 实际是不正确的,但却接受了 ,这样就犯了 “取协”的错误,通常称为第二类错误,其概率记为 。

  13. 习题8-1 1.在假设检验中,显著性水平 的意义是( ) A.原假设 成立,经检验被拒绝的概率 B.原假设 成立,经检验被不能被拒绝的概率 C.原假设 不成立,经检验被拒绝的概率 D.原假设 不成立,经检验被不能被拒绝的概率 2.试述检验假设的步骤. 为其一个样本 3.设总体 , 为未知参数, 取拒绝域为: 对下述假设检验问题 , 试求常数 ,使得该检验的显著水平为0.05.

  14. 参考答案 1. A 2. 略 3. 可以

  15. 8.2单个正态总体参数的假设检验 设总体 ,抽取容量为 的样本 , 样本均值与样本分别是 为叙述简明,我们把各个不同的 假设检验中有关的原假设 ,备择假设 ,以及在显著性水平 的拒绝域分别列成相应表,这些表中,当原假设 成立时,所 有统计量及其分布都可以从第6章中的有关定理中得到. 8.2.1关于正态总体均值 的假设检验 1.若已知 ,则取统计量 ; 2.若 未知,则取统计量 . 综和上述情况得表8-1

  16. 表8-1正态总体均值的假设检验表 在显著水平 下关于 的拒绝域 ① ② ①若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。 ②若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。

  17. 例1.某工厂生产的某中钢索的断裂强度(单位: )服从分布 ,其中 ,现从一批此种钢索的容量为9的一个 样本测得断裂强度平均值 ,与以往正常生产时的 相比, 较 大 , 设总体方差不变,则在显著性水平 下能 否认为这批钢索质量有显著提高? 解:本题是对参数 的单侧检验问题 (1)提出假设 (2)选取检验统计量

  18. (3)拒绝域为 (4)取 ,查表得 由 得 (5)检验:由于 故接受假设 ,认为这批钢材质量没有显著提高。 例2.某产品的一项指标 服从分布 ,现从中抽取容量 为26的样本,样本均值 ,能否认为这种产品的期望值 ?

  19. 解:本题双侧检验问题 (1)假设 (2)选取统计量 (3)拒绝域为 查表得 (4)取 , 得 由 , (5) ,所以接受 即认为这种产品在显著水平 下的期望值为1600。

  20. 例3.一个手机生产厂家在其宣传广告中声称他们生产的某中品牌例3.一个手机生产厂家在其宣传广告中声称他们生产的某中品牌 的手机待机时间的平均值至少为71.5小时,一质检部门抽查了该 厂生产的此品牌的手机6部,得到的待机时间为: 69,68,72,70,66,75, 设手机的待机时间 ,由这些数据能否说明其广告有欺 骗消费者的嫌疑 ? 解:(1)假设 (2)由于方差 未知,用检验统计量 (3)拒绝域为 (4)计算得

  21. (5)查 分布表得 (6)统计判决 故接受 ,即不能认为该厂广告有欺骗消费者之嫌疑. 8.2.2关于正态总体方差 的假设检验 1.若已知 ,则取检验统计量 2.若未知 ,则取检验统计量 表8-2列出了正态总体方差假设检验的几种情况

  22. 表8-2正态总体方差的假设检验表 在显著水平 下关于 的拒绝域 ① ② ①若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。 ②若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。

  23. 例4.某打包机包装糖出厂,已知每包糖的质量 ,按 设计要求,方差 不能超过100,现从中抽取11包,测得样本方 差 ,问:该打包机的精度是否符合要求? 解:(1)提出假设 (2)选取统计量 (3)拒绝域为 或 (4)由 ,查 分布表得 计算 所以接受假设 因为 , 即该打包机精度符合要求。

  24. 例5.某炼铁厂铁水含碳量 ,现对设备进行了维修, 然后抽测了5炉炉水,测得含碳量 的样本方差 ,问: 是否可以认为设备维修后的铁水含碳量的方差仍旧是 ? 解:(1)提出假设 (2)选取统计量 (3)拒绝域 (4)由 ,查表得 计算 (5)因为 ,所以拒绝 即设备维修后铁水含碳量的方差有改变。

  25. 习题8-2 A 1.某批矿砂的5个样品中镍含量为(%): 3.25,3.27,3.24, 3.26,3.24,设测定值服从正态分布,问:能否认为这批矿 砂的镍含量为3.25%? 2.用传统工艺加工的某中水果罐头中,每瓶平均维生素 的含 量为19 ,现改进了加工工艺,抽查了16瓶罐头,测得维生素 含量 为:18,23,20.5,21,22,20,22.5,19,20,23 ,20.5,18.8,20,19.5,22,23,已知维生素 含量服从正 态分布,分别在方差 和 未知的情况下,问:新工艺下维 生素 含量是否比旧工艺下维生素 含量有显著提高?

  26. 3.设来自正态总体 ,容量为100的样本,样本均值 未知,而 ,检验下列假设 (1) (2) 4.某种导线,要求其电阻的标准差不超过 ,今在生产的 一批导线中抽取9根,测得样本标准差 ,设总体服从 正态分布,能认为这批导线的标准差显著偏大吗?

  27. 习题8-2 B 1.检测站对某条河流每日的溶解氧浓度纪录了30个数据,并由 此算得 ,已知这条河流的每日溶解氧浓度服从 ,试检验 2.从一批轴料中取15件测量其椭圆度,计算得 问:该批轴料椭圆度的总体方差与规定的 有无显著差异 ( ,椭圆度服从正态分布)?

  28. 经较长时间储存,取9 3.有一批枪弹,出厂时初速 发进行测试,得样本值 :914,920,910,953,945,912 924,940,据检验,枪弹经储存,其初速 仍服从正态分布, 且 可认为不变,问:是否可以认为这批枪弹的 显著降 底 ? 4.电池在货架上滞留时间不能太长,下面给出某商店随机选取 的8只电池的货架滞留时间(以天计): 108,124,124,106,138,163,159,134 设数据来自总体 未知,试检验假设 取

  29. 参考答案 A: 1.含镍量为3.25% 2.有显著提高 3. 4. 检验得 B: 1. 2.有显著提高 3.显著降低 4.

  30. 8.3两个正态总体参数的假设检验 设总体 总体 从两个总体中分别抽 取样本 及 样本均值与样本方差分别是 及 ,以下是有关参数 的某些假设。 8.3.1关于两个正态总体均值 的假设检验 1.若已知 及 ,则取统计量 2.若未知 及 ,假定 ,取统计量 其中 于是得到表8-3所列的两个正态总体均值的假设检验

  31. 表8-3两个正态总体均值的假设检验 在显著水平 下关于 的拒绝域 ① ② ①若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。 ②若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。

  32. 例1.某香烟厂向化验室送去两批烟丝样本,要化验尼古丁的含量,例1.某香烟厂向化验室送去两批烟丝样本,要化验尼古丁的含量, 各抽取重量相同的5例化验,得尼古丁含量分别为A:24,27,26, 21,24,B:27,28,23,31,26.设化验数据服从正态分布,A批 方差为5,B批方差为8,在显著性水平 下,检验两批烟丝 的尼古丁含量是否有显著差异。 解:提出假设 拒绝域为 选取统计量 由 计算 查表得

  33. 由于 ,所以接受 即认为两批烟丝的尼古丁含量没有显著差异。 8.3.2关于两个正态总体方差 的假设检验 1.已知 及 检验假设 设 则 作分子, 作 已知,则 已知,取 分母得统计量 其中 及 分别为 统计量 的分子及分母的样本容量。

  34. 对于显著性水平 ,由 分布表查得 及 使得 若由样本观测值计算得 ,则拒绝 ,但由 于 总大于1,而从 分布表可知,当取较小的值 时,总有 所以统计量 的值不可能小于 , 因此在显著水平 下的拒绝域只能是 。 2.若未知 及 ,则与1类似取统计量 关于单侧假设检验的拒绝域的讨论与双侧假设检验完全类似 于是,得到两个正态总体方差的假设检验表。(表8-4)

  35. 表8-4两个正态总体方差的假设检验表 在显著水平 下关于 的拒绝域 ① ② ①若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。 ②若改为 ,则统计量 或 的观测值落在拒绝域内的概率 不大于 。

  36. 例2.某中物品在处理前后分别取样分析其含脂率(%)得数据:例2.某中物品在处理前后分别取样分析其含脂率(%)得数据: 处理前:0.29,0.18,0.31,0.30,0.36,0.32,0.28,0.12, 0.30,0.27; 处理后:0.15,0.13,0.09,0.07,0.24,0.19,0.04,0.08, 0.20,0.12,0.24。 假设处理前后含脂率都服从 正态分布,检验处理前后含脂率的 方差是否不变。 解:提出假设 计算得

  37. 由于 选取统计量 取 查表得 计算得 则接受 由于 即认为处理前后方差没有显著变化。 例3.测得两批电子器材的电阻(单位: )分别为: A批:0.140,0.138,0.134,0.142,0.144,0.137 B批:0.135,0.140,0.142,0.132,0.138,0.140 设两批器材的电阻分别服从正态分布 且

  38. 相互独立,则对于显著性水平 能否认为两器材电阻 值相等? 解:本题两正态总体均值的双侧检验问题,且方差未知, 所以要分两步讨论 (1)检验假设 计算得 且 取 查 分布表得 由于 所以接受 即认为 。

  39. (2)检验假设 查 分布表得 所以接受 即认为这两批器材电阻均值相等。

  40. 习题8-3 A 1.设总体 ,总体 ,其中, 已知, 与 是分别来自 与 的样本,两样本 ,其检验统计量 相互独立,对假设检验 ,拒绝域 。 2.甲、乙两台车床加工同种产品,从这两台机床中随机抽取若 干件,测得产品直径 甲:20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9 乙:19.7,20.8,20.5,19.8,19.4,20.6,19.2 假设两台机床加工的产品直径都服从正态分布且总体方差相等, 问:甲、乙两台车床加工的产品直径有无显著差异?

  41. 3.两家工厂用同样的生产过程生产塑料,假定两个工厂的塑料3.两家工厂用同样的生产过程生产塑料,假定两个工厂的塑料 强度都服从正态分布,生产已定型且方差都已知,收集到的数 据如下: 问:两个塑料的平均强度是否相等? 4.改进某中金属的热处理方法,要检验抗拉强度 有无显著 提高,在改进前后各取12个样品,测量并计算得改进前 改进后 假定热处理前后抗拉强度都服从正态分布,取 ,问: (1)处理前后总体方差是否相等? (2)处理后抗拉强度有无显著提高?

  42. 习题8-3 B 1.设总体 ,总体 ,其中, 已知, 与 是分别来自 与 的样本,两样本 相互独立,对假设检验 其检验 统计量 ,拒绝域 . 2.针织品漂白工艺中,要考察温度对针织品断裂强度的影响, 为比较 与 的影响有无差别,在这两个温度下,分别重 复做了8次实验,得数据 时的温度:20.5,18.7,19.8,20.9,21.5,17.5,21.0, 21.2

  43. 时的温度:17.7,20.3,20.0,18.8,19.0,20.1,20.0,时的温度:17.7,20.3,20.0,18.8,19.0,20.1,20.0, 19.1 已知断裂强力服从正态分布且方差不变,问:在 时强力与在 时的强力下是否有显著差别 ? 3.两台机床生产同一种滚珠(滚珠直径服从正态分布),从中 分别抽取8个和9个比较两台车床生产的滚珠直径的方差是否有 明显差异 ? 甲车床:15.0,14.5,15.2,15.5,14.8,15.1,15.2,14.8 乙车床:15.2,15.0,14.8,15.2,15.0,15.0,14.8,15.1 14.8。

  44. 4.设有甲、乙两种安眠药,比较它们的治疗效果,以 表示失 眠者服用甲药后睡眠延长的时数,以 表示失眠者服用乙药后 睡眠延长的时数,现独立观察20个失眠者,其中10人服用甲药, 另10人服用乙药,延时纪录如下: 1.9 0.8 1.1 0.1 0.1 4.4 5.5 1.6 4.6 3.4 0.7 -1.6 -0.2 -0.1 -1.2 3.4 3.7 0.8 0.0 2.0 假定 ,试问:这两种药的疗效有无显 著差异。

  45. 5.某中橡胶配方中,原用氧化锌 ,现改为 ,今分别对两 种配方各种若干试验,测得橡胶伸长率为: 原配方:540,530,525,520,545,531,541,529,534 现配方:565,577,580,575,556,542,560,532,575,561 设同一批橡胶伸长率服从正态分布,问:在两种配方下,橡胶 率是否服从同一分布 ?

  46. 参考答案 A: 1. 2.无显著差异 3.平均强度不相等 4.方差相等,抗拉强度有显著提高 B: 1. 2.有显著差异 3.没有显著差别 4.先检验方差得方差相等;再检验均值得没有显著差别 5.(1)方差相等 (2)均值不同,则伸长率分布不同

  47. 8.4 大样本检验法 前面讨论的假设检验问题,都已知有关统计量的分布,并 由此确定拒绝域,但在许多问题中,很难得到检验统计量的分 布,有时即使能求出,使用上也很不方便,实际应用中往往求 助于统计量的极限分布.若抽取大量样本(大样本),并用检 验统计量的极限分布来近似作为其分布,由此得到的检验方法 称为大样本检验法。 8.4.1两总体均值差的大样本检验法

  48. 设有两个独立总体 ,其均值和方差分别为 和 现从每一总体中各抽取一样本,其样本容量、样本均值、样本 并且 很大,给定显著水平 方差分别记为 和 ,检验假设 若两总体均为正态分布,当 已知时,可用 检验法来检验; 当 未知但 时,可用 检验法来检验,此处总体分布未 知,即使总体为正态分布,由于 未知且 不一定相等,因 而不能用 检验,下面用大样本的方法给出此假设的检验法。

  49. 当 很大时,由中心极限定理知: ,即 近似 近似 同理,当 很大时, 近似 独立,所以 近似 分别是 的很好近似值,用 代替 ,用 代替 仍有:

  50. 近似 由此得拒绝域为 ( 很大) (1)

More Related