1 / 30

独立性检验

独立性检验. 江门市杜阮华侨中学 杨清孟. 独立性检验. 分类变量 : 变量的不同 ” 值 ” 表示个体所属的不同 类别. 如 : 性别 , 是否吸烟 , 宗教信仰 , 国籍等. 日常生活中我们关心这样一些问题: 吸烟与患肺癌之间有无关系? 秃顶与心脏病之间有无关系? 性别与喜欢数学课之间有无关系? 以上问题能否用回归分析的知识来解决?为什么?. 列联表:两个分类变量的 频数表. 例 1. 为了调查吸烟是否对患肺癌有影响,某肿瘤研究院随机的调查了 9965 人,得到如下结果:. 问:吸烟是否对患肺癌有影响?.

adele
Download Presentation

独立性检验

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 独立性检验 江门市杜阮华侨中学 杨清孟

  2. 独立性检验

  3. 分类变量:变量的不同”值”表示个体所属的不同分类变量:变量的不同”值”表示个体所属的不同 类别. 如:性别,是否吸烟,宗教信仰,国籍等 日常生活中我们关心这样一些问题: • 吸烟与患肺癌之间有无关系? • 秃顶与心脏病之间有无关系? • 性别与喜欢数学课之间有无关系? 以上问题能否用回归分析的知识来解决?为什么?

  4. 列联表:两个分类变量的频数表 例1.为了调查吸烟是否对患肺癌有影响,某肿瘤研究院随机的调查了9965人,得到如下结果: 问:吸烟是否对患肺癌有影响? 解 从图表的比例可以看出:吸烟与不吸烟可能对患肺癌的可能存在差异,我们再通过不同的图表来分析

  5. 患肺癌 三维柱形图

  6. 二维条形图

  7. 等高条形图

  8. 上面我们通过图形的分析,初步判断吸烟与患肺癌有关系。那么,事实是否如此呢?我们需要用统计的观点来考察这个问题上面我们通过图形的分析,初步判断吸烟与患肺癌有关系。那么,事实是否如此呢?我们需要用统计的观点来考察这个问题 我们首先设基本事件为: H0:吸烟与患肺癌没有关系 我们下面就一般关系做一个推断

  9. 如果吸烟与患肺癌没有关系,则: a(c+d)≈c(a+b) ad-bc≈0 因此,| ad-bc |越小,说明吸烟与患肺炎之间没有关系。

  10. 为了使样本空间有一定的代表性,我们引入一个随机变量为了使样本空间有一定的代表性,我们引入一个随机变量 (n=a+b+c+d(样本容量)) 总计的四项 若,H0成立,(吸烟与患肺癌无关)则K应该很小,通过计算我们可以得到K的观测值: k=K2=56.632

  11. 表1-12 说明:根据统计学家的分析: P(K2≥10.828)≈0.001

  12. 上面的利用K2来检验“两个变量有关系”的方法成为:独立性检验上面的利用K2来检验“两个变量有关系”的方法成为:独立性检验

  13. 说明: 两个变量X与Y独立性检验的一般方法: 1.设两个变量的值域分别为{x1,x2}{y1.,y2},列频数列联表 2.假设“X与Y无关” 3.计算变量X与Y的评判标准K2的观测值 4.利用统计概率表1-12查阅发生的概率 5.得出概率结论

  14. 根据列联表中的数据,得到的 观测值k为 例1.在研究某种新药对小白兔的防治效果时,得到下表 数据: 试分析新药对防治小白兔是否有效? 解:假设“新药对防治小白兔无效” 99.5%的把握判定新药对防治小白兔是有效的.

  15. 例2.某心脏病医院为了研究秃顶是否与心脏病有关,对665名男性心脏和772名其他病人做了研究,是否可以以99%的把握认为秃顶与心脏病有关?例2.某心脏病医院为了研究秃顶是否与心脏病有关,对665名男性心脏和772名其他病人做了研究,是否可以以99%的把握认为秃顶与心脏病有关? 智慧的闪光!

  16. 解:假设“秃顶与患心脏病无关” 所以有99%的把握认为”秃顶与患心脏病有关”

  17. 秃顶=心脏病 研究人员表示,掉头发在很大程度上是由日渐增大的工作压力、不能充分休息、不正确饮食和睡眠不足等因素引起的。在接受调查的人群中,有41%的受秃头威胁的人表示,他们一日睡觉时间不足4小时

  18. 若要推断的结论为H1:”X与Y有关系”,可如下操作:若要推断的结论为H1:”X与Y有关系”,可如下操作: 1.通过三维柱形图和二维条形图,可以粗略地判断两个 变量是否有关系,但是这种判断不精确.

  19. 主对角线 副对角线 (1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与 副对角线上两个柱形高度的乘积bc相差越大,H1成立的 可能性就越大

  20. (2)在二维条形图中,两个比例的值相差越大,H1成立的可能(2)在二维条形图中,两个比例的值相差越大,H1成立的可能 性就越大

  21. 具体做法是: 根据观测数据计算由 给出的随机变量K2的值k,其值越大,说明”X与Y有关系” 成立的可能性越大.当得到的观测数据a,b,c,d都不小于 5时,可以通过查表来断言”X与Y有关系”的可信程度 2.利用独立性检验来考察两个分类变量是否有关系, 并且能较精确地给出这种判断的可靠程度.

  22. 独立性检验 通过公式计算

  23. 练习1.在500人身上试验某种血清预防感冒作用,结果一年中还是有242人感冒,另外500名未用血清的人一年中也有284人感冒。记录作比较,问:该种血清能否起到预防感冒的作用?练习1.在500人身上试验某种血清预防感冒作用,结果一年中还是有242人感冒,另外500名未用血清的人一年中也有284人感冒。记录作比较,问:该种血清能否起到预防感冒的作用?

  24. 练习1.在500人身上试验某种血清预防感冒作用,结果一年中还是有242人感冒,另外500名未用血清的人一年中也有284人感冒。记录作比较,问:该种血清能否起到预防感冒的作用?练习1.在500人身上试验某种血清预防感冒作用,结果一年中还是有242人感冒,另外500名未用血清的人一年中也有284人感冒。记录作比较,问:该种血清能否起到预防感冒的作用? 感冒情况 是否用血清

  25. 练习2:为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,抽样调查了采用口服和注射方式共193个病人中,采用口服方式的98人中有效的有58人,注射而且有效的有64人能否作出药的效果和给药方式有关的结论?练习2:为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,抽样调查了采用口服和注射方式共193个病人中,采用口服方式的98人中有效的有58人,注射而且有效的有64人能否作出药的效果和给药方式有关的结论?

  26. 效果 有效 无效 合计 用药方式 口服 58 40 98 注射 64 31 95 合计 122 71 193 练习2:为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,抽样调查了采用口服和注射方式共193个病人中,采用口服方式的98人中有效的有58人,注射而且有效的有64人能否作出药的效果和给药方式有关的结论?

  27. 练习3:气管炎是一种常见的呼吸道疾病,医药研练习3:气管炎是一种常见的呼吸道疾病,医药研 究人员对两种中草药治疗慢性气管炎的疗效进 行对比,所得数据如图所示,问:它们的疗效 有无差异 效果 用药情况

More Related