300 likes | 455 Views
独立性检验. 江门市杜阮华侨中学 杨清孟. 独立性检验. 分类变量 : 变量的不同 ” 值 ” 表示个体所属的不同 类别. 如 : 性别 , 是否吸烟 , 宗教信仰 , 国籍等. 日常生活中我们关心这样一些问题: 吸烟与患肺癌之间有无关系? 秃顶与心脏病之间有无关系? 性别与喜欢数学课之间有无关系? 以上问题能否用回归分析的知识来解决?为什么?. 列联表:两个分类变量的 频数表. 例 1. 为了调查吸烟是否对患肺癌有影响,某肿瘤研究院随机的调查了 9965 人,得到如下结果:. 问:吸烟是否对患肺癌有影响?.
E N D
独立性检验 江门市杜阮华侨中学 杨清孟
分类变量:变量的不同”值”表示个体所属的不同分类变量:变量的不同”值”表示个体所属的不同 类别. 如:性别,是否吸烟,宗教信仰,国籍等 日常生活中我们关心这样一些问题: • 吸烟与患肺癌之间有无关系? • 秃顶与心脏病之间有无关系? • 性别与喜欢数学课之间有无关系? 以上问题能否用回归分析的知识来解决?为什么?
列联表:两个分类变量的频数表 例1.为了调查吸烟是否对患肺癌有影响,某肿瘤研究院随机的调查了9965人,得到如下结果: 问:吸烟是否对患肺癌有影响? 解 从图表的比例可以看出:吸烟与不吸烟可能对患肺癌的可能存在差异,我们再通过不同的图表来分析
患肺癌 三维柱形图
上面我们通过图形的分析,初步判断吸烟与患肺癌有关系。那么,事实是否如此呢?我们需要用统计的观点来考察这个问题上面我们通过图形的分析,初步判断吸烟与患肺癌有关系。那么,事实是否如此呢?我们需要用统计的观点来考察这个问题 我们首先设基本事件为: H0:吸烟与患肺癌没有关系 我们下面就一般关系做一个推断
如果吸烟与患肺癌没有关系,则: a(c+d)≈c(a+b) ad-bc≈0 因此,| ad-bc |越小,说明吸烟与患肺炎之间没有关系。
为了使样本空间有一定的代表性,我们引入一个随机变量为了使样本空间有一定的代表性,我们引入一个随机变量 (n=a+b+c+d(样本容量)) 总计的四项 若,H0成立,(吸烟与患肺癌无关)则K应该很小,通过计算我们可以得到K的观测值: k=K2=56.632
表1-12 说明:根据统计学家的分析: P(K2≥10.828)≈0.001
上面的利用K2来检验“两个变量有关系”的方法成为:独立性检验上面的利用K2来检验“两个变量有关系”的方法成为:独立性检验
说明: 两个变量X与Y独立性检验的一般方法: 1.设两个变量的值域分别为{x1,x2}{y1.,y2},列频数列联表 2.假设“X与Y无关” 3.计算变量X与Y的评判标准K2的观测值 4.利用统计概率表1-12查阅发生的概率 5.得出概率结论
根据列联表中的数据,得到的 观测值k为 例1.在研究某种新药对小白兔的防治效果时,得到下表 数据: 试分析新药对防治小白兔是否有效? 解:假设“新药对防治小白兔无效” 99.5%的把握判定新药对防治小白兔是有效的.
例2.某心脏病医院为了研究秃顶是否与心脏病有关,对665名男性心脏和772名其他病人做了研究,是否可以以99%的把握认为秃顶与心脏病有关?例2.某心脏病医院为了研究秃顶是否与心脏病有关,对665名男性心脏和772名其他病人做了研究,是否可以以99%的把握认为秃顶与心脏病有关? 智慧的闪光!
解:假设“秃顶与患心脏病无关” 所以有99%的把握认为”秃顶与患心脏病有关”
? 秃顶=心脏病 研究人员表示,掉头发在很大程度上是由日渐增大的工作压力、不能充分休息、不正确饮食和睡眠不足等因素引起的。在接受调查的人群中,有41%的受秃头威胁的人表示,他们一日睡觉时间不足4小时
若要推断的结论为H1:”X与Y有关系”,可如下操作:若要推断的结论为H1:”X与Y有关系”,可如下操作: 1.通过三维柱形图和二维条形图,可以粗略地判断两个 变量是否有关系,但是这种判断不精确.
主对角线 副对角线 (1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与 副对角线上两个柱形高度的乘积bc相差越大,H1成立的 可能性就越大
(2)在二维条形图中,两个比例的值相差越大,H1成立的可能(2)在二维条形图中,两个比例的值相差越大,H1成立的可能 性就越大
具体做法是: 根据观测数据计算由 给出的随机变量K2的值k,其值越大,说明”X与Y有关系” 成立的可能性越大.当得到的观测数据a,b,c,d都不小于 5时,可以通过查表来断言”X与Y有关系”的可信程度 2.利用独立性检验来考察两个分类变量是否有关系, 并且能较精确地给出这种判断的可靠程度.
独立性检验 通过公式计算
练习1.在500人身上试验某种血清预防感冒作用,结果一年中还是有242人感冒,另外500名未用血清的人一年中也有284人感冒。记录作比较,问:该种血清能否起到预防感冒的作用?练习1.在500人身上试验某种血清预防感冒作用,结果一年中还是有242人感冒,另外500名未用血清的人一年中也有284人感冒。记录作比较,问:该种血清能否起到预防感冒的作用?
练习1.在500人身上试验某种血清预防感冒作用,结果一年中还是有242人感冒,另外500名未用血清的人一年中也有284人感冒。记录作比较,问:该种血清能否起到预防感冒的作用?练习1.在500人身上试验某种血清预防感冒作用,结果一年中还是有242人感冒,另外500名未用血清的人一年中也有284人感冒。记录作比较,问:该种血清能否起到预防感冒的作用? 感冒情况 是否用血清
练习2:为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,抽样调查了采用口服和注射方式共193个病人中,采用口服方式的98人中有效的有58人,注射而且有效的有64人能否作出药的效果和给药方式有关的结论?练习2:为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,抽样调查了采用口服和注射方式共193个病人中,采用口服方式的98人中有效的有58人,注射而且有效的有64人能否作出药的效果和给药方式有关的结论?
效果 有效 无效 合计 用药方式 口服 58 40 98 注射 64 31 95 合计 122 71 193 练习2:为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,抽样调查了采用口服和注射方式共193个病人中,采用口服方式的98人中有效的有58人,注射而且有效的有64人能否作出药的效果和给药方式有关的结论?
练习3:气管炎是一种常见的呼吸道疾病,医药研练习3:气管炎是一种常见的呼吸道疾病,医药研 究人员对两种中草药治疗慢性气管炎的疗效进 行对比,所得数据如图所示,问:它们的疗效 有无差异 效果 用药情况