1 / 67

第十一章 分类变量资料 的统计推断

第十一章 分类变量资料 的统计推断. 第一节 率的抽样误差. 与总体率的区间估计. 一、率的抽样误差与标准误. 在同一总体中按一定的样本含量 n 抽样,样本率和总体率或样本率之间也存在着差异,这种差异称为 率的抽样误差 。 率的抽样误差的大小是用 率的标准误 来表示的。. 公式:. 例 11.1 :某地随机抽取了 368 名 5 岁儿童,检查得龋齿患病率为 62.50% ,试计算该地 5 岁儿童龋齿患病率的标准误。. 二、总体率的区间估计. ㈠正态分布法

Download Presentation

第十一章 分类变量资料 的统计推断

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第十一章 分类变量资料 的统计推断

  2. 第一节 率的抽样误差 与总体率的区间估计

  3. 一、率的抽样误差与标准误 • 在同一总体中按一定的样本含量n抽样,样本率和总体率或样本率之间也存在着差异,这种差异称为率的抽样误差。 • 率的抽样误差的大小是用率的标准误来表示的。

  4. 公式:

  5. 例11.1:某地随机抽取了368名5岁儿童,检查得龋齿患病率为62.50%,试计算该地5岁儿童龋齿患病率的标准误。例11.1:某地随机抽取了368名5岁儿童,检查得龋齿患病率为62.50%,试计算该地5岁儿童龋齿患病率的标准误。

  6. 二、总体率的区间估计 • ㈠正态分布法 • 样本含量n足够大, p和1-p均不太小,且np与n(1-p)均≥5时 ,

  7. ㈡ 查表法 • 当样本含量较小(如n≤50),np或n(1-p)<5时,样本率的分布呈二项分布,总体率的可信区间可据二项分布的理论求得。

  8. 第二节 率的u检验 • 应用条件:样本含量n足够大, np与n(1-p)均≥5 。 • 此时,样本率p也是以总体率为中心呈正态分布或近似正态分布的 。

  9. 一、样本率与总体率比较的u检验 • u值的计算公式为

  10. 例1 根据以往经验,一般胃溃疡病患者有20%(总体率)发生胃出血症状。现某医生观察65岁以上胃溃疡病人152例,其中48例发生胃出血,占31.6%(样本率)。问老年胃溃疡病患者是否较一般胃溃疡病患者易发生胃出血。

  11. 计算结果及判断 • 判断:u=3.58 > u0.05=1. 64(单侧), P<0.05。 • 在α=0.05水准上,拒绝H0,接受H1,差异有统计学意义。

  12. 二、两样本率比较的u检验 • 适用条件为两样本的np和n(1-p)均大于5。 • 计算公式为

  13. 例2 某中药研究所试用某种草药预防流感,观察用药组和对照组(未用药组)的流感发病率,其结果见表1。问两组流感发病率有无差别?

  14. 表1 用药组和对照组流感发病率比较

  15. 计算结果 • 本例n1=100,p1=14%,n2=120,p2=25%,pc=20%,1-pc=80%,代入公式 判断: u =2.031>u0.05=1.96,故p< 0.05。 在α=0.05水准上,拒绝H0,接受H1,差异有统计学意义。

  16. 第三节 2 检验

  17. 2 检验用途: • 1.检验两个或多个样本率及构成比之间有无差别; • 2.两属性变量间的关联分析; • 3.频数分布的拟和优度检验等。

  18. 一、四格表资料的 2 检验 • 四格表资料的检验主要用于两个样本率(或构成比)的假设检验,一般制成表1的计算格式(以阳性和阴性为例)。

  19. 表1 四格表资料 2 检验计算表

  20. 一、四格表资料的 2 检验 例:为了解某中草药预防流感的效果,将410名观察者随机分为两组,观察结果如表11-1,问两组流感发病率是否有差别?

  21. 实际数 理论数

  22. =(R-1)(C-1) (一)2 检验的基本思想 • 2 分布:连续性分布,与自由度有关。 • 2 界值表:P196 附表11-1

  23. (一)2 检验的基本思想 • 首先假设H0成立,基于此前提计算出2值,它表示观察值与理论值之间的偏离程度。 • 根据2分布,由统计量2及自由度可以确定在H0成立的条件下获得当前统计量及更极端情况的概率P。

  24. (一)2 检验的基本思想 • 如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝原假设,表示比较资料间的差异有统计学意义;否则就不能拒绝原假设,还不能认为 资料间有差异。

  25. =(R-1)(C-1) • 理论频数T (二)2 检验的步骤 • 1.基本公式法: • 条件:n>40,T>=5

  26. 1.建立假设,确定检验水准 H0 : 1=2 H1 :1 2 , =0.05 • 2.计算统计量 T11= 50.49 T12=179.51 T21= 39.51 T22=140.49

  27. =(2-1)(2-1)=13.确定P及结论 根据=1查 2 界值表,得0.01<P < 0.025,按=0.05的检验水准,拒绝H0,接受H1,可认为两组发病率差别有统计学意义,服药组流感发病率低与对照组。

  28. 2.四格表检验专用公式

  29. 表2 用药组和对照组流感发病率的比较

  30. 两种方法计算结果

  31. 基本公式 专用公式 3.四格表值的校正 • 条件: • (1)任一格的1≤T<5,且n>40时,需计算校正值。 • (2)任一格的T<1或n≤40时,用确切概率计算法。

  32. 例11.6 :

  33. 计算结果及判断 • X2=2.812 • 本例:X2 = 2.812 < X2 0.05,1=3.84, P>0.05 • 本例若对X2值不校正, X2 =4.197,得P < 0.05,结论正好相反。

  34. 某医师用甲、乙两疗法治疗小儿单纯性消化不良,治疗结果如表3,问两疗法的治愈率是否相等?

  35. 表3 甲、乙两疗法治疗小儿单纯性消化不良的治愈率比较

  36. 表3 甲、乙两疗法治疗小儿单纯性消化不良的治愈率比较

  37. 计算结果及判断 • 本例:X2=2.74 < X2 0.05,1=3.84, P>0.05 • 本例若对X2值不校正, X2 =4.06,得P < 0.05,结论正好相反。

  38. 若b+c>40,公式为: 若b+c≤40,需计算X2校正值: =1 二、配对四格表资料的2检验 • 用途:用于配对定性资料差异性的假设检验 。

  39. 二、配对四格表资料的2检验 • 例11.7某医师对55例类风湿关节炎患者,分别采用免疫比浊法(ITA)与乳胶凝集试验(LAT)法检测类风湿因子( RF ),结果见表11-3,问两种方法检测效果有无差别?

  40. 表11-3 两种方法检测RF结果比较

  41. 检验步骤 H0 :B=C H1 :BC =0.05 根据=1查2界值表,得0.005<P < 0.01,按=0.05的检验水准,拒绝H0,接受H1,可认为两种方法检出率有差别,ITA检出阳性率高于LAT。

  42. 例3 有28份白喉病人的咽喉涂抹标本,把每份标本分别接种在甲、乙两种白喉杆菌培养基上,观察两种白喉杆菌生长情况,“+”号表示生长,“-”号表示不生长,结果如表4。问两种白喉杆菌培养基的效果有无差别?

  43. 表4甲、乙两种白喉杆菌培养基的培养结果

  44. 本例检验步骤如下: (1)建立检验假设 H0:总体B=C,即两种白喉杆菌培养基的效果相同 H1:总体B≠C,即两种白喉杆菌培养基的效果不同 α=0.05 (2)计算2值 本例b=9,c=1,b+c<40,

  45. (3)确定P值及推断结论 • 本例X2=4.90>X2=3.84,P<0.05在α=0.05的水准上,拒绝H0,接收H1,差异有统计学意义。可认为甲、乙两种白喉杆菌培养基的效果有差别,甲培养基培养效果优于乙培养基。

  46. 三、行×列表的2检验 • 行×列表(R×C表)的检验主要用于解决多个样本率或多个样本构成比的比较以及有序分类资料的关联性检验。 • 基本公式 • =(R-1)(C-1)

  47. 简化公式: • 式中n为总例数,A为每格子的实际频数,nR、nC分别为与某格子实际频数(A)同行、同列的合计数。 =(R-1)(C-1)

  48. (一)多个样本率的比较

  49. 表11-4 不同季节呼吸道感染率比较

  50. H0 :四个季节呼吸道感染率相同 H1 :四个季节呼吸道感染率不同或不全相同 =0.05

More Related