1 / 38

医学统计学及其软件包

医学统计学及其软件包. 第十一章 非参数统计. 上海第二医科大学 生物统计教研室. 非参数统计概念. 在统计推断中,如总体均数估计, t 检验,回归系数的假设检验等,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知,统计推断的目的就是对这些未知参数进行估计或检验。这类统计推断方法称为参数统计。 非参数统计是一种不依赖总体分布的具体形式的统计方法. 非参数统计主要优点. 优点: ( 1 )适用于任何总体分布。 ( 2 )计算简便。 ( 3 )易于理解和掌握。

twila
Download Presentation

医学统计学及其软件包

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 医学统计学及其软件包 第十一章 非参数统计 上海第二医科大学 生物统计教研室

  2. 非参数统计概念 • 在统计推断中,如总体均数估计,t检验,回归系数的假设检验等,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知,统计推断的目的就是对这些未知参数进行估计或检验。这类统计推断方法称为参数统计。 • 非参数统计是一种不依赖总体分布的具体形式的统计方法

  3. 非参数统计主要优点 • 优点: (1)适用于任何总体分布。 (2)计算简便。 (3)易于理解和掌握。 (4)可应用于不能或未加以精确测量的资料,如等级资料。

  4. 非参数统计主要缺点 缺点: 对适宜用参数方法的资料,若用非参数处理,常损失部分信息,降低效率。

  5. 非参数统计适用情况 适用于: (1)资料不具备参数方法所需条件, 如:未知分布类型的资料或偏态资料,方差不齐资料的总体均数的比较。 (2)不能或未加以精确测量的资料, 如:等级资料,不能测量的过大或过小数据。

  6. 主要的非参数检验方法 (1)配对资料:符号秩和检验 (相当于配对t检验) (2)两组比较:Wilcoxon 秩和检验 (相当于团体t检验) (3)多组比较:K-W检验 (相当于方差分析)

  7. 按等级分组资料的假设检验 用非参数方法统计。 根据不同情况用: 符号秩和检验(配对资料), Wilcoxon 秩和检验(两组比较), K-W检验(多组比较)。

  8. 第一节 符号检验 根据正、负符号个数的假设检验方法称为符号检验(sign test)。 首先需将原始观察值按设定的规则,转换成正、负号,然后计数正、负号的个数作出检验。 该检验可用于总体分布不服从正态分布或分布不明的配对资料;特别有时当配对比较的结果只能定性地表达(如颜色深浅, 程度强弱),而不能获得具体数字时。

  9. 例11-2 表11.2 两种温度下的显色结果 ────────────────────────────────────────────────── ── 样品 温度 ────────────────────────────── 1 2 3 4 5 6 7 8 9 ────────────────────────────────── 80 深 深 深 浅 深 深 深 深 深 20 浅 浅 浅 深 浅 浅 浅 浅 浅 ────────────────────────────────── 符号 + + + - + + + + + ────────────────────────────────────────────────

  10. H0:两种温度下显色效应无差别 H1:两种温度下显色效应有差别 规定80℃时颜色比20℃时深为“+”,80℃时颜色比20℃时浅为“-”。计算正、负符号个数, 得:n+=8, n-=1 代入(11.1)式, χ2=(|n+-n-|-1)2/(n++n-) 得: χ2=(|8-1|-1)2/(8+1)=4, 自由度,df=1 现χ2> ,故P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义, 即不同温度时的显色效应有差别。

  11. 例11.1表11-1 针刺前后痛阀的变化 得:n+=6, n-=3 代入(11.1)式, χ2=(|n+-n-|-1)2/(n++n-) 得: χ2=(|6-3|-1)2/(6+3)=0.444, 自由度,df=1 现χ2< ,故P>0.05,不拒绝H0, 针刺前后痛阈变化无统计学意义。

  12. 第二节 符号秩和检验 用于有具体数字的配对资料。相当于配对t检验。效率较符号检验法高。 例11.3 10名患者注射青、链霉素前后胆红素的改变值(mg%)见表11.3,问治疗前后胆红素值有否差异?

  13. 符号秩和检验步骤 (1)先求出每对数据的差数,见表11.3第4行。 (2)按差数绝对值由小到大排列并给秩,所谓秩就是从小到大的排列次序,见表11.3第五行。 (3)分别计算正负差数的秩和,记为T+及T-,并以T表示其中之较小者。此处 T+=3+5+6+7+8+9+10=48 T-=1+4+2=7 T=min(T+,T-)=7

  14. 符号秩和检验步骤 (4)查附表十,符号秩和检验用T界值表。(P401) 当T>T0.05时, P>0.05 当T0.01<T≤T0.05时 , 0.01<P≤0.05 当T≤T0.01时, P≤0.01 本例:查附表十得n=10, T0.05=8, T0.01=3,现T=7<T0.05 所以P<0.05,拒绝H0。认为治疗前后胆红素值的变化有统计学意义。

  15. 本例如用符号检验, n+=7,n-=3,χ2=0.9,χ2<χ20.05(1) , P>0.05, 可见符号秩和检验的效率较高。 当出现差数为0时,差数为零的项在本检验中丢弃不用。

  16. 符号秩和检验步骤 当n>25时,可按(11.2)式求U值。 U服从标准正态分布,故有: U≥1.96时,P≤0.05; U≥2.58时,P≤0.01; U<1.96时,P>0.05

  17. 符号秩和检验步骤 注意: 1)当有相同的差值绝对值时,给以平均秩次。 如果第2个病例差值为15,它和第10个病例的差值-15的绝对值相同。因此这二个病例的秩次都取2.5。 2)连续性校正:分子取绝对值后,再减去0.5。称为连续 性校正。一般影响较小,常可省去。 3)如果相同秩次较多时,式(11.2)分母的根号里再减去 某校正式。称为对于相同秩次的校正。

  18. 第三节 两样本秩和检验 两样本秩和检验(rank sum test)又称Wilcoxon秩和检验,适用于未配对样本的差异显著性检验。 相当于团体t检验。 例11.5测得克山病流行区的健康人13人和急性克山病患者11人的血磷值(mg%)见表11.4,问两组血磷值的差异有无统计学意义?

  19. 两样本秩和检验步骤 • 先将两样本混合由小到大排列统一编秩,相同的数据一律给以平均秩次。 • 分别以n1,n2代表两样本含量,并规定n1≤n2 ,将含量为n1组别的秩和记为T1,如n1=n2,可任取一组的秩和为T1。 • 然后据n1与n2的值查秩和检验T界值表(附表十一)作判断。如算得的T1值在相应概率水平P值一行的上下界值范围内时,P就大于表中的概率水平;反之,则概率水平小于表中的P。

  20. 两样本秩和检验步骤 本例病人组的例数较少故取病人组为n1=11,健康人组n2=13 n1组的T1为: T1=7+8+11+……+23+24=176.5 查附表十一,当n1=11,n2-n1=2时,表中p=0.05一行的上下界限为103~172,p=0.01一行的上下界限为94~181,T1在P=0.05行的界限外,但在P=0.01行的界限内,所以P<0.05。 拒绝H0。认为两组血磷值的差异有统计学意义。

  21. 两样本秩和检验步骤 n2-n1 N1 ----------------------------------------- (较小者) 0 1 2 3 ----------------------------- 11 108-167 (P=0.10) 103-172 (p=0.05) 97-178 (p=0.02) 94-181 (p=0.01)

  22. 两样本秩和检验步骤 当n1或n2-n1,已超出附表十一的范围,可用式(11.3)的 U检验。 U服从标准正态分布,故可据U0.05=1.96, U0.01=2.58,作出统计推断。 如相同秩次较多,也要进行对于相同秩次的校正。

  23. 例11.6 本例资料没有具体数据,而只有相对大小,可用秩和检验法。 例11.7 本例资料中有些数值都小于某值,但没有确定之值,可用秩和检验法。

  24. 第四节 完全随机设计秩和检验 用于两个以上样本的比较,相当于方差分析。本法又称为Kruskal Wallis 检验(Kruskal Wallis test)( K-W检验)。 例11.9研究白血病时测定四组鼠脾中DNA的含量,结果见表11.9,问各组DNA含量有否差别?

  25. K-W检验计算步骤 (1)各样本数据混合,由小到大排列并给以秩次; (2)计算各样本之秩和Ti; (3)计算H值如公式(11.4); 其中ni为各样本含量, n为总例数,有n=∑ni 当k=3,各个样本含量均≤5时,可由附表十二查得H临界值,H0.01 ,H0.05 。 当H<H0.05时,P>0.05, H≥H0.05时,P≤0.05, H≥H0.01时, P≤0.01。

  26. K-W检验计算步骤 当k>3或各样本含量超过附表十二范围时,由于H分布近似于χ2分布, 其自由度为k-1,可查χ2值表(附表三),作出统计推断。 当具有相同观察值的例数较多时,H值需按(11.5)式校正,校正系数C由(11.6)式求得。

  27. K-W检验计算步骤 本例:T1=216,T2=134,T3=123.5,T4=54.5 n=8+7+9+8=32。 求得H值=111.8991 因有相等值,故需求校正HC值,由表11.10计算 C值=0.9980 HC=111.8991/0.9980=111.939 查χ2值表(附表三), df=k-1=3时, χ20.01(3) =11.345,现χ2>χ20.01 ,所以P<0.01,拒绝H0,认为各组鼠脾中DNA含量的差异有统计学意义。 。

  28. 第五节 随机单位组设计秩和检验 • 当试验按随机单位组设计时,欲作秩和检验可用本法,称为Friedman秩和检验(Friedman test)。 例11.11 7名受试者接受A,B,C三种镇痛药物的试验, 每人均按痛觉减轻程度的多少评价其镇痛作用,减轻多记为3,次之为2,减轻少记为1,结果见表11.11 试分析三种药物的镇痛效果有无差别?

  29. Friedman秩和检验计算步骤 (1)在各个单位组对k个处理的观察值由小到大排列并指定秩次; (2)计算k个处理的秩次和T1 ,T2 ,……,Tk ; (3)用公式(11.7)计算H值 当k=3,b≤15或k=4,b≤8时,可由附表十三查得其界值, 当H<H0.05时,P>0.05, H≥H0.05时,P≤0.05, H≥H0.01时, P≤0.01。

  30. Friedman秩和检验计算步骤 当k,b超过附表十三范围时,H近似于χ2分布,可按df=k-1查χ2值表(附表三)作统计判断。 本例:b=7,k=3,由(11.7)式得H=7.14 查附表十三,当b=7,k=3时,H0.05=7.14,H0.01=8.86,现H=H0.05 ,所以P=0.05,拒绝H0,认为三种药物的镇痛效果的差异有统计学意义。

  31. 第六节 按等级分组资料的秩和检验 医学资料中有不少观察结果介于定性和定量之间,常称为半定量资料。 如病人的疗效可按恶化,无效,好转和痊愈4个等级;皮下注射后的局部反应可按++++,+++,++,+,±和-,分为6个等级,某临床症状或体征的严重程度可分为无,轻,中和重4个等级。这些资料又称为等级资料。 等级资料的检验必须用非参数方法。

  32. 第六节 按等级分组资料的秩和检验 两组比较时可用两样本秩和检验方法。 两组以上比较时用完全随机化设计的秩和检验。 由于相同的数据较多,样本量较大,可用正态近似(两组比较时),或卡方近似(两组以上比较时);并且必须进行相等秩次的校正。

  33. 表11.12 某药三种剂量对某病的疗效 ──────────────────────────────────── 药物剂量 无效 好转 显效 小计 mi ──────────────────────────────────── 甲 21 7 4 32 乙 13 10 6 29 丙 15 13 13 41 ──────────────────────────────────── 小计 ni 49 30 23 102 秩次范围 1-49 50-79 80-102 平均秩次RMj 25 64.5 91 ────────────────────────────────────

  34. 甲剂量之秩和=21×25+7×64.5+4×91=1340.5 同样有:乙剂量之秩和=1516, 丙剂量之秩和=2396.5, H=5.6578 修正因子:C=0.8523 HC=5.6578/0.8523=6.6387 df=3-1=2,由χ2界值表(附表三)χ20.05=5.99, χ20.01=9.21。现χ2>χ20.05 ,故P<0.05,拒绝H0,认为三种剂量的疗效不相同。

  35. 第八节 秩相关 秩相关(rank correlation)又称等级相关,它是一种分析x,y两个变量的等级间是否相关的方法。 适用于某些不能准确地测量指标值而只能以严重程度,名次先后,反应大小等定出等级的资料,也适用于某些不呈正态分布或难于判断分布类型的资料。 最常用的是Spearman等级相关分析,其相关程度大小用等级相关系数 rs来表示。

  36. 秩相关的计算 例11.16某单位研究2~7岁急性白血病患儿的血小板数与出血症状之间的关系,得资料见表11.17第1~3列,问两者间有无关系? (1)将x,y分别由小到大排列,并给以秩次。 (2)求成对数据(x,y)的秩次差值d。 (3)计算rs,再据附表十四作出统计推断。 rs=1-6∑d2/[n(n2-1)] (11.14) n--观察值的对子数。

  37. 秩相关的计算 本例:∑d2=378 rs=1-6×378/[12(122-1)]=-0.322 查附表十四,n=12时,rs0.05(12)=0.578,现|rs|<rs0.05 ,所以P>0.05,不拒绝H0 ,认为2~7岁急性白血病患者的血小板与出血症状间相关无统计学意义。

  38. 实 例 比较两种药物治疗哮喘的疗效: 1=A药,2=B药 S0:治疗前哮喘情况0=无,1=轻,2=中,3=重 S1:治疗后哮喘情况0=无,1=轻,2=中,3=重 1)检验治疗前两组哮喘情况是否可比。 2)分别检验两种药物治疗后哮喘情况是否改善。 3)检验两种药物治疗后哮喘改善情况是否有差异。

More Related