380 likes | 589 Views
医学统计学及其软件包. 第十一章 非参数统计. 上海第二医科大学 生物统计教研室. 非参数统计概念. 在统计推断中,如总体均数估计, t 检验,回归系数的假设检验等,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知,统计推断的目的就是对这些未知参数进行估计或检验。这类统计推断方法称为参数统计。 非参数统计是一种不依赖总体分布的具体形式的统计方法. 非参数统计主要优点. 优点: ( 1 )适用于任何总体分布。 ( 2 )计算简便。 ( 3 )易于理解和掌握。
E N D
医学统计学及其软件包 第十一章 非参数统计 上海第二医科大学 生物统计教研室
非参数统计概念 • 在统计推断中,如总体均数估计,t检验,回归系数的假设检验等,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知,统计推断的目的就是对这些未知参数进行估计或检验。这类统计推断方法称为参数统计。 • 非参数统计是一种不依赖总体分布的具体形式的统计方法
非参数统计主要优点 • 优点: (1)适用于任何总体分布。 (2)计算简便。 (3)易于理解和掌握。 (4)可应用于不能或未加以精确测量的资料,如等级资料。
非参数统计主要缺点 缺点: 对适宜用参数方法的资料,若用非参数处理,常损失部分信息,降低效率。
非参数统计适用情况 适用于: (1)资料不具备参数方法所需条件, 如:未知分布类型的资料或偏态资料,方差不齐资料的总体均数的比较。 (2)不能或未加以精确测量的资料, 如:等级资料,不能测量的过大或过小数据。
主要的非参数检验方法 (1)配对资料:符号秩和检验 (相当于配对t检验) (2)两组比较:Wilcoxon 秩和检验 (相当于团体t检验) (3)多组比较:K-W检验 (相当于方差分析)
按等级分组资料的假设检验 用非参数方法统计。 根据不同情况用: 符号秩和检验(配对资料), Wilcoxon 秩和检验(两组比较), K-W检验(多组比较)。
第一节 符号检验 根据正、负符号个数的假设检验方法称为符号检验(sign test)。 首先需将原始观察值按设定的规则,转换成正、负号,然后计数正、负号的个数作出检验。 该检验可用于总体分布不服从正态分布或分布不明的配对资料;特别有时当配对比较的结果只能定性地表达(如颜色深浅, 程度强弱),而不能获得具体数字时。
例11-2 表11.2 两种温度下的显色结果 ────────────────────────────────────────────────── ── 样品 温度 ────────────────────────────── 1 2 3 4 5 6 7 8 9 ────────────────────────────────── 80 深 深 深 浅 深 深 深 深 深 20 浅 浅 浅 深 浅 浅 浅 浅 浅 ────────────────────────────────── 符号 + + + - + + + + + ────────────────────────────────────────────────
H0:两种温度下显色效应无差别 H1:两种温度下显色效应有差别 规定80℃时颜色比20℃时深为“+”,80℃时颜色比20℃时浅为“-”。计算正、负符号个数, 得:n+=8, n-=1 代入(11.1)式, χ2=(|n+-n-|-1)2/(n++n-) 得: χ2=(|8-1|-1)2/(8+1)=4, 自由度,df=1 现χ2> ,故P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义, 即不同温度时的显色效应有差别。
例11.1表11-1 针刺前后痛阀的变化 得:n+=6, n-=3 代入(11.1)式, χ2=(|n+-n-|-1)2/(n++n-) 得: χ2=(|6-3|-1)2/(6+3)=0.444, 自由度,df=1 现χ2< ,故P>0.05,不拒绝H0, 针刺前后痛阈变化无统计学意义。
第二节 符号秩和检验 用于有具体数字的配对资料。相当于配对t检验。效率较符号检验法高。 例11.3 10名患者注射青、链霉素前后胆红素的改变值(mg%)见表11.3,问治疗前后胆红素值有否差异?
符号秩和检验步骤 (1)先求出每对数据的差数,见表11.3第4行。 (2)按差数绝对值由小到大排列并给秩,所谓秩就是从小到大的排列次序,见表11.3第五行。 (3)分别计算正负差数的秩和,记为T+及T-,并以T表示其中之较小者。此处 T+=3+5+6+7+8+9+10=48 T-=1+4+2=7 T=min(T+,T-)=7
符号秩和检验步骤 (4)查附表十,符号秩和检验用T界值表。(P401) 当T>T0.05时, P>0.05 当T0.01<T≤T0.05时 , 0.01<P≤0.05 当T≤T0.01时, P≤0.01 本例:查附表十得n=10, T0.05=8, T0.01=3,现T=7<T0.05 所以P<0.05,拒绝H0。认为治疗前后胆红素值的变化有统计学意义。
本例如用符号检验, n+=7,n-=3,χ2=0.9,χ2<χ20.05(1) , P>0.05, 可见符号秩和检验的效率较高。 当出现差数为0时,差数为零的项在本检验中丢弃不用。
符号秩和检验步骤 当n>25时,可按(11.2)式求U值。 U服从标准正态分布,故有: U≥1.96时,P≤0.05; U≥2.58时,P≤0.01; U<1.96时,P>0.05
符号秩和检验步骤 注意: 1)当有相同的差值绝对值时,给以平均秩次。 如果第2个病例差值为15,它和第10个病例的差值-15的绝对值相同。因此这二个病例的秩次都取2.5。 2)连续性校正:分子取绝对值后,再减去0.5。称为连续 性校正。一般影响较小,常可省去。 3)如果相同秩次较多时,式(11.2)分母的根号里再减去 某校正式。称为对于相同秩次的校正。
第三节 两样本秩和检验 两样本秩和检验(rank sum test)又称Wilcoxon秩和检验,适用于未配对样本的差异显著性检验。 相当于团体t检验。 例11.5测得克山病流行区的健康人13人和急性克山病患者11人的血磷值(mg%)见表11.4,问两组血磷值的差异有无统计学意义?
两样本秩和检验步骤 • 先将两样本混合由小到大排列统一编秩,相同的数据一律给以平均秩次。 • 分别以n1,n2代表两样本含量,并规定n1≤n2 ,将含量为n1组别的秩和记为T1,如n1=n2,可任取一组的秩和为T1。 • 然后据n1与n2的值查秩和检验T界值表(附表十一)作判断。如算得的T1值在相应概率水平P值一行的上下界值范围内时,P就大于表中的概率水平;反之,则概率水平小于表中的P。
两样本秩和检验步骤 本例病人组的例数较少故取病人组为n1=11,健康人组n2=13 n1组的T1为: T1=7+8+11+……+23+24=176.5 查附表十一,当n1=11,n2-n1=2时,表中p=0.05一行的上下界限为103~172,p=0.01一行的上下界限为94~181,T1在P=0.05行的界限外,但在P=0.01行的界限内,所以P<0.05。 拒绝H0。认为两组血磷值的差异有统计学意义。
两样本秩和检验步骤 n2-n1 N1 ----------------------------------------- (较小者) 0 1 2 3 ----------------------------- 11 108-167 (P=0.10) 103-172 (p=0.05) 97-178 (p=0.02) 94-181 (p=0.01)
两样本秩和检验步骤 当n1或n2-n1,已超出附表十一的范围,可用式(11.3)的 U检验。 U服从标准正态分布,故可据U0.05=1.96, U0.01=2.58,作出统计推断。 如相同秩次较多,也要进行对于相同秩次的校正。
例11.6 本例资料没有具体数据,而只有相对大小,可用秩和检验法。 例11.7 本例资料中有些数值都小于某值,但没有确定之值,可用秩和检验法。
第四节 完全随机设计秩和检验 用于两个以上样本的比较,相当于方差分析。本法又称为Kruskal Wallis 检验(Kruskal Wallis test)( K-W检验)。 例11.9研究白血病时测定四组鼠脾中DNA的含量,结果见表11.9,问各组DNA含量有否差别?
K-W检验计算步骤 (1)各样本数据混合,由小到大排列并给以秩次; (2)计算各样本之秩和Ti; (3)计算H值如公式(11.4); 其中ni为各样本含量, n为总例数,有n=∑ni 当k=3,各个样本含量均≤5时,可由附表十二查得H临界值,H0.01 ,H0.05 。 当H<H0.05时,P>0.05, H≥H0.05时,P≤0.05, H≥H0.01时, P≤0.01。
K-W检验计算步骤 当k>3或各样本含量超过附表十二范围时,由于H分布近似于χ2分布, 其自由度为k-1,可查χ2值表(附表三),作出统计推断。 当具有相同观察值的例数较多时,H值需按(11.5)式校正,校正系数C由(11.6)式求得。
K-W检验计算步骤 本例:T1=216,T2=134,T3=123.5,T4=54.5 n=8+7+9+8=32。 求得H值=111.8991 因有相等值,故需求校正HC值,由表11.10计算 C值=0.9980 HC=111.8991/0.9980=111.939 查χ2值表(附表三), df=k-1=3时, χ20.01(3) =11.345,现χ2>χ20.01 ,所以P<0.01,拒绝H0,认为各组鼠脾中DNA含量的差异有统计学意义。 。
第五节 随机单位组设计秩和检验 • 当试验按随机单位组设计时,欲作秩和检验可用本法,称为Friedman秩和检验(Friedman test)。 例11.11 7名受试者接受A,B,C三种镇痛药物的试验, 每人均按痛觉减轻程度的多少评价其镇痛作用,减轻多记为3,次之为2,减轻少记为1,结果见表11.11 试分析三种药物的镇痛效果有无差别?
Friedman秩和检验计算步骤 (1)在各个单位组对k个处理的观察值由小到大排列并指定秩次; (2)计算k个处理的秩次和T1 ,T2 ,……,Tk ; (3)用公式(11.7)计算H值 当k=3,b≤15或k=4,b≤8时,可由附表十三查得其界值, 当H<H0.05时,P>0.05, H≥H0.05时,P≤0.05, H≥H0.01时, P≤0.01。
Friedman秩和检验计算步骤 当k,b超过附表十三范围时,H近似于χ2分布,可按df=k-1查χ2值表(附表三)作统计判断。 本例:b=7,k=3,由(11.7)式得H=7.14 查附表十三,当b=7,k=3时,H0.05=7.14,H0.01=8.86,现H=H0.05 ,所以P=0.05,拒绝H0,认为三种药物的镇痛效果的差异有统计学意义。
第六节 按等级分组资料的秩和检验 医学资料中有不少观察结果介于定性和定量之间,常称为半定量资料。 如病人的疗效可按恶化,无效,好转和痊愈4个等级;皮下注射后的局部反应可按++++,+++,++,+,±和-,分为6个等级,某临床症状或体征的严重程度可分为无,轻,中和重4个等级。这些资料又称为等级资料。 等级资料的检验必须用非参数方法。
第六节 按等级分组资料的秩和检验 两组比较时可用两样本秩和检验方法。 两组以上比较时用完全随机化设计的秩和检验。 由于相同的数据较多,样本量较大,可用正态近似(两组比较时),或卡方近似(两组以上比较时);并且必须进行相等秩次的校正。
表11.12 某药三种剂量对某病的疗效 ──────────────────────────────────── 药物剂量 无效 好转 显效 小计 mi ──────────────────────────────────── 甲 21 7 4 32 乙 13 10 6 29 丙 15 13 13 41 ──────────────────────────────────── 小计 ni 49 30 23 102 秩次范围 1-49 50-79 80-102 平均秩次RMj 25 64.5 91 ────────────────────────────────────
甲剂量之秩和=21×25+7×64.5+4×91=1340.5 同样有:乙剂量之秩和=1516, 丙剂量之秩和=2396.5, H=5.6578 修正因子:C=0.8523 HC=5.6578/0.8523=6.6387 df=3-1=2,由χ2界值表(附表三)χ20.05=5.99, χ20.01=9.21。现χ2>χ20.05 ,故P<0.05,拒绝H0,认为三种剂量的疗效不相同。
第八节 秩相关 秩相关(rank correlation)又称等级相关,它是一种分析x,y两个变量的等级间是否相关的方法。 适用于某些不能准确地测量指标值而只能以严重程度,名次先后,反应大小等定出等级的资料,也适用于某些不呈正态分布或难于判断分布类型的资料。 最常用的是Spearman等级相关分析,其相关程度大小用等级相关系数 rs来表示。
秩相关的计算 例11.16某单位研究2~7岁急性白血病患儿的血小板数与出血症状之间的关系,得资料见表11.17第1~3列,问两者间有无关系? (1)将x,y分别由小到大排列,并给以秩次。 (2)求成对数据(x,y)的秩次差值d。 (3)计算rs,再据附表十四作出统计推断。 rs=1-6∑d2/[n(n2-1)] (11.14) n--观察值的对子数。
秩相关的计算 本例:∑d2=378 rs=1-6×378/[12(122-1)]=-0.322 查附表十四,n=12时,rs0.05(12)=0.578,现|rs|<rs0.05 ,所以P>0.05,不拒绝H0 ,认为2~7岁急性白血病患者的血小板与出血症状间相关无统计学意义。
实 例 比较两种药物治疗哮喘的疗效: 1=A药,2=B药 S0:治疗前哮喘情况0=无,1=轻,2=中,3=重 S1:治疗后哮喘情况0=无,1=轻,2=中,3=重 1)检验治疗前两组哮喘情况是否可比。 2)分别检验两种药物治疗后哮喘情况是否改善。 3)检验两种药物治疗后哮喘改善情况是否有差异。