1 / 60

第十四章 基于秩次的统计方法

第十四章 基于秩次的统计方法. 主讲内容. 第一节 两独立样本差别的秩和检验 第二节 配对设计资料的 秩和 检验 第三节 完全随机设计多组差别的秩和检验 第四节 多组差别秩和检验的注意事项 第 五节 Spearman 秩相关. 我们常常遇到以下一些资料,如需比较患者和正常人的血铁蛋白、血铅值等各项指标、护理效果评分、医疗质量评估等,这类资料有如下特点: ( 1 )资料的总体分布类型未知; ( 2 )资料分布类型已知,但不符合正态分布;

jerry-cook
Download Presentation

第十四章 基于秩次的统计方法

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第十四章 基于秩次的统计方法

  2. 主讲内容 第一节 两独立样本差别的秩和检验 第二节 配对设计资料的秩和检验 第三节 完全随机设计多组差别的秩和检验 第四节 多组差别秩和检验的注意事项 第五节Spearman 秩相关

  3. 我们常常遇到以下一些资料,如需比较患者和正常人的血铁蛋白、血铅值等各项指标、护理效果评分、医疗质量评估等,这类资料有如下特点:我们常常遇到以下一些资料,如需比较患者和正常人的血铁蛋白、血铅值等各项指标、护理效果评分、医疗质量评估等,这类资料有如下特点: (1)资料的总体分布类型未知; (2)资料分布类型已知,但不符合正态分布; (3)某些变量可能无法精确测量如等级资料。 对这类资料可以采用非参数统计:即不考虑总体分布类型是否已知,不比较总体参数,只比较总体分布的位置是否相同的统计方法。此类资料可以采用非参数方法进行统计分析。

  4. 秩和检验概述 • 研究目的:均数或率的假设检验 • 资料类型:计量、计数或等级资料 • 基本思想:基于秩次(通过编秩,用秩次代替原始数据信息来进行检验) 即检验各组的平均秩是否相等。如果经检验得各组的平均秩不相等,则可以推论数据的分布不同,进一步可推论各分布间分布位置发生了平移;

  5. 一、秩次和秩和 • “秩”即按数据大小排定的次序号,又称秩次号。编秩就是将观察值按顺序由小到大排列,并用序号代替原始变量值本身。用秩次号代替原始数据后,所得某些秩次号之和,即按某种顺序排列的序号之和,称为秩和。设有以下两组数据: • A组 4.7 6.4 2.6 3.2 5.2 • B组 1.7 2.6 3.6 2.3 3.7

  6. 两组各有5个变量值。现在依从小到大的顺序将它们排列起来,并标明秩次,结果如下:两组各有5个变量值。现在依从小到大的顺序将它们排列起来,并标明秩次,结果如下: • A组 2.6 3.2 4.7 5.2 6.4 • B组 1.7 2.3 2.6 3.6 3.7 • 秩次 1 2 3 4 5 6 7 8 9 10

  7. 原始值中有两个“2.6”,分属A、B组,它们的秩次应是3和4,然而它们的数值本来是同样大小的,哪组取“3”,哪组取“4”呢?我们计算它们的平均数(3+4)/2=3.5,作为“2.6”的秩次,称为“平均秩次”,这样才公平合理。这样两组所得的秩次及秩和如下:原始值中有两个“2.6”,分属A、B组,它们的秩次应是3和4,然而它们的数值本来是同样大小的,哪组取“3”,哪组取“4”呢?我们计算它们的平均数(3+4)/2=3.5,作为“2.6”的秩次,称为“平均秩次”,这样才公平合理。这样两组所得的秩次及秩和如下: • A组 3.5 5 8 9 10 /35.5 • B组 1 2 3.5 6 7 /19.5

  8. 上面A组和B组中各有五个原始值,按顺序排列:最小值设为1,再按绝对值大小对余下的变量逐个排序,最大值为两组变量个数之和10。依次可得1,2,3.5,3.5,5,6,7,8,9,10。这10 个序号即是秩次。A组秩和就是等于3.5+5+8+9+10=39.5,B组秩和就是等于1+2+3.5+6+7=19.5。从两组的原始变量值也可以初步看出:A组偏大,B组偏小。现在得出的秩和也是A组大于B组,与由变量值所观察到的一致。

  9. 二、怎样编秩 • 编秩就是将观察值按顺序由小到大排列,并用序号代替原始变量值本身。不同的实验设计类型,有不同的编秩规则,

  10. 1.配对资料的编秩规则 • 按照配对设计,先求出对子之间的差值,按其差值的绝对值,从小到大进行排序,其序号即秩次,并在秩次之前保持原差值的正负号不变。编秩遇到差值为零时则舍去不编秩,对绝对值相等的差值取平均值,并在秩次之前保持原差值的正负号。一般来说,秩次最小为1,最大为对子数N,当有差值为零时,最大秩次等于对子数n减去差值为零的个数。

  11. 2.随机化区组设计资料的编秩规则 • 先将各区组内数据从小到大排序编秩,遇到相等数据取平均秩次,再将各组的秩次相加就得到各组的秩和。

  12. 3.完全随机设计的两组或多组资料的编秩规则 • 将各组变量依据从小到大的顺序进行排序,其序号即为秩次,如果有多个相等的变量值分布在同一组中,,则按顺序依次对其编列秩次,如果有多个相等的变量值分布在不同组中,则按顺序排序然后取其平均秩次。

  13. 三、怎样选用不同设计的秩和检验方法 • 首先要区分试验设计和资料的类型: • 若是一个样本资料或者配对设计的资料, 来自非正态总体或总体分布无法确定,可选用wilcoxon符号秩和检验方法; • 若是两组独立样本资料,来自非正态分布的定量资料或有序二分类变量资料(等级资料)宜用wilcoxon秩和检验;

  14. 若是多组独立样本资料,来自非正态总体或方差不齐(转化后也不满足)的定量资料或者是有序多分类变量资料(等级资料)宜用Kruskal-Wallis秩和检验。若是多组独立样本资料,来自非正态总体或方差不齐(转化后也不满足)的定量资料或者是有序多分类变量资料(等级资料)宜用Kruskal-Wallis秩和检验。 • 若是随机区组设计的自非正态总体或方差不齐(转化后也不满足)的定量资料,宜用Firedman秩和检验。 • 各种类型的秩和检验通常有查表法和正态近似法两种计算方式,分别适用于不同样本量的资料。在相同秩次的个数大于样本量的25%时需要采用相应的公式进行校正。

  15. 第一节 两独立样本差别的秩和检验 • 对于定量数据,如果两独立样本分别来自方差相等的正态总体的假定成立,就可以用t检验比较两样本均数与的差别是否有统计学意义;如果此假定不成立或不能确定是否成立,就不能应用t检验,而应采用非参数统计分析方法—秩和检验来分析两样本是否来自同一总体。为了直观地介绍秩和检验,我们从一个实际试验中节选了两组数据,形成两个样本A、B:

  16. 所谓秩和就是秩号的和,例如R1=4+6+10+11+13+14+15+16=89。秩和检验的检验统计量T定义为:所谓秩和就是秩号的和,例如R1=4+6+10+11+13+14+15+16=89。秩和检验的检验统计量T定义为: • P215 公式(14-1) ,n1、n2是两组的例数。 • 在H0成立的条件下,T值应接近,其中。如果T严重偏离,提示可能是不正确的。当样本例数较小时,T的分布可以直接写出来,为了便于使用已制作出T的检验界值表(见附表9)。

  17. 相同秩问题 • 上例中两组数据没有相同的数值,但在应用中由于测量精度所限,常常出现相同的数值,编秩时,相同数值当然应具有相同的秩号,这种情况称为同秩(ties)。样本较小时,如果同秩较多,检验结果会存在偏性,因此应提高测量精度,尽量避免出现较多的同秩。大样本时,通过对公式14-2(P216)做适当校正,以减小因同秩带来的偏性。

  18. 例14-1分别用5%咪喹莫特软膏和5-氟脲嘧啶软膏治疗尖锐湿疣的随机双盲临床研究的疗效观察结果见表14-2第(1)、(2)列,试比较两种药物治疗尖锐湿疣的疗效。例14-1分别用5%咪喹莫特软膏和5-氟脲嘧啶软膏治疗尖锐湿疣的随机双盲临床研究的疗效观察结果见表14-2第(1)、(2)列,试比较两种药物治疗尖锐湿疣的疗效。

  19. 注意 • 一般文献上使用的方法是Mann_Whitney的U检验法并给出U统计量。两种方法是独立提出的,检验结果完全等价的;前者用T统计量,而后者用U统计量,U统计量有明确含义,为了避免与T统计量混淆,不再给出U统计量的定义。

  20. 第二节 配对设计资料的秩检验 • 适用条件: 1.配对设计; 2.如果差数严重偏离正态分布,但差数的总体分布对称

  21. 例14-2采用配对设计,用某种放射线的A,B两种方式分别局部照射家兔的两个部位,观察放射性急性皮肤损伤程度,见表14-3。 比较A,B的损伤程度是否不同。

  22. 检验步骤: • 1.H0:两处理效应相同 • H1:两处理效应不相同。 a=0.05 • 2.编秩号。成对资料编秩号时较为复杂,要注意三点: • (1)剔去差数为0的数据; • (1)余下的n个差数按绝对值自小至大排秩号,但排好后秩号要保持原差数的正负号; • (2)差数绝对值相等时,要以平均秩号表示,如表14-3中差数绝对值为4者共三个,其秩号依次应为2、3、4,现皆取平均秩号3;

  23. 3.求秩号和即将正、负秩号分别相加,本例得正秩号和为68,负秩号和为10,正负秩号绝对值之和应等于n(n+1)/2,可用以核对,如本例68+10=12(12+1)/2=78,说明秩号计算正确。 • 4. 检验统计量R取较小一个秩号和,根据R值查附表10进行判断,该表左侧为对子数,表身内部是较小秩号和,与上端纵标目之概率a=0.05, a=0.01相对应,其判断标准是(注意此处与其它检验方法的区别):

  24. 校正问题 • 如果存在多个差数的绝对值相等,即有相同的秩号,有必要对公式14-5计算的u值作校正:

  25. 第三节 完全随机设计 多组差别的秩和检验 • 适用条件: 1.完全随机设计的多组均数比较 ; 2. 试验观测结果严重偏离正态分布 3.组间方差不齐, 4.观测结果是有序的 • 基本思想:如果各组均来自同一总体,则各组的平均秩和近似相等

  26. 例14-3 为了研究精氨酸对小鼠截肢后淋巴细胞转化功能的影响,将21只昆明种小鼠随机等分成3组:对照组A、截肢组B、截肢后用精氨酸治疗组C。实验观测脾淋巴细胞对HPA刺激的增值反应,测量指标是3H吸收量,数据如下:

  27. 两两比较问题

  28. 第四节 多组差别秩和检验的注意事项 注意1 • 优点:要求满足的条件宽松,分析结果比较稳健。 • 缺点:当数据满足参数统计分析的要求的时候,仍选择使用的话会损失数据的信息。

  29. 注意2 • Wilcoxon(Mann-Whitney)法和Kruskal-Wallis法本质上是相同的,即检验各组的平均秩是否相等。如果经检验得各组的平均秩不相等,则可以推论数据的分布不同,进一步可推论各分布间分布位置发生了平移;反之,即使各组平均秩相等,也不能说明数据的分布相同,

  30. 注意3 • 另外,Wilcoxon(Mann-Whitney)法和Kruskal-Wallis检验统计量的同秩校正公式计算比较复杂,可以借助第十一章完全随机设计资料方差分析中离差平方和分解的思想计算检验统计量,计算出的检验统计量与用校正公式计算的相等。

More Related