1 / 39

第十九章 比例风险模型 —— Cox 回归 Proportional Hazard Model —— Cox ’ s Regression

第十九章 比例风险模型 —— Cox 回归 Proportional Hazard Model —— Cox ’ s Regression. 华中科技大学同济医学院流统系 宇传华. Cox 回归( Cox regression ). 是一种允许资料有 “ 删失(或截尾) ” 数据存在的,可以同时分析众多因素对 生存时间 影响的 多变量 生存分析方法。是一种 半参数 方法。. 生存分析方法. 一般可以分为参数、非参数、半参数三类。

todd-roy
Download Presentation

第十九章 比例风险模型 —— Cox 回归 Proportional Hazard Model —— Cox ’ s Regression

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第十九章 比例风险模型——Cox回归Proportional Hazard Model ——Cox’s Regression 华中科技大学同济医学院流统系 宇传华 (http://statdtedm.6to23.com

  2. Cox回归(Cox regression) 是一种允许资料有“删失(或截尾)”数据存在的,可以同时分析众多因素对生存时间影响的多变量生存分析方法。是一种半参数方法。 (http://statdtedm.6to23.com

  3. 生存分析方法 一般可以分为参数、非参数、半参数三类。 1、参数法:生存时间的分布符合某一特定类型,如对数正态分布、weibull分布、指数分布、Gamma分布等,则可用特定的分布函数分析,这称之为参数法(参见书第20章,SAS的LifeReg过程步)。 2、非参数法:用Kaplan-meier法、或寿命表法求生存率,作生存曲线;用logrank检验或Breslow检验比较两组或几组生存率差异有无统计学意义(SAS的LifeTest过程步)。 3、半参数法:Cox 比例风险模型(SAS的PHReg过程步) (http://statdtedm.6to23.com

  4. 第一节 模型结构与参数估计 一.模型结构: 设有n名病人(i=1,2,…,n),第i名病人的生存时间为ti,同时该病人具有一组伴随变量xi1 ,xi2 , xi3, …, xip。则模型为: (http://statdtedm.6to23.com

  5. (http://statdtedm.6to23.com

  6. 比例风险举例病人2的死亡风险是病人1的5倍 (http://statdtedm.6to23.com

  7. 比例风险(假定违背)举例治疗组与安慰剂病人的死亡风险不呈比例比例风险(假定违背)举例治疗组与安慰剂病人的死亡风险不呈比例 (http://statdtedm.6to23.com Source: Kay. Pharmaceut. Statist. 2004; 3: 295–297

  8. 风险函数(Hazard function) 风险——指瞬间风险(instantaneous hazard),或 force of mortality(死亡力), 用 h(t)表示, 是在时间点t尚存个体在短暂时期 (Δ)内 发生死亡的危险程度。即指生存到时间t的病人,从t到(t+Δ)这一非常小时间区间内的瞬间死亡概率。 如Kaplan-Meier法计算的死亡概率qi就是h(t)的估计值。 (http://statdtedm.6to23.com

  9. 二.回归系数的估计方法 (http://statdtedm.6to23.com

  10. 偏似然函数(partial likelihood function,Lp) 分母中j∈Ri表示在ti时刻的所有个体(包括删失个体)风险之和,分子只反映观察到的死亡风险。 只有非删失(即死亡)个体才有偏似然函数 (http://statdtedm.6to23.com

  11. 偏似然函数(partial likelihood function,Lp) (http://statdtedm.6to23.com

  12. 对数偏似然函数[ l(b)=lnLp ] (http://statdtedm.6to23.com

  13. (http://statdtedm.6to23.com

  14. 1. 实例与SAS程序 2. 回归系数及其解释 3. 回归模型及回归系数的假设检验 4. 模型的筛选及有关问题 第二节 回归系数及其假设检验 (http://statdtedm.6to23.com

  15. 例19-1某医师对一所医院1988年收治的16例鼻腔淋巴瘤患者随访了13年,数据见表19-1,试作Cox模型分析。例19-1某医师对一所医院1988年收治的16例鼻腔淋巴瘤患者随访了13年,数据见表19-1,试作Cox模型分析。 1. 实例与SAS程序 (http://statdtedm.6to23.com

  16. (http://statdtedm.6to23.com

  17. data a; input num sex age stage blood xray chmthrp censor day; cards; 1 1 45 2 2 0 1 1 578 2 0 36 2 2 0 1 1 1549 3 1 57 2 2 1 0 1 938 4 0 45 2 0 1 0 0 4717 5 0 42 2 0 1 1 1 4111 6 0 39 2 1 0 1 1 1245 7 1 38 2 1 1 1 1 4435 8 1 45 2 2 1 0 1 3750 9 1 30 2 0 1 0 1 3958 10 0 45 2 1 0 1 1 2581 11 0 45 3 1 0 1 1 3572 12 1 57 2 1 1 0 1 2938 13 0 57 2 2 0 1 1 1932 14 1 49 2 2 1 1 1 3205 15 1 33 2 1 0 1 1 3451 16 0 51 2 2 1 0 1 2363 ; PROCPHREG; Model day*censor(0)=sex age stage blood xray chmthrp/ risklimits; RUN; SAS程序 (http://statdtedm.6to23.com

  18. SAS程序输出结果 The SAS System 16:31 Saturday, December 4, 2005 6 The PHREG Procedure Analysis of Maximum Likelihood Estimates Parameter Standard Hazard 95% Hazard Ratio Variable DF Estimate Error Chi-Square Pr>ChiSq Ratio Confidence Limits sex 1 0.26175 0.89551 0.0854 0.7701 1.299 0.225 7.515 age 1 0.05274 0.05286 0.9955 0.3184 1.054 0.950 1.169 stage 1 -1.27386 1.26111 1.0203 0.3124 0.280 0.024 3.313 blood 1 1.10626 0.61835 3.2007 0.0736 3.023 0.900 10.158 xray 1 -2.58712 1.11364 5.3969 0.0202 0.075 0.008 0.667 chmthrp 1 -0.54082 0.84818 0.4066 0.5237 0.582 0.110 3.070 (http://statdtedm.6to23.com

  19. 2. 回归系数及其解释 回归系数实际上是偏回归系数,其意义与多元线性回归模型或Logistic回归模型中的偏回归系数的意义相似。表示控制其他因素条件下,各个因素对回归方程的独立贡献。 观察值经过标准化变换后所求得的回归系数称为标准偏回归系数b'。 (http://statdtedm.6to23.com

  20. 2. 回归系数及其解释 (续1) (http://statdtedm.6to23.com

  21. 3.回归模型及回归系数的假设检验 Model Fit Statistics Without With Criterion Covariates Covariates -2 LOG L 61.344 45.145 AIC 61.344 57.145 SBC 61.344 61.393 Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio 16.1987 6 0.0127 Score 14.7833 6 0.0220 Wald 11.4066 6 0.0766 (http://statdtedm.6to23.com

  22. 3.回归模型及回归系数的假设检验(续) The SAS System 16:31 Saturday, December 4, 2005 6 The PHREG Procedure Analysis of Maximum Likelihood Estimates Parameter Standard Hazard 95% Hazard Ratio Variable DF Estimate Error Chi-Square Pr>ChiSq Ratio Confidence Limits sex 1 0.26175 0.89551 0.0854 0.7701 1.299 0.225 7.515 age 1 0.05274 0.05286 0.9955 0.3184 1.054 0.950 1.169 stage 1 -1.27386 1.26111 1.0203 0.3124 0.280 0.024 3.313 blood 1 1.10626 0.61835 3.2007 0.0736 3.023 0.900 10.158 xray 1 -2.58712 1.11364 5.3969 0.0202 0.075 0.008 0.667 chmthrp 1 -0.54082 0.84818 0.4066 0.5237 0.582 0.110 3.070 (http://statdtedm.6to23.com

  23. 4. 模型的筛选及有关问题 (1)剔去缺失数据较多,或变异程度几乎为0 的因子 (如表19-1的“分期”)。 (2)单变量分析(表19-2) (3)采用软件进行逐步筛选 (http://statdtedm.6to23.com

  24. 4. 模型的筛选及有关问题(单变量分析) (http://statdtedm.6to23.com

  25. 4. 模型的筛选及有关问题(逐步回归分析) PROCPHREGdata=a2; Model day*censor(0)=sex age stage blood xray chmthrp /risklimitsselection=stepwise sle=0.05sls=0.05; RUN; Analysis of Maximum Likelihood Estimates(参见书P253的表19-3) Parameter Standard Hazard 95% Hazard Ratio Variable DF Estimate Error Chi-Square Pr>ChiSq Ratio Confidence Limits blood 1 1.06957 0.41019 6.7992 0.0091 2.914 1.304 6.511 xray 1 -0.81419 0.35633 5.2209 0.0223 0.443 0.220 0.891 (http://statdtedm.6to23.com

  26. 第三节 生存函数的估计 (http://statdtedm.6to23.com

  27. SAS求基线生存率的程序 PROCPHREGdata=a; Model day*censor(0)=blood xray/risklimits; baselineout=phout survival=s_tstderr=stderr / method=ch ; symbol1i=join v=none l=1; symbol2i=join v=none l=3; strata xray; procgplotdata=phout; plot s_t*day=xray;run; procprintdata=phout; RUN; (http://statdtedm.6to23.com

  28. SAS求基线生存率的结果 The SAS System 22:52 Saturday, December 4, 2005 10 Obs blood xray xray2 day s_t stderr 1 1.42857 0 0 0 1.00000 . 2 1.42857 0 0 578 0.88994 0.10515 3 1.42857 0 0 1245 0.76275 0.15017 4 1.42857 0 0 1549 0.64400 0.17032 5 1.42857 0 0 1932 0.49557 0.18608 6 1.42857 0 0 2581 0.27749 0.19103 7 1.42857 0 0 3451 0.11627 0.13221 8 1.42857 0 0 3572 0.02041 0.04420 9 1.11111 1 1 0 1.00000 . 10 1.11111 1 1 938 0.93576 0.06618 11 1.11111 1 1 2363 0.86037 0.10263 12 1.11111 1 1 2938 0.76749 0.13678 13 1.11111 1 1 3205 0.67610 0.16068 14 1.11111 1 1 3750 0.54734 0.18550 15 1.11111 1 1 3958 0.29068 0.20267 16 1.11111 1 1 4111 0.13799 0.14366 17 1.11111 1 1 4435 0.05579 0.07881 (http://statdtedm.6to23.com

  29. SAS求基线生存率的结果 (http://statdtedm.6to23.com

  30. 风险指数(HI) (http://statdtedm.6to23.com

  31. 第四节 比例风险假定的检验 如果比例风险假定成立,意味着 二次对数生存曲线(log-log survival curves )应该平行. (http://statdtedm.6to23.com

  32. (http://statdtedm.6to23.com

  33. 放疗=0 风险=1 放疗=1 风险=-1 (a).风险指数分组 (图19-2b) (b).放疗协变量分组 (鼻血=1.19,图19-2c) 图19-3 Cox模型生存率两次对数曲线比较 (http://statdtedm.6to23.com

  34. 时依协变量是指变量的取值或效应大小随时间变化,可分别称之为取值时依协变量和效应时依协变量。时依协变量是指变量的取值或效应大小随时间变化,可分别称之为取值时依协变量和效应时依协变量。 模型中若含有时依协变量,便成为非比例风险模型,亦可称之为含时依协变量的Cox模型 第五节 时依协变量 (http://statdtedm.6to23.com

  35. 第五节 时依协变量(续) (http://statdtedm.6to23.com

  36. 描述研究事件(如死亡时间等) 说明研究起始时间与终止时间 (如症状出现与康复时间,诊断日期与终止日期等) 说明删失数据的种类与原因 说明计算生存率的统计学方法 (如Kaplan-Meier法) 给出每一组的中数生存率、或某生存期生存率(如5年生存率)估计值及其置信区间 说明生存率比较的统计学方法 (如log rank法)及其检验获得的p值 生存分析结果报告 (http://statdtedm.6to23.com

  37. 给出Cox回归模型,呈现解释变量与风险之间的联系给出Cox回归模型,呈现解释变量与风险之间的联系 给出风险比(hazard ratio)及其置信区间 给出比例风险假定的假设检验结果 生存分析结果报告(续) (http://statdtedm.6to23.com

  38. LIFETEST - Produces life tables and Kaplan-Meier survival curves. Is primarily for univariate analysis of the timing of events. LIFEREG – Estimates regression models with censored, continuous-time data under several alternative distributional assumptions. Does not allow for time-dependent covariates. PHREG– Uses Cox’s partial likelihood method to estimate regression models with censored data. Handles both continuous-time and discrete-time data and allows for time-dependent covariables SAS处理生存资料的过程步 (http://statdtedm.6to23.com

  39. (http://statdtedm.6to23.com • 谢谢!

More Related