460 likes | 1.5k Views
第十九章 比例风险模型 —— Cox 回归 Proportional Hazard Model —— Cox ’ s Regression. 华中科技大学同济医学院流统系 宇传华. Cox 回归( Cox regression ). 是一种允许资料有 “ 删失(或截尾) ” 数据存在的,可以同时分析众多因素对 生存时间 影响的 多变量 生存分析方法。是一种 半参数 方法。. 生存分析方法. 一般可以分为参数、非参数、半参数三类。
E N D
第十九章 比例风险模型——Cox回归Proportional Hazard Model ——Cox’s Regression 华中科技大学同济医学院流统系 宇传华 (http://statdtedm.6to23.com
Cox回归(Cox regression) 是一种允许资料有“删失(或截尾)”数据存在的,可以同时分析众多因素对生存时间影响的多变量生存分析方法。是一种半参数方法。 (http://statdtedm.6to23.com
生存分析方法 一般可以分为参数、非参数、半参数三类。 1、参数法:生存时间的分布符合某一特定类型,如对数正态分布、weibull分布、指数分布、Gamma分布等,则可用特定的分布函数分析,这称之为参数法(参见书第20章,SAS的LifeReg过程步)。 2、非参数法:用Kaplan-meier法、或寿命表法求生存率,作生存曲线;用logrank检验或Breslow检验比较两组或几组生存率差异有无统计学意义(SAS的LifeTest过程步)。 3、半参数法:Cox 比例风险模型(SAS的PHReg过程步) (http://statdtedm.6to23.com
第一节 模型结构与参数估计 一.模型结构: 设有n名病人(i=1,2,…,n),第i名病人的生存时间为ti,同时该病人具有一组伴随变量xi1 ,xi2 , xi3, …, xip。则模型为: (http://statdtedm.6to23.com
比例风险举例病人2的死亡风险是病人1的5倍 (http://statdtedm.6to23.com
比例风险(假定违背)举例治疗组与安慰剂病人的死亡风险不呈比例比例风险(假定违背)举例治疗组与安慰剂病人的死亡风险不呈比例 (http://statdtedm.6to23.com Source: Kay. Pharmaceut. Statist. 2004; 3: 295–297
风险函数(Hazard function) 风险——指瞬间风险(instantaneous hazard),或 force of mortality(死亡力), 用 h(t)表示, 是在时间点t尚存个体在短暂时期 (Δ)内 发生死亡的危险程度。即指生存到时间t的病人,从t到(t+Δ)这一非常小时间区间内的瞬间死亡概率。 如Kaplan-Meier法计算的死亡概率qi就是h(t)的估计值。 (http://statdtedm.6to23.com
二.回归系数的估计方法 (http://statdtedm.6to23.com
偏似然函数(partial likelihood function,Lp) 分母中j∈Ri表示在ti时刻的所有个体(包括删失个体)风险之和,分子只反映观察到的死亡风险。 只有非删失(即死亡)个体才有偏似然函数 (http://statdtedm.6to23.com
偏似然函数(partial likelihood function,Lp) (http://statdtedm.6to23.com
对数偏似然函数[ l(b)=lnLp ] (http://statdtedm.6to23.com
1. 实例与SAS程序 2. 回归系数及其解释 3. 回归模型及回归系数的假设检验 4. 模型的筛选及有关问题 第二节 回归系数及其假设检验 (http://statdtedm.6to23.com
例19-1某医师对一所医院1988年收治的16例鼻腔淋巴瘤患者随访了13年,数据见表19-1,试作Cox模型分析。例19-1某医师对一所医院1988年收治的16例鼻腔淋巴瘤患者随访了13年,数据见表19-1,试作Cox模型分析。 1. 实例与SAS程序 (http://statdtedm.6to23.com
data a; input num sex age stage blood xray chmthrp censor day; cards; 1 1 45 2 2 0 1 1 578 2 0 36 2 2 0 1 1 1549 3 1 57 2 2 1 0 1 938 4 0 45 2 0 1 0 0 4717 5 0 42 2 0 1 1 1 4111 6 0 39 2 1 0 1 1 1245 7 1 38 2 1 1 1 1 4435 8 1 45 2 2 1 0 1 3750 9 1 30 2 0 1 0 1 3958 10 0 45 2 1 0 1 1 2581 11 0 45 3 1 0 1 1 3572 12 1 57 2 1 1 0 1 2938 13 0 57 2 2 0 1 1 1932 14 1 49 2 2 1 1 1 3205 15 1 33 2 1 0 1 1 3451 16 0 51 2 2 1 0 1 2363 ; PROCPHREG; Model day*censor(0)=sex age stage blood xray chmthrp/ risklimits; RUN; SAS程序 (http://statdtedm.6to23.com
SAS程序输出结果 The SAS System 16:31 Saturday, December 4, 2005 6 The PHREG Procedure Analysis of Maximum Likelihood Estimates Parameter Standard Hazard 95% Hazard Ratio Variable DF Estimate Error Chi-Square Pr>ChiSq Ratio Confidence Limits sex 1 0.26175 0.89551 0.0854 0.7701 1.299 0.225 7.515 age 1 0.05274 0.05286 0.9955 0.3184 1.054 0.950 1.169 stage 1 -1.27386 1.26111 1.0203 0.3124 0.280 0.024 3.313 blood 1 1.10626 0.61835 3.2007 0.0736 3.023 0.900 10.158 xray 1 -2.58712 1.11364 5.3969 0.0202 0.075 0.008 0.667 chmthrp 1 -0.54082 0.84818 0.4066 0.5237 0.582 0.110 3.070 (http://statdtedm.6to23.com
2. 回归系数及其解释 回归系数实际上是偏回归系数,其意义与多元线性回归模型或Logistic回归模型中的偏回归系数的意义相似。表示控制其他因素条件下,各个因素对回归方程的独立贡献。 观察值经过标准化变换后所求得的回归系数称为标准偏回归系数b'。 (http://statdtedm.6to23.com
2. 回归系数及其解释 (续1) (http://statdtedm.6to23.com
3.回归模型及回归系数的假设检验 Model Fit Statistics Without With Criterion Covariates Covariates -2 LOG L 61.344 45.145 AIC 61.344 57.145 SBC 61.344 61.393 Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio 16.1987 6 0.0127 Score 14.7833 6 0.0220 Wald 11.4066 6 0.0766 (http://statdtedm.6to23.com
3.回归模型及回归系数的假设检验(续) The SAS System 16:31 Saturday, December 4, 2005 6 The PHREG Procedure Analysis of Maximum Likelihood Estimates Parameter Standard Hazard 95% Hazard Ratio Variable DF Estimate Error Chi-Square Pr>ChiSq Ratio Confidence Limits sex 1 0.26175 0.89551 0.0854 0.7701 1.299 0.225 7.515 age 1 0.05274 0.05286 0.9955 0.3184 1.054 0.950 1.169 stage 1 -1.27386 1.26111 1.0203 0.3124 0.280 0.024 3.313 blood 1 1.10626 0.61835 3.2007 0.0736 3.023 0.900 10.158 xray 1 -2.58712 1.11364 5.3969 0.0202 0.075 0.008 0.667 chmthrp 1 -0.54082 0.84818 0.4066 0.5237 0.582 0.110 3.070 (http://statdtedm.6to23.com
4. 模型的筛选及有关问题 (1)剔去缺失数据较多,或变异程度几乎为0 的因子 (如表19-1的“分期”)。 (2)单变量分析(表19-2) (3)采用软件进行逐步筛选 (http://statdtedm.6to23.com
4. 模型的筛选及有关问题(单变量分析) (http://statdtedm.6to23.com
4. 模型的筛选及有关问题(逐步回归分析) PROCPHREGdata=a2; Model day*censor(0)=sex age stage blood xray chmthrp /risklimitsselection=stepwise sle=0.05sls=0.05; RUN; Analysis of Maximum Likelihood Estimates(参见书P253的表19-3) Parameter Standard Hazard 95% Hazard Ratio Variable DF Estimate Error Chi-Square Pr>ChiSq Ratio Confidence Limits blood 1 1.06957 0.41019 6.7992 0.0091 2.914 1.304 6.511 xray 1 -0.81419 0.35633 5.2209 0.0223 0.443 0.220 0.891 (http://statdtedm.6to23.com
第三节 生存函数的估计 (http://statdtedm.6to23.com
SAS求基线生存率的程序 PROCPHREGdata=a; Model day*censor(0)=blood xray/risklimits; baselineout=phout survival=s_tstderr=stderr / method=ch ; symbol1i=join v=none l=1; symbol2i=join v=none l=3; strata xray; procgplotdata=phout; plot s_t*day=xray;run; procprintdata=phout; RUN; (http://statdtedm.6to23.com
SAS求基线生存率的结果 The SAS System 22:52 Saturday, December 4, 2005 10 Obs blood xray xray2 day s_t stderr 1 1.42857 0 0 0 1.00000 . 2 1.42857 0 0 578 0.88994 0.10515 3 1.42857 0 0 1245 0.76275 0.15017 4 1.42857 0 0 1549 0.64400 0.17032 5 1.42857 0 0 1932 0.49557 0.18608 6 1.42857 0 0 2581 0.27749 0.19103 7 1.42857 0 0 3451 0.11627 0.13221 8 1.42857 0 0 3572 0.02041 0.04420 9 1.11111 1 1 0 1.00000 . 10 1.11111 1 1 938 0.93576 0.06618 11 1.11111 1 1 2363 0.86037 0.10263 12 1.11111 1 1 2938 0.76749 0.13678 13 1.11111 1 1 3205 0.67610 0.16068 14 1.11111 1 1 3750 0.54734 0.18550 15 1.11111 1 1 3958 0.29068 0.20267 16 1.11111 1 1 4111 0.13799 0.14366 17 1.11111 1 1 4435 0.05579 0.07881 (http://statdtedm.6to23.com
SAS求基线生存率的结果 (http://statdtedm.6to23.com
风险指数(HI) (http://statdtedm.6to23.com
第四节 比例风险假定的检验 如果比例风险假定成立,意味着 二次对数生存曲线(log-log survival curves )应该平行. (http://statdtedm.6to23.com
放疗=0 风险=1 放疗=1 风险=-1 (a).风险指数分组 (图19-2b) (b).放疗协变量分组 (鼻血=1.19,图19-2c) 图19-3 Cox模型生存率两次对数曲线比较 (http://statdtedm.6to23.com
时依协变量是指变量的取值或效应大小随时间变化,可分别称之为取值时依协变量和效应时依协变量。时依协变量是指变量的取值或效应大小随时间变化,可分别称之为取值时依协变量和效应时依协变量。 模型中若含有时依协变量,便成为非比例风险模型,亦可称之为含时依协变量的Cox模型 第五节 时依协变量 (http://statdtedm.6to23.com
第五节 时依协变量(续) (http://statdtedm.6to23.com
描述研究事件(如死亡时间等) 说明研究起始时间与终止时间 (如症状出现与康复时间,诊断日期与终止日期等) 说明删失数据的种类与原因 说明计算生存率的统计学方法 (如Kaplan-Meier法) 给出每一组的中数生存率、或某生存期生存率(如5年生存率)估计值及其置信区间 说明生存率比较的统计学方法 (如log rank法)及其检验获得的p值 生存分析结果报告 (http://statdtedm.6to23.com
给出Cox回归模型,呈现解释变量与风险之间的联系给出Cox回归模型,呈现解释变量与风险之间的联系 给出风险比(hazard ratio)及其置信区间 给出比例风险假定的假设检验结果 生存分析结果报告(续) (http://statdtedm.6to23.com
LIFETEST - Produces life tables and Kaplan-Meier survival curves. Is primarily for univariate analysis of the timing of events. LIFEREG – Estimates regression models with censored, continuous-time data under several alternative distributional assumptions. Does not allow for time-dependent covariates. PHREG– Uses Cox’s partial likelihood method to estimate regression models with censored data. Handles both continuous-time and discrete-time data and allows for time-dependent covariables SAS处理生存资料的过程步 (http://statdtedm.6to23.com