410 likes | 550 Views
Lifetime Analysis 生存分析. 生存分析. 在临床医学中 , 对病人治疗效果的考查 . 一方面可以看治疗结局的好坏,另一方面还可以通过治疗时间的长短来衡量。 例如某癌症病人手术后的存活时间 , 某种疾病治愈的时间 等 , 把这类与时间有关的资料统称为生存资料。. “ 生存”的概念 生物生存 与死亡. 电脑始使正常 与出现故障. 疾病产生 与治愈. 疾病治愈 与复发. 阴性 与阳性 .
E N D
生存分析 • 在临床医学中, 对病人治疗效果的考查. 一方面可以看治疗结局的好坏,另一方面还可以通过治疗时间的长短来衡量。 • 例如某癌症病人手术后的存活时间,某种疾病治愈的时间 等, 把这类与时间有关的资料统称为生存资料。
“ 生存”的概念 生物生存 与死亡 电脑始使正常 与出现故障 疾病产生 与治愈 疾病治愈 与复发 阴性 与阳性
三个要点 • 一、起始事件 • 二、终点事件 • 三、生存时间
起始事件随访时间终点事件 疾病确诊 死亡 治疗开始 死亡 治疗开始 痊愈 接触危险物 出现反映
随访资料的记录 • 生存资料一般通过随访收集,从某标准时刻(发病、手术或出院等)开始,按某种相等或不等时间间隔,对观察对象定期观察预定项目所得。它的结局是死亡,治愈、复发、阳性等。 • 记录的项目通常包括开始观察日期,终止观察日期,处理方法,及协变量等。
9例某癌症病人的随访记录 • 病号 性别 开始日期 终止日期 结局 方法 • 01 男 08/31/82 10/01/89 死亡 手术 • 02 男 09/26/82 08/28/96 生存 手术 • 03 女 10/30/83 03/31/90 死亡 非手术 • 04 男 12/01/84 10/01/87 死亡 非手术 • 05 女 01/01/84 10/01/88 失访 手术 • 06 男 07/01/85 10/01/88 死亡 手术 • 07 男 08/31/87 12/30/90 退出 手术 • 08 女 07/11/86 12/17/90 死亡 手术 • 09 男 08/31/86 10/01/90 死亡 非手术
截尾数据或终检值(censored data) • 在临床上,往往由于某种原因致使在一定时期内,一部分病例得不到确切的生存期,主要有下列原因: • (1)因迁移原因失去联系; • (2)死于其他原因而造成失访; • (3)因客观原因中途退出; • (4)预定终止结果迟迟不发生; • 但它们提供了其生存期长于观察期的信息,这种数据为不完全数据。称为删失数据,也称截尾数据或终检值。
生存分析的基本概念 • 1、生存时间 (survival time) • 生存时间指观察到的存活时间,包括完全数据和删失数据。 • (1)完全数据是从进入观察到规定的结局出现所经历的时间,即病人存活时间。 • (2)删失数据(censor time)是从进入观察到删失点所经历的时间,
(3)结果变量(outcome)或终检变量 (censor) • 结果变量记录预定的结果是否发生。
变量的数据化方法 • CHISS规定对结果变量赋值,完全数据为0,删失数据为1。
9例某癌症病人随访记录的数据库 • n sex time outcome treat • 1 1 7 0 1 • 2 1 14 1 1 • 3 0 6 0 0 • 4 1 3 0 0 • 5 0 4 1 1 • 6 1 3 0 1 • 7 1 3 1 1 • 8 0 4 0 1 • 9 1 4 0 0
截尾数据的统计处理 • 在实际工作中,很多医学工作者将失访或中止等原因造成的删失数据抛弃掉。这样做不仅损失了大量信息,而且也不太科学。
例某研究者追踪100名癌症患者,经治疗后的生存情况,随访第1年有30人死亡,随访第2年时,有20人死亡,有40人无法联系失访。试估计其生存率。例某研究者追踪100名癌症患者,经治疗后的生存情况,随访第1年有30人死亡,随访第2年时,有20人死亡,有40人无法联系失访。试估计其生存率。 法一:去掉截尾数据 法二:不去掉截尾数据 总例数N=60 N=100 • 生存数 生存率 生存数 生存率 1年 30 30/60=50% 70 70/100=70%
2、 死亡概率 • 死亡概率是指死于某时段内的可能性大小.记为q。 年死亡概率计算公式为 • 某年内死亡数 • q = ─────── • 某年年初人口数 • 若年内有删失,则分母用校正人口数, • 校正人口数=年初人口数 - 1/ 2 删失数
3 、生存概率 • 生存概率表示在某单位时段开始时存活的个体到该时段 结束时仍存活的可能性大小,记为p。年生存概率计算公式为 • 活满某一年人数 • p = 1-q = ──────── • 某年年初人口数 • 若年内有删失,则分母用校正人口数。
4、 生存率与生存函数 生存率是从起点开始活到一定时间的概率。 亦即研究对象存活时间长于时间t的概率,它是时间t的函数,记为S(t) 亦称生存函数 。 例如s(1),s(3),s(5)表示一年、三年、五年的生存率。若S(5)=0.18表示5年之后仍有18%的病人存活。
生存率与生存概率的关系 设病人在各个时段生存概率为pj,j=1,2,…, 则各个生存概率pj的乘积为生存率: S(t)=∏pj tj≤t
例 今调查100例癌症患者的五年内生存状况如下表,试求各年的死亡概率、生存概率和生存率 • 时间 死亡 期初 死 亡 生 存 生存率 • 人数 人数 概 率 概 率 • 一年 20 • 二年 40 • 三年 30 ? • 五年 8
5、 相关的统计量 • 平均生存时间 生存时间的平均数 (当有删失数据时,求不出) • 2 半数生存期 即寿命的中位数表示有且只有50%的个体可活这么长时间
例 5名癌症患者存活时间(月) • 6 10 14 20 20 • n=5 平均生存时间, mean=18 • 5 10 20 30+ 50+ • n=7 中位生存时间 median=20 • +表示尚生存 • 7 8+ 25 35 50 • ?
当截尾较早时,不能直接求出半数生存期, 这时,可用生存函数公式或生存曲线图,令生存率等于50%,然后反推时间。
生存分析的主要内容 生存过程的描述 研究生存时间的分布特点,估计生存率,生存曲线; 生存过程的比较 对两组或多组生存率进行比较; 影响因素的分析 了解影响生存过程的主要因素为改善预后提供指导。
§12.1 生存率的估计 • 常用的有两种方法: • 乘积极限法 (小样本时) • 寿命表法 (大样本时)
1乘积极限法 • 又称Kaplan-Meier 法 适用于小样本资料。基本思想:将生存时间由小到大依次排列,在每个死亡点上,计算其期初人数、死亡人数、死亡概率、生存概率和生存率。
生存率的标准误: 生存率的95%可信区间: S(ti) 1.96SE[S(ti)]
2 CHISS实现 • 点击 • 重复测量→生存分析→乘积极限法
3 实例分析 • 例12-1某疗法治疗白血病后的存活月数为: 2+,13,7+,11+,6,1,11,3,17,7。 带“+”为存活终检值。 P81 。 • 试估计其生存率,并求出: • 1)3个月、6个月、1年的生存率。 • 2)半数据生存期。
解步骤:1 进入数据模块 此数据库已建立在CHISS\data文件夹中,文件名为:a9_0生存分析.DBF。打开数据库 • 点击 数据→文件→打开数据库表 • 找到文件名为:a9_0生存分析.DBF →确认
2 进入统计模块 进行统计计算 • 点击 重复测量→生存分析→乘积极限法 • 时间变量: time • 终检值指标:censor→确认 • 3 进入结果模块 查看结果 • 点击 结果
1)3个月、6个月、1年的生存率分别为: • 78.75%, 42.19%, 21.09%。
4 Kaplan-Meier 生存曲线 • 在直角坐标系中,将各个时刻的生存率所对应的点标在图上,然后向右连成与横轴平行的阶梯形成一条曲线,称为Kaplan-Meier生存。
§12.2 时序检验 (log rank test) • 用于比较两个或多个样本生存期, 即对各样本不同时点生存率的综合分析。其原理是计算出不同时期两种疗法的观察人数和死亡人数,并由此根据两种疗法疗效相同的假设计算出两种疗法在该日期的理论死亡数.
3 实例分析 • 例12-2 两种疗法治疗白血病后的存活月数如下: 对照组: 2+,13,7+,11+,6,1,11,3,17,7 中药组: 10,2+,12+, 13,18,6+,19+,26,9+,8+,6+ ,43+,9,4,31,24 • 带“+”为终检值 • 试分析两种疗法治疗的生存期有无差别? • P81 。
CHISS实现 • 点击 • 重复测量→生存分析→时序检验
实际发生数与期望发生数 • ━━━━━━━━━━━━━━━━━━组别 总例数 删失数 实际发生 理论发生 • ────────────────── • g.1 10 3 7 3.21 • g.2 16 8 8 11.79 • ━━━━━━━━━━━━━━━━━━
Log-Rank检验,QPH = 5.683 自由度 =1 P =0.0171. • 说明两种疗法治疗的生存期差别有显著性。