1 / 75

肿瘤登记的基本统计方法

肿瘤登记的基本统计方法. 孙喜斌 河南省肿瘤肿瘤防治研究办公室. 登记资料统计分析. 肿瘤登记数据的结果一般以比值 ( 率、比、比例等 ) 的形式呈现 , 不同时间、不同人群间的比较是对各种率或比例值的比较。 同时 , 一些比值也是评价登记质量的常用指标。. 内容. 率 (rate) 及率的标化 比例 (proportion) 比 (ratio). 率及率的标化. 定义、率、人年 粗率 年龄别率 标化率(年龄标化 - 直接法). 发生率 / 死亡率的计算需要两个元素: 1 、限定时期内限定人群中事件(发病、死亡 ) 发生数 — 分子。

masako
Download Presentation

肿瘤登记的基本统计方法

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 肿瘤登记的基本统计方法 孙喜斌 河南省肿瘤肿瘤防治研究办公室

  2. 登记资料统计分析 • 肿瘤登记数据的结果一般以比值(率、比、比例等)的形式呈现, 不同时间、不同人群间的比较是对各种率或比例值的比较。 • 同时,一些比值也是评价登记质量的常用指标。

  3. 内容 • 率(rate)及率的标化 • 比例(proportion) • 比(ratio)

  4. 率及率的标化 • 定义、率、人年 • 粗率 • 年龄别率 • 标化率(年龄标化-直接法)

  5. 发生率/死亡率的计算需要两个元素: 1、限定时期内限定人群中事件(发病、死亡) 发生数—分子。 2、限定时期内限定人群的人年数—分母。

  6. xxx肿瘤登记处肿瘤新病例报告卡 编 号_______________ ICD编码__________   门诊号______________   住院号______________ 身份证号 口口口口口口口口口口口口口口口口口口    患者姓名___________ 性别__________ 实足年龄__________岁    出生年月——年——月——日 民族____________________    职 业 (具体工种、性质)______________ 工作单位_____________________    正式户口    详细地址_______________ 区、县_____________ 街道、乡________________    诊 断_____________________________    病理学类型_________________________ (如是继发性肿瘤请尽可能注明原发部位)    诊断日期______年____月____日    报告单位____________________报告医师__________报告时间_______年_____月_____日    死亡日期________年_____月_____日 死亡原因________________________________ 诊断依据:在序号上打∨ 1 临床  6 病理(继发) 2X线、CT、超声   7 病理(原发) 3 手术、尸检(无病理) 8 尸检(有病理) 4 生化、免疫 9 不详 5 细胞学、血片 0 死亡补发病

  7. 肿瘤登记病例信息 • 基本数据: • 年龄(发病/死亡) • 性别 • 原发部位(ICD) • 其它信息: • 时间(发病/死亡年份) • 诊断依据 • 病期 • 组织学类型 • 职业/婚姻 • 随访结果 • 生存时间

  8. 人口数据 • 登记地区相应年度内的(分性别、年龄组) 人口数 • 标准人口年龄构成(中国、世界)

  9. 理想中,想要知道人群中某一年龄个体在特 定时间点发生(癌症)的危险度: ——发病力或 ——即刻发生率 实际上,我们只能估计到人群在某一时间段 内新病例(如癌症)的发生的频率(概率): ——发病率

  10. 新发病例数据 统计指标: • 年龄别率 • 粗率 • 标化率 • 截缩率 • 累积率 发病率:反映登记地区人群癌症负担指标

  11. 肿瘤发病率 公式 发病率= ×100000 男女性别、年龄别发生率 年龄组发病数过少时变化意义不大(随机波动较大) 分部位的肿瘤发生率 合计年份资料的发病率计算

  12. 人口数(分母) • 如果是计算某年份的率则用年中人口数或 年初人口数+年末人口数/2 • 如一个时期(如5年)合计发病率则将5年的平均人口相加做分母(或中间年份人口数×时期长度),这一时期合计的发病数做分子。

  13. 年龄别发病率 • 考虑年龄分组:0-4,5-9,10-14,…80-84, 85+. 年龄分18组(i=1,2,3,……18; A=18) 以ri 代表(一定时期内)第i年龄组的肿瘤发生数; 全部年龄组的肿瘤发生数为R,则: R= r1 +r2 + r3+…...+ rA 同样以ni 为相同时期的第i年龄组的人口数,各年龄人 口数合计为N, 则: N= n1 +n 2 + n3+…...+ nA

  14. 每100,000人年的粗率(全部年龄组)为: 粗率=C = ×100000 i.e. C= ×100000 各年龄组发病率为ai ,则: ai= ×100000

  15. 例1. 粗率和年龄别发病率计算表1 1980-84年苏格兰男性肺癌发生数据

  16. 年龄别发病率的计算 例如40-44岁组(i=9): a9= ×100000 = ×100000 = 21.1/10万

  17. 粗率计算 发病粗率 C 各年龄组合计发病数为16404, R= =16404 各年龄组合计人口数为12420220, N= =12420220 C= = ×100000 =132.1/10万

  18. 男性胃癌粗率比较 卡里,哥伦比亚 新发病例数(1982-86) 620 男性人口数(1984) 622922 年均粗率 19.9/10万 =620/(5×622922) 伯明翰, 英格兰 发病率数 (1983-86) 3468 男性人口数(1984) 2556200 年均粗率 33.9/10万 =3468/(4×2556200) 伯明翰男性发生胃癌的危险高于卡利的男性吗??

  19. 粗率 • 描述癌症负担的指标。 • 比较时往往产生误导。 • 年龄是癌症发生的重要决定因素。 • 进行率的比较时,一定要考虑不同年龄构成的影响。 • 粗率没有考虑年龄的影响。 • 因此,要对年龄别发病率进行比较。

  20. 男性胃癌年龄别率比较 卡利CR=19.9 per 100000 年龄 0-44 45-64 65+ 病例数(1982-86) 39 266 315 男性人口数 (1984) 524220 76304 22398 年均发病率(/10万) 1.5 69.7 281.3 人口年龄构成比(1984) 84 12 4 伯明翰CR=33.9 per 100000 年龄 0-44 45-64 65+ 病例数(1983-86) 79 1037 2353 男性人口数 (1984) 1683600 581500 291100 年均发病率(/10万) 1.2 44.6 202.0 人口年龄构成比(1984) 66 23 11

  21. 不同地区的胃癌比较 不同地区人群 胃癌 (暴露) (结果) 年龄 (混杂)

  22. 年龄调整发病率(标准化) 适用情况 不同人群之间的比较 不同时间之间的比较 除了年龄调整率这一综合度量外,仍应对不同人群、不同时间的年龄别 发病率进行比较。 计算方法 直接法 间接法 截缩调整发病率 35-64岁组(i=8 ~ i=13) 标准人口

  23. 直接法计算年龄调整发病率 i -----------年龄组标 ai -----------年龄组发病率 wi -----------标准人口的年龄组人口数 计算步骤(5步) 1、计算人群的年龄别率ai 2、 ai 与标准人口的年龄组人口数(wi)相乘 3、各年龄组的ai 与wi 的积相加得到∑aiwi 4、各年龄组wi 相加得到∑wi 5、计算年龄调整率(标化率)ASR= ∑aiwi/ ∑wi

  24. ASR是一理论率(“假值”),由关注人群的年龄别率与参照人口构成计算而获得。ASR是一理论率(“假值”),由关注人群的年龄别率与参照人口构成计算而获得。 • 参照人口被称作标准人口。 • 标准人口的各年龄组(i)的人口数称为权数Wi。 • 有很多套权数可以运用。 • 不同的标准人口计算出的标化率不同。 • 通常用世界标准人口(Segi‘s世界标准人口)、中国82年人口构成。 • 进行率的比较时,强调参照“新”的标准人口无任何意义(只会造成混乱与不便)。

  25. 年龄调整发病率(1/10万)

  26. 年龄调整发病率 ASR=48.8/10万

  27. 截缩(年龄)调整发病率(TASR) TASR= = 0.35+…+10.63/6000+…+4000 = 截缩率往往在数据质量不可靠时(如老年组及低年组率)用的多。

  28. 截缩率考虑到癌症发生的高峰年龄及 老年人群癌症登记数据的完整性和有效性问题,数据的灵敏度及稳定性佳。 儿童肿瘤的截缩率相对应的年龄别发病率和标准人口为0-14岁,即i从1到3,计算方 法相同。

  29. 胃癌标化率比较举例 卡利,哥伦比亚: 年龄 0-44 45-64 65+ 病例数(1982-86) 39 266 315 男性人口数 (1984) 524220 76304 22398 年龄别发病率ai(/10万) 1.5 69.7 281.3 世界标准人口wi 74000 19000 7000 ai × wi 111000 132400 196900 ASR= ∑aiwi/ ∑wi=111000+1324000+196900/7400+19000+7000 =3404000/100000=34.04/10万

  30. 伯明翰,英格兰: 年龄 0-44 45-64 65+ 病例数(1982-86) ri 79 1037 2352 男性人口数 (1984) ni 1683600 581500 291100 年龄别发病率ai(/10万) 1.2 44.6 202.0 世界标准人口wi 74000 19000 7000 ai × wi 89000 847000 141400 ASR= ∑aiwi/ ∑wi=89000+847000+141400/7400+19000+7000 =2350000/100000=23.5/10万

  31. 卡利与伯明翰地区男性胃癌比较 不同地区人群 胃癌 (暴露) (结果) 年龄 (混杂) 去除年龄的混杂影响: 伯明翰 Crude=33.9; ASR=23.5 卡利 Crude=19.9; ASR=34.0

  32. 年龄调整率(直接法)的标准误及可信区间 年龄调整率方差: Var(ASR)= 标准误 s.e.(ASR)= 可信区间 ASR ± Zα/2× (s.e.(ASR))

  33. 方差公式为Binomial 近似法(另一种为Poisson近似法) • 可信区间常用 95% 和 99% , Zα/2值分别为1.96和2.58

  34. 年龄调整率标准误计算(Poisson 近似法)

  35. 调整率方差: 标准误: ASR 95%可信区间: ASR±Zα/2 × (s.e.(ASR))=90.62±1.96×0.73 =89.19 — 92.05

  36. 两个标化(年龄调整)率(直接法)的比较 公式: (ASR1/ASR2) 1±2α/2/x ASR1/ASR2 为标准化率比(SRR) X= Zα/2 =1.96 为95%水平 Zα/2 =2.58 为99%水平 第一步计算出SRR 第二步计算X值 第三步计算SRR 95%(或99%)的上下限值,区间内不包括1.0,差异 有显著性意义

  37. 举例 苏格兰:1980-84年男性肺癌标化发病率90.6(ASR1),标准误0.73。 1960-64年男性肺癌标化发病率68.3(ASR2),标准误0.67。 计算SRR=ASR1/ASR2=90.6/68.3=1.326 X= = = =22.51 95%可信区间( Zα/2 =1.96)下限=(1.326) 1-(1.96/22.51)=1.29 上限=(1.326) 1+(1.96/22.51)=1.36 如果两个率相同那么SRR等于1,现SRR为1.326,而且95%区间(1.29-1.36) 不包括1,则两率的差异在5%的水平上有显著性意义。

  38. 累积率 定义 累积率(Cumulative rate):出生到74岁每岁的发病率相加后,以百分 数表示(儿童肿瘤为0-14岁)。 累积危险度(Cumulative risk):个体在某一年龄期间(如0-74)发 某种疾病的危险度,以百分数表示。 0-74岁累积率:如;0.0+0.0+………..265.7+354.1+369.2=1263.8 1263.8×5=6319.0 (6319.0 /1000000)×100(%)=6.3%

  39. 累积危险度 相互关系 例子 6.1% 累积率可作为累积危险度的近似估计值

  40. 比、比例 • 比(ratio),定义为一个变量的数值被另一个变量的数值来除所得到的商。这两个变量可以是单位相同,也可以不同。比的分子和分母是彼此分离的(不相包含或重叠)。比没有单位,其数值代表两个两个指标对比的一个指数。 如:男女性别发病比,死亡发病比等。 • 比例(proportion),表示同一事物局部与总体之间数量上的比值,分子分母单位相同,分子是分母的一部分。 如:发病(死亡)构成比、诊断依据百分比,病理组织学诊断比例, 死亡补发病的比例,未指明部位的肿瘤新病例的百分比等。

  41. 各死因死亡数占死亡总数百分比 恶性肿瘤占死亡总数的百分比(发病的百分比?) 胃癌占恶性肿瘤发生(死亡)总数的百分比(发病指标?)

  42. 数据审核与整理

  43. 内容 审核:数据质量 • 主要完整性指标 • 主要有效性指标 整理:表和图

  44. 数据审核 分子-病例数 分母-人口资料 (1)年度间人口总数的比较(不应出现较大的波动) (2)人口数的年度变化趋势是否合理 (3)如果各年人口数出现较大变动或不合理的变化趋势,应查找原因 (行政区的从新划分、人口的迁移(入)、自然灾害等),并作出充 分说明。 登记处内不同时间的发病动态稳定(存在随机波动,但不应出现突然 明显变化) 相似地区(登记处内、外)的肿瘤发病数(率)应大体一致

  45. xxx肿瘤登记处肿瘤新病例报告卡 编 号_______________ ICD编码__________   门诊号______________   住院号______________ 身份证号 口口口口口口口口口口口口口口口口口口    患者姓名___________ 性别__________ 实足年龄__________岁    出生年月——年——月——日 民族____________________    职 业 (具体工种、性质)______________ 工作单位_____________________    正式户口    详细地址_______________ 区、县_____________ 街道、乡________________    诊 断_____________________________    病理学类型_________________________ (如是继发性肿瘤请尽可能注明原发部位)    诊断日期______年____月____日    报告单位____________________报告医师__________报告时间_______年_____月_____日    死亡日期________年_____月_____日 死亡原因________________________________ 诊断依据:在序号上打∨ 1 临床  6 病理(继发) 2X线、CT、超声   7 病理(原发) 3 手术、尸检(无病理) 8 尸检(有病理) 4 生化、免疫 9 不详 5 细胞学、血片 0 死亡补发病

  46. 简单地讲:主要就是对发病报告卡上有关的变 量作频数。 查看报告卡内变量取值分布是否合理。 主要讲述:病理组织学诊断的比例 死亡补发病的比例 同期死亡发病比 未指明部位的肿瘤新发病例的百分比

  47. 组织学诊断确认的比例(HV%) (对诊断依据中编码5、6、7、8的做频数) • 登记病例中组织学(或镜检)方法作出诊断的百分比(HV%)是广泛地用 作评价数据完整性和有效性的一个指标。 • HV%的比例应在合理的范围,而非越高越好,较高比例的组织学诊断病 例,可能是由过多依赖于病理学实验室作为信息来源的病例发现的过程 引起,而通过其它信息来源的病例就会漏掉。因此非常高的HV%应当怀疑 病例的漏报(不完整性)。 • 不同肿瘤的HV%变化很大,同时依赖于当地医疗服务状况。 • 影像学技术(放射、超声)及生物技术的发展与应用影响HV%的高低。

  48. 组织学诊断确认比例 • 组织学确认(HV%)比是评价肿瘤登记有效性的正向指标。 • 组织学确认的诊断暗含部分可疑肿瘤病例已被病理学家排除。 • 一些难做病理学诊断的器官(脑、胰腺、肝脏等),如果HV%高,则被认为是转移癌的可能性小。 • 细胞学检查包括在组织学确认的范畴内。 • HV%计算时,登记的全部肿瘤作分母(包括DCO病例)

  49. 组织学确认(HV%)的比例 所有部位肿瘤的HV%接近100%,可能有漏报。 不同部位、不同地区(医疗服务水平不同) HV%存在差异。

More Related