1 / 56

肿瘤登记的基本统计方法

肿瘤登记的基本统计方法. 孙喜斌 河南省肿瘤肿瘤防治研究办公室. 登记资料统计分析. 肿瘤登记数据的结果一般以比值 ( 率、比、比例等 ) 的形式呈现。不同时间、不同人群间的比较是对各种率或比例值的比较。 (绝对数与相对数) 同时 , 一些比值也是评价登记质量的常用指标。. 内容. 率 (rate) 及率的标化 比例 (proportion) 比 (ratio). 率及率的标化. 定义、率、人年 粗率 年龄别率 标化率(年龄标化 - 直接法). 发生率 / 死亡率的计算需要两个元素: 1 、限定时期内限定人群中事件(发病、死亡 )

barbra
Download Presentation

肿瘤登记的基本统计方法

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 肿瘤登记的基本统计方法 孙喜斌 河南省肿瘤肿瘤防治研究办公室

  2. 登记资料统计分析 • 肿瘤登记数据的结果一般以比值(率、比、比例等)的形式呈现。不同时间、不同人群间的比较是对各种率或比例值的比较。 (绝对数与相对数) • 同时,一些比值也是评价登记质量的常用指标。

  3. 内容 • 率(rate)及率的标化 • 比例(proportion) • 比(ratio)

  4. 率及率的标化 • 定义、率、人年 • 粗率 • 年龄别率 • 标化率(年龄标化-直接法)

  5. 发生率/死亡率的计算需要两个元素: 1、限定时期内限定人群中事件(发病、死亡) 发生数——分子。 2、限定时期内限定人群的人年数——分母。

  6. xxx肿瘤登记处肿瘤新病例报告卡 编 号_______________ ICD编码__________   门诊号______________   住院号______________ 身份证号 口口口口口口口口口口口口口口口口口口    患者姓名___________ 性别__________ 实足年龄__________岁    出生年月——年——月——日 民族____________________    职 业 (具体工种、性质)______________ 工作单位_____________________    正式户口    详细地址_______________ 区、县_____________ 街道、乡________________    诊 断_____________________________    病理学类型_________________________ (如是继发性肿瘤请尽可能注明原发部位)    诊断日期______年____月____日    报告单位____________________报告医师__________报告时间_______年_____月_____日    死亡日期________年_____月_____日 死亡原因________________________________ 诊断依据:在序号上打∨ 1 临床  6 病理(继发) 2X线、CT、超声   7 病理(原发) 3 手术、尸检(无病理) 8 尸检(有病理) 4 生化、免疫 9 不详 5 细胞学、血片 0 死亡补发病

  7. 肿瘤登记病例信息 • 基本数据: • 年龄(发病/死亡) • 性别 • 原发部位(ICD) • 其它信息: • 时间(发病/死亡年份) • 诊断依据 • 病期 • 组织学类型 • 职业/婚姻 • 随访结果 • 生存时间

  8. 人口数据 • 登记地区相应年度内的(分性别、年龄组) 人口数 • 标准人口年龄构成(中国、世界)

  9. 理想中,想要知道人群中某一年龄个体在特 定时间点发生(癌症)的危险度: ——发病力 或 ——即刻发生率 实际上,我们只能估计到人群在某一时间段 内新病例(如癌症)的发生的频率(概率): ——发病率

  10. 新发病例数据 统计指标: • 年龄别率 • 粗率 • 标化率 • 截缩率 • 累积率 发病率:反映登记地区人群癌症负担指标

  11. 肿瘤发病率 公式 发病率= ×100000 男女性别、年龄别发生率 年龄组发病数过少时,评价变化意义不大(随机波动较大) 分部位的肿瘤发生率 合计年份资料的发病率计算

  12. 人口数(分母) • 如果是计算某年份的率则用年中人口数或 年初人口数+年末人口数/2 • 如一个时期(如5年)合计发病率则将5年的平均人口相加做分母,这一时期合计的发病数做分子(或中间年份人口数×时期长度)。

  13. 年龄别发病率 • 考虑年龄分组:0-4,5-9,10-14,…80-84, 85+. 年龄分18组(i=1,2,3,……18; A=18) 以ri 代表(一定时期内)第i年龄组的肿瘤发生数; 全部年龄组的肿瘤发生数为R,则: R= r1 +r2 + r3+…...+ rA 同样以ni 为相同时期的第i年龄组的人口数,各年龄人 口数合计为N, 则: N= n1 +n 2 + n3+…...+ nA

  14. 每100,000人年的粗率(全部年龄组)为: 粗率=C = ×100000 i.e. C= ×100000 各年龄组发病率为ai ,则: ai= ×100000

  15. 例1. 粗率和年龄别发病率计算表1 1980-84年苏格兰男性肺癌发生数据

  16. 年龄别发病率的计算 例如40-44岁组(i=9): a9= ×100000 = ×100000 = 21.1/10万

  17. 粗率计算 发病粗率 C 各年龄组合计发病数为16404, R= =16404 各年龄组合计人口数为12420220, N= =12430220 C= = ×100000 =132.1/10万

  18. 男性胃癌粗率比较 卡里,哥伦比亚 新发病例数(1982-86) 620 男性人口数(1984) 622922 年均粗率 19.9/10万 =620/(5×622922) 伯明翰, 英格兰 发病率数 (1983-86) 3468 男性人口数(1984) 2556200 年均粗率 33.9/10万 =3468/(4×2556200) 伯明翰男性发生胃癌的危险高于卡利男性吗??

  19. 男性胃癌粗率比较(分年龄组) 卡利CR=19.9 per 100000 年龄 0-44 45-64 65+ 病例数(1982-86) 39 266 315 男性人口数 (1984) 524220 76304 22398 年均发病率(/10万) 1.5 69.7 281.3 人口年龄构成比(1984) 84 12 4 伯明翰CR=33.9 per 100000 年龄 0-44 45-64 65+ 病例数(1983-86) 79 1037 2353 男性人口数 (1984) 1683600 581500 291100 年均发病率(/10万) 1.2 44.6 202.0 人口年龄构成比(1984) 66 23 11

  20. 粗率 • 描述癌症负担的指标。 • 比较时往往产生误导。 • 年龄是癌症发生的重要决定因素。 • 进行率的比较时,一定要考虑不同年龄构成的影响。 • 粗率没有考虑年龄的影响。 • 因此,要对年龄别发病率进行比较。

  21. 不同地区的胃癌比较 不同地区人群 胃癌 (暴露) (结果) 年龄 (混杂)

  22. 年龄调整发病率(标准化) 适用情况 不同人群之间的比较 不同时间之间的比较 除了年龄调整率这一综合度量外,仍应对不同人群、不同时间的年龄别 发病率进行比较。 计算方法 直接法 间接法 截缩调整发病率 35-64岁组(i=8 ~ i=13) 标准人口

  23. 直接法计算年龄调整发病率 i -----------年龄组标 ai -----------年龄组发病率 wi -----------标准人口的年龄组人口数 计算步骤(5步) 1、计算人群的年龄别率ai 2、 ai 与标准人口的年龄组人口数(wi)相乘 3、各年龄组的ai 与wi 的积相加得到∑aiwi 4、各年龄组wi 相加得到∑wi 5、计算年龄调整率(标化率)ASR= ∑aiwi/ ∑wi

  24. ASR是一理论率(“假值”),由关注人群的年龄别率与参照人口构成计算而获得。ASR是一理论率(“假值”),由关注人群的年龄别率与参照人口构成计算而获得。 • 参照人口被称作标准人口。 • 标准人口的各年龄组(i)的人口数称为权数Wi。 • 有很多套权数可以运用。 • 不同的标准人口计算出的标化率不同。 • 通常用世界标准人口(Segi‘s世界标准人口)、中国82年人口构成。 • 进行率的比较时,强调参照“新”与“旧”的标准人口无任何意义(只会造成混乱与不便)。

  25. 年龄调整发病率(1/10万)

  26. 年龄调整发病率 ASR=48.8/10万

  27. 截缩(年龄)调整发病率(TASR) TASR= = 0.35+0.89+1.76+6.14+10.63/6000+6000+5000+4000+4000 = 截缩率往往在数据质量不可靠时(如老年组及低年组率)用的较多。

  28. 截缩率考虑到癌症发生的高峰年龄及 老年人群癌症登记数据存在的完整性和有 效性问题,数据的灵敏度及稳定性佳。 儿童肿瘤的截缩率相对应的年龄别发病率和标准人口为0-14岁,即i从1到3,计算方 法相同。

  29. 标化率比较举例 卡利,哥伦比亚: 年龄 0-44 45-64 65+ 病例数(1982-86) 39 266 315 男性人口数 (1984) 524220 76304 22398 年龄别发病率ai(/10万) 1.5 69.7 281.3 世界标准人口wi 74000 19000 7000 ai × wi 111000 132400 196900 ASR= ∑aiwi/ ∑wi=111000+1324000+196900/7400+19000+7000 =3404000/100000=34.04/10万

  30. 伯明翰,英格兰: 年龄 0-44 45-64 65+ 病例数(1982-86) ri 79 1037 2352 男性人口数 (1984) ni 1683600 581500 291100 年龄别发病率ai(/10万) 1.2 44.6 202.0 世界标准人口wi 74000 19000 7000 ai × wi 89000 847000 141400 ASR= ∑aiwi/ ∑wi=89000+847000+141400/7400+19000+7000 =2350000/100000=23.5/10万

  31. 卡利与伯明翰地区男性胃癌比较 不同地区人群 胃癌 (暴露) (结果) 年龄 (混杂) 去除年龄的混杂影响: 伯明翰 Crude=33.9; ASR=23.5 卡利 Crude=19.9; ASR=34.0

  32. 年龄调整率(直接法)的标准误及可信区间 年龄调整率方差: Var(ASR)= 标准误 s.e.(ASR)= 可信区间 ASR ± Zα/2× (s.e.(ASR))

  33. 方差公式为Binomial 近似法(另一种为Poisson近似法) • 可信区间常用 95% 和 99% , Zα/2值分别为1.96和2.58

  34. 年龄调整率标准误计算(Poisson 近似法)

  35. 调整率方差: 标准误: ASR 95%可信区间: ASR±Zα/2 × (s.e.(ASR))=90.62±1.96×0.73 =89.19 — 92.05

  36. 两个标化(年龄调整)率(直接法)的比较 公式: (ASR1/ASR2) 1±2α/2/x ASR1/ASR2 为标准化率比(SRR) X= Zα/2 =1.96 为95%水平 Zα/2 =2.58 为99%水平 第一步计算出SRR 第二步计算X值 第三步计算SRR 95%(或99%)的上下限值,区间内不包括1.0,差异 有显著性意义

  37. 举例 苏格兰:1980-84年男性肺癌标化发病率90.6(ASR1),标准误0.73。 1960-64年男性肺癌标化发病率68.3(ASR2),标准误0.67。 计算SRR=ASR1/ASR2=90.6/68.3=1.326 X= = = =22.51 95%可信区间( Zα/2 =1.96)下限=(1.326) 1-(1.96/22.51)=1.29 上限=(1.326) 1+(1.96/22.51)=1.36 如果两个率相同那么SRR等于1,现SRR为1.326,而且95%区间(1.29-1.36) 不包括1,则两率的差异在5%的水平上有显著性意义。

  38. 累积率 定义 累积率(Cumulative rate):出生到74岁每岁的发病率相加后,以百分 数表示(儿童肿瘤为0-14岁)。 累积危险度(Cumulative risk):个体在某一年龄期间(如0-74)发 某种疾病的危险度,以百分数表示。 某市男性肺癌年龄别发病率如下: 0- 5- 10- 15- 20- 25- 30- 35- 40- 45- 50- 55- 60- 65- 70- 75- 0 0 0 0 0 0.7 0.5 5.8 14.8 …………… 369.2 416.9 0-74岁累积率:如;0.0+0.0+………..265.7+354.1+369.2=1263.8 1263.8×5=6319.0 (6319.0 /1000000)×100(%)=6.3%

  39. 累积危险度 相互关系 例子 6.1% 累积率可作为累积危险度的近似估计值

  40. 比、比例 • 比(ratio),定义为一个变量的数值被另一个变量的数值来除所得到的商。这两个变量可以是单位相同,也可以不同。比的分子和分母是彼此分离的(不相包含或重叠)。比没有单位,其数值代表两个两个指标对比的一个指数。 如:男女性别发病比,死亡发病比等。 • 比例(proportion),表示同一事物局部与总体之间数量上的比值,分子分母单位相同,分子是分母的一部分。 如:发病(死亡)构成比、诊断依据百分比,病理组织学诊断比例, 死亡补发病的比例,未指明部位的肿瘤新病例的百分比等。

  41. 各死因死亡数占死亡总数百分比 恶性肿瘤占死亡总数的百分比 胃癌占恶性肿瘤死亡总数的百分比

  42. 数据整理与审核

  43. 登记机构年报内容 登记机构简介 登记地区及人口 恶性肿瘤分类 性别、年龄和部位分组例数 常见恶性肿瘤(前十位) 图示法 专题报告内容 长期累积资料统计分析 检查错误和补充遗漏等 时间趋势和生存率统计 登记资料的质量评价

  44. 肿瘤登记机构简介 • 机构名称、地址、负责人及其专业及登记机构工作概况 病例报告形式(主动收集、被动报告,混合) 随访情况(主动、被动) 资料的计算机化程度

  45. 登记地区医疗及人口情况 介绍登记覆盖地区范围及医疗资源情况(肿瘤诊治水平)和 分性别、分年龄组的人口

  46. 肿瘤编码标准及报告病例范围 • ICD-O, ICD-10 • 尸检、筛查病例 • 中枢神经系统良性肿瘤 • 原位癌 • 细胞学诊断是否作为病理组织学诊断登记

  47. 报告期内恶性肿瘤分性别、年龄和部位病例数及死亡数如下表:某地某年X性恶性肿瘤发病例数(死亡数)报告期内恶性肿瘤分性别、年龄和部位病例数及死亡数如下表:某地某年X性恶性肿瘤发病例数(死亡数)

  48. 十个常见肿瘤部位 • 分性别的十个常见肿瘤部位的登记病例数、粗发病率(死亡率)和年龄调整率,见下表: 表 xx 某地某年性前十位恶性肿瘤发病率(死亡率)(1/10万) *世界标准人口构成

  49. 年度报告内常用的一些统计指标 • 登记时期分性别的各部位年龄组发病(死亡)率、粗率、及年龄调整率。 • 35-64岁截缩率 • 0-74岁累积率 • 各部位肿瘤新病例(死亡)数占新病例(死亡)总数的构成比。

More Related