560 likes | 720 Views
肿瘤登记的基本统计方法. 孙喜斌 河南省肿瘤肿瘤防治研究办公室. 登记资料统计分析. 肿瘤登记数据的结果一般以比值 ( 率、比、比例等 ) 的形式呈现。不同时间、不同人群间的比较是对各种率或比例值的比较。 (绝对数与相对数) 同时 , 一些比值也是评价登记质量的常用指标。. 内容. 率 (rate) 及率的标化 比例 (proportion) 比 (ratio). 率及率的标化. 定义、率、人年 粗率 年龄别率 标化率(年龄标化 - 直接法). 发生率 / 死亡率的计算需要两个元素: 1 、限定时期内限定人群中事件(发病、死亡 )
E N D
肿瘤登记的基本统计方法 孙喜斌 河南省肿瘤肿瘤防治研究办公室
登记资料统计分析 • 肿瘤登记数据的结果一般以比值(率、比、比例等)的形式呈现。不同时间、不同人群间的比较是对各种率或比例值的比较。 (绝对数与相对数) • 同时,一些比值也是评价登记质量的常用指标。
内容 • 率(rate)及率的标化 • 比例(proportion) • 比(ratio)
率及率的标化 • 定义、率、人年 • 粗率 • 年龄别率 • 标化率(年龄标化-直接法)
发生率/死亡率的计算需要两个元素: 1、限定时期内限定人群中事件(发病、死亡) 发生数——分子。 2、限定时期内限定人群的人年数——分母。
xxx肿瘤登记处肿瘤新病例报告卡 编 号_______________ ICD编码__________ 门诊号______________ 住院号______________ 身份证号 口口口口口口口口口口口口口口口口口口 患者姓名___________ 性别__________ 实足年龄__________岁 出生年月——年——月——日 民族____________________ 职 业 (具体工种、性质)______________ 工作单位_____________________ 正式户口 详细地址_______________ 区、县_____________ 街道、乡________________ 诊 断_____________________________ 病理学类型_________________________ (如是继发性肿瘤请尽可能注明原发部位) 诊断日期______年____月____日 报告单位____________________报告医师__________报告时间_______年_____月_____日 死亡日期________年_____月_____日 死亡原因________________________________ 诊断依据:在序号上打∨ 1 临床 6 病理(继发) 2X线、CT、超声 7 病理(原发) 3 手术、尸检(无病理) 8 尸检(有病理) 4 生化、免疫 9 不详 5 细胞学、血片 0 死亡补发病
肿瘤登记病例信息 • 基本数据: • 年龄(发病/死亡) • 性别 • 原发部位(ICD) • 其它信息: • 时间(发病/死亡年份) • 诊断依据 • 病期 • 组织学类型 • 职业/婚姻 • 随访结果 • 生存时间
人口数据 • 登记地区相应年度内的(分性别、年龄组) 人口数 • 标准人口年龄构成(中国、世界)
理想中,想要知道人群中某一年龄个体在特 定时间点发生(癌症)的危险度: ——发病力 或 ——即刻发生率 实际上,我们只能估计到人群在某一时间段 内新病例(如癌症)的发生的频率(概率): ——发病率
新发病例数据 统计指标: • 年龄别率 • 粗率 • 标化率 • 截缩率 • 累积率 发病率:反映登记地区人群癌症负担指标
肿瘤发病率 公式 发病率= ×100000 男女性别、年龄别发生率 年龄组发病数过少时,评价变化意义不大(随机波动较大) 分部位的肿瘤发生率 合计年份资料的发病率计算
人口数(分母) • 如果是计算某年份的率则用年中人口数或 年初人口数+年末人口数/2 • 如一个时期(如5年)合计发病率则将5年的平均人口相加做分母,这一时期合计的发病数做分子(或中间年份人口数×时期长度)。
年龄别发病率 • 考虑年龄分组:0-4,5-9,10-14,…80-84, 85+. 年龄分18组(i=1,2,3,……18; A=18) 以ri 代表(一定时期内)第i年龄组的肿瘤发生数; 全部年龄组的肿瘤发生数为R,则: R= r1 +r2 + r3+…...+ rA 同样以ni 为相同时期的第i年龄组的人口数,各年龄人 口数合计为N, 则: N= n1 +n 2 + n3+…...+ nA
每100,000人年的粗率(全部年龄组)为: 粗率=C = ×100000 i.e. C= ×100000 各年龄组发病率为ai ,则: ai= ×100000
例1. 粗率和年龄别发病率计算表1 1980-84年苏格兰男性肺癌发生数据
年龄别发病率的计算 例如40-44岁组(i=9): a9= ×100000 = ×100000 = 21.1/10万
粗率计算 发病粗率 C 各年龄组合计发病数为16404, R= =16404 各年龄组合计人口数为12420220, N= =12430220 C= = ×100000 =132.1/10万
男性胃癌粗率比较 卡里,哥伦比亚 新发病例数(1982-86) 620 男性人口数(1984) 622922 年均粗率 19.9/10万 =620/(5×622922) 伯明翰, 英格兰 发病率数 (1983-86) 3468 男性人口数(1984) 2556200 年均粗率 33.9/10万 =3468/(4×2556200) 伯明翰男性发生胃癌的危险高于卡利男性吗??
男性胃癌粗率比较(分年龄组) 卡利CR=19.9 per 100000 年龄 0-44 45-64 65+ 病例数(1982-86) 39 266 315 男性人口数 (1984) 524220 76304 22398 年均发病率(/10万) 1.5 69.7 281.3 人口年龄构成比(1984) 84 12 4 伯明翰CR=33.9 per 100000 年龄 0-44 45-64 65+ 病例数(1983-86) 79 1037 2353 男性人口数 (1984) 1683600 581500 291100 年均发病率(/10万) 1.2 44.6 202.0 人口年龄构成比(1984) 66 23 11
粗率 • 描述癌症负担的指标。 • 比较时往往产生误导。 • 年龄是癌症发生的重要决定因素。 • 进行率的比较时,一定要考虑不同年龄构成的影响。 • 粗率没有考虑年龄的影响。 • 因此,要对年龄别发病率进行比较。
不同地区的胃癌比较 不同地区人群 胃癌 (暴露) (结果) 年龄 (混杂)
年龄调整发病率(标准化) 适用情况 不同人群之间的比较 不同时间之间的比较 除了年龄调整率这一综合度量外,仍应对不同人群、不同时间的年龄别 发病率进行比较。 计算方法 直接法 间接法 截缩调整发病率 35-64岁组(i=8 ~ i=13) 标准人口
直接法计算年龄调整发病率 i -----------年龄组标 ai -----------年龄组发病率 wi -----------标准人口的年龄组人口数 计算步骤(5步) 1、计算人群的年龄别率ai 2、 ai 与标准人口的年龄组人口数(wi)相乘 3、各年龄组的ai 与wi 的积相加得到∑aiwi 4、各年龄组wi 相加得到∑wi 5、计算年龄调整率(标化率)ASR= ∑aiwi/ ∑wi
ASR是一理论率(“假值”),由关注人群的年龄别率与参照人口构成计算而获得。ASR是一理论率(“假值”),由关注人群的年龄别率与参照人口构成计算而获得。 • 参照人口被称作标准人口。 • 标准人口的各年龄组(i)的人口数称为权数Wi。 • 有很多套权数可以运用。 • 不同的标准人口计算出的标化率不同。 • 通常用世界标准人口(Segi‘s世界标准人口)、中国82年人口构成。 • 进行率的比较时,强调参照“新”与“旧”的标准人口无任何意义(只会造成混乱与不便)。
年龄调整发病率 ASR=48.8/10万
截缩(年龄)调整发病率(TASR) TASR= = 0.35+0.89+1.76+6.14+10.63/6000+6000+5000+4000+4000 = 截缩率往往在数据质量不可靠时(如老年组及低年组率)用的较多。
截缩率考虑到癌症发生的高峰年龄及 老年人群癌症登记数据存在的完整性和有 效性问题,数据的灵敏度及稳定性佳。 儿童肿瘤的截缩率相对应的年龄别发病率和标准人口为0-14岁,即i从1到3,计算方 法相同。
标化率比较举例 卡利,哥伦比亚: 年龄 0-44 45-64 65+ 病例数(1982-86) 39 266 315 男性人口数 (1984) 524220 76304 22398 年龄别发病率ai(/10万) 1.5 69.7 281.3 世界标准人口wi 74000 19000 7000 ai × wi 111000 132400 196900 ASR= ∑aiwi/ ∑wi=111000+1324000+196900/7400+19000+7000 =3404000/100000=34.04/10万
伯明翰,英格兰: 年龄 0-44 45-64 65+ 病例数(1982-86) ri 79 1037 2352 男性人口数 (1984) ni 1683600 581500 291100 年龄别发病率ai(/10万) 1.2 44.6 202.0 世界标准人口wi 74000 19000 7000 ai × wi 89000 847000 141400 ASR= ∑aiwi/ ∑wi=89000+847000+141400/7400+19000+7000 =2350000/100000=23.5/10万
卡利与伯明翰地区男性胃癌比较 不同地区人群 胃癌 (暴露) (结果) 年龄 (混杂) 去除年龄的混杂影响: 伯明翰 Crude=33.9; ASR=23.5 卡利 Crude=19.9; ASR=34.0
年龄调整率(直接法)的标准误及可信区间 年龄调整率方差: Var(ASR)= 标准误 s.e.(ASR)= 可信区间 ASR ± Zα/2× (s.e.(ASR))
方差公式为Binomial 近似法(另一种为Poisson近似法) • 可信区间常用 95% 和 99% , Zα/2值分别为1.96和2.58
调整率方差: 标准误: ASR 95%可信区间: ASR±Zα/2 × (s.e.(ASR))=90.62±1.96×0.73 =89.19 — 92.05
两个标化(年龄调整)率(直接法)的比较 公式: (ASR1/ASR2) 1±2α/2/x ASR1/ASR2 为标准化率比(SRR) X= Zα/2 =1.96 为95%水平 Zα/2 =2.58 为99%水平 第一步计算出SRR 第二步计算X值 第三步计算SRR 95%(或99%)的上下限值,区间内不包括1.0,差异 有显著性意义
举例 苏格兰:1980-84年男性肺癌标化发病率90.6(ASR1),标准误0.73。 1960-64年男性肺癌标化发病率68.3(ASR2),标准误0.67。 计算SRR=ASR1/ASR2=90.6/68.3=1.326 X= = = =22.51 95%可信区间( Zα/2 =1.96)下限=(1.326) 1-(1.96/22.51)=1.29 上限=(1.326) 1+(1.96/22.51)=1.36 如果两个率相同那么SRR等于1,现SRR为1.326,而且95%区间(1.29-1.36) 不包括1,则两率的差异在5%的水平上有显著性意义。
累积率 定义 累积率(Cumulative rate):出生到74岁每岁的发病率相加后,以百分 数表示(儿童肿瘤为0-14岁)。 累积危险度(Cumulative risk):个体在某一年龄期间(如0-74)发 某种疾病的危险度,以百分数表示。 某市男性肺癌年龄别发病率如下: 0- 5- 10- 15- 20- 25- 30- 35- 40- 45- 50- 55- 60- 65- 70- 75- 0 0 0 0 0 0.7 0.5 5.8 14.8 …………… 369.2 416.9 0-74岁累积率:如;0.0+0.0+………..265.7+354.1+369.2=1263.8 1263.8×5=6319.0 (6319.0 /1000000)×100(%)=6.3%
累积危险度 相互关系 例子 6.1% 累积率可作为累积危险度的近似估计值
比、比例 • 比(ratio),定义为一个变量的数值被另一个变量的数值来除所得到的商。这两个变量可以是单位相同,也可以不同。比的分子和分母是彼此分离的(不相包含或重叠)。比没有单位,其数值代表两个两个指标对比的一个指数。 如:男女性别发病比,死亡发病比等。 • 比例(proportion),表示同一事物局部与总体之间数量上的比值,分子分母单位相同,分子是分母的一部分。 如:发病(死亡)构成比、诊断依据百分比,病理组织学诊断比例, 死亡补发病的比例,未指明部位的肿瘤新病例的百分比等。
各死因死亡数占死亡总数百分比 恶性肿瘤占死亡总数的百分比 胃癌占恶性肿瘤死亡总数的百分比
登记机构年报内容 登记机构简介 登记地区及人口 恶性肿瘤分类 性别、年龄和部位分组例数 常见恶性肿瘤(前十位) 图示法 专题报告内容 长期累积资料统计分析 检查错误和补充遗漏等 时间趋势和生存率统计 登记资料的质量评价
肿瘤登记机构简介 • 机构名称、地址、负责人及其专业及登记机构工作概况 病例报告形式(主动收集、被动报告,混合) 随访情况(主动、被动) 资料的计算机化程度
登记地区医疗及人口情况 介绍登记覆盖地区范围及医疗资源情况(肿瘤诊治水平)和 分性别、分年龄组的人口
肿瘤编码标准及报告病例范围 • ICD-O, ICD-10 • 尸检、筛查病例 • 中枢神经系统良性肿瘤 • 原位癌 • 细胞学诊断是否作为病理组织学诊断登记
报告期内恶性肿瘤分性别、年龄和部位病例数及死亡数如下表:某地某年X性恶性肿瘤发病例数(死亡数)报告期内恶性肿瘤分性别、年龄和部位病例数及死亡数如下表:某地某年X性恶性肿瘤发病例数(死亡数)
十个常见肿瘤部位 • 分性别的十个常见肿瘤部位的登记病例数、粗发病率(死亡率)和年龄调整率,见下表: 表 xx 某地某年性前十位恶性肿瘤发病率(死亡率)(1/10万) *世界标准人口构成
年度报告内常用的一些统计指标 • 登记时期分性别的各部位年龄组发病(死亡)率、粗率、及年龄调整率。 • 35-64岁截缩率 • 0-74岁累积率 • 各部位肿瘤新病例(死亡)数占新病例(死亡)总数的构成比。