肿瘤登记的基本统计方法
This presentation is the property of its rightful owner.
Sponsored Links
1 / 75

肿瘤登记的基本统计方法 PowerPoint PPT Presentation


  • 97 Views
  • Uploaded on
  • Presentation posted in: General

肿瘤登记的基本统计方法. 孙喜斌 河南省肿瘤肿瘤防治研究办公室. 登记资料统计分析. 肿瘤登记数据的结果一般以比值 ( 率、比、比例等 ) 的形式呈现 , 不同时间、不同人群间的比较是对各种率或比例值的比较。 同时 , 一些比值也是评价登记质量的常用指标。. 内容. 率 (rate) 及率的标化 比例 (proportion) 比 (ratio). 率及率的标化. 定义、率、人年 粗率 年龄别率 标化率(年龄标化 - 直接法). 发生率 / 死亡率的计算需要两个元素: 1 、限定时期内限定人群中事件(发病、死亡 ) 发生数 — 分子。

Download Presentation

肿瘤登记的基本统计方法

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


3846853

肿瘤登记的基本统计方法

孙喜斌

河南省肿瘤肿瘤防治研究办公室


3846853

登记资料统计分析

  • 肿瘤登记数据的结果一般以比值(率、比、比例等)的形式呈现, 不同时间、不同人群间的比较是对各种率或比例值的比较。

  • 同时,一些比值也是评价登记质量的常用指标。


3846853

内容

  • 率(rate)及率的标化

  • 比例(proportion)

  • 比(ratio)


3846853

率及率的标化

  • 定义、率、人年

  • 粗率

  • 年龄别率

  • 标化率(年龄标化-直接法)


3846853

发生率/死亡率的计算需要两个元素:

1、限定时期内限定人群中事件(发病、死亡)

发生数—分子。

2、限定时期内限定人群的人年数—分母。


3846853

xxx肿瘤登记处肿瘤新病例报告卡

编 号_______________

ICD编码__________

  门诊号______________

  住院号______________ 身份证号 口口口口口口口口口口口口口口口口口口

   患者姓名___________ 性别__________ 实足年龄__________岁

   出生年月——年——月——日 民族____________________

   职 业

(具体工种、性质)______________ 工作单位_____________________

   正式户口

   详细地址_______________ 区、县_____________ 街道、乡________________

   诊 断_____________________________

   病理学类型_________________________

(如是继发性肿瘤请尽可能注明原发部位)

   诊断日期______年____月____日

   报告单位____________________报告医师__________报告时间_______年_____月_____日

   死亡日期________年_____月_____日 死亡原因________________________________

诊断依据:在序号上打∨

1 临床  6 病理(继发)

2X线、CT、超声   7 病理(原发)

3 手术、尸检(无病理) 8 尸检(有病理)

4 生化、免疫 9 不详

5 细胞学、血片 0 死亡补发病


3846853

肿瘤登记病例信息

  • 基本数据:

    • 年龄(发病/死亡)

    • 性别

    • 原发部位(ICD)

  • 其它信息:

    • 时间(发病/死亡年份)

    • 诊断依据

    • 病期

    • 组织学类型

    • 职业/婚姻

    • 随访结果

    • 生存时间


3846853

人口数据

  • 登记地区相应年度内的(分性别、年龄组)

    人口数

  • 标准人口年龄构成(中国、世界)


3846853

理想中,想要知道人群中某一年龄个体在特

定时间点发生(癌症)的危险度:

——发病力或

——即刻发生率

实际上,我们只能估计到人群在某一时间段

内新病例(如癌症)的发生的频率(概率):

——发病率


3846853

新发病例数据

统计指标:

  • 年龄别率

  • 粗率

  • 标化率

  • 截缩率

  • 累积率

发病率:反映登记地区人群癌症负担指标


3846853

肿瘤发病率

公式

发病率= ×100000

男女性别、年龄别发生率

年龄组发病数过少时变化意义不大(随机波动较大)

分部位的肿瘤发生率

合计年份资料的发病率计算


3846853

人口数(分母)

  • 如果是计算某年份的率则用年中人口数或

    年初人口数+年末人口数/2

  • 如一个时期(如5年)合计发病率则将5年的平均人口相加做分母(或中间年份人口数×时期长度),这一时期合计的发病数做分子。


3846853

年龄别发病率

  • 考虑年龄分组:0-4,5-9,10-14,…80-84, 85+. 年龄分18组(i=1,2,3,……18; A=18)

    以ri 代表(一定时期内)第i年龄组的肿瘤发生数;

    全部年龄组的肿瘤发生数为R,则:

    R= r1 +r2 + r3+…...+ rA

    同样以ni 为相同时期的第i年龄组的人口数,各年龄人

    口数合计为N, 则:

    N= n1 +n 2 + n3+…...+ nA


3846853

每100,000人年的粗率(全部年龄组)为:

粗率=C = ×100000

i.e. C= ×100000

各年龄组发病率为ai ,则: ai= ×100000


1 1 1980 84

例1. 粗率和年龄别发病率计算表1 1980-84年苏格兰男性肺癌发生数据


3846853

年龄别发病率的计算

例如40-44岁组(i=9):

a9= ×100000

= ×100000

= 21.1/10万


3846853

粗率计算

发病粗率 C

各年龄组合计发病数为16404, R= =16404

各年龄组合计人口数为12420220,

N= =12420220

C= = ×100000

=132.1/10万


3846853

男性胃癌粗率比较

卡里,哥伦比亚

新发病例数(1982-86) 620

男性人口数(1984) 622922

年均粗率 19.9/10万

=620/(5×622922)

伯明翰, 英格兰

发病率数 (1983-86) 3468

男性人口数(1984) 2556200

年均粗率 33.9/10万

=3468/(4×2556200)

伯明翰男性发生胃癌的危险高于卡利的男性吗??


3846853

粗率

  • 描述癌症负担的指标。

  • 比较时往往产生误导。

  • 年龄是癌症发生的重要决定因素。

  • 进行率的比较时,一定要考虑不同年龄构成的影响。

  • 粗率没有考虑年龄的影响。

  • 因此,要对年龄别发病率进行比较。


3846853

男性胃癌年龄别率比较

卡利CR=19.9 per 100000

年龄 0-44 45-64 65+

病例数(1982-86) 39 266 315

男性人口数 (1984) 524220 76304 22398

年均发病率(/10万) 1.5 69.7 281.3

人口年龄构成比(1984) 84 12 4

伯明翰CR=33.9 per 100000

年龄 0-44 45-64 65+

病例数(1983-86) 79 1037 2353

男性人口数 (1984) 1683600 581500 291100

年均发病率(/10万) 1.2 44.6 202.0

人口年龄构成比(1984) 66 23 11


3846853

不同地区的胃癌比较

不同地区人群 胃癌

(暴露) (结果)

年龄

(混杂)


3846853

年龄调整发病率(标准化)

适用情况

不同人群之间的比较

不同时间之间的比较

除了年龄调整率这一综合度量外,仍应对不同人群、不同时间的年龄别

发病率进行比较。

计算方法

直接法

间接法

截缩调整发病率

35-64岁组(i=8 ~ i=13)

标准人口


3846853

直接法计算年龄调整发病率

i -----------年龄组标

ai -----------年龄组发病率

wi -----------标准人口的年龄组人口数

计算步骤(5步)

1、计算人群的年龄别率ai

2、 ai 与标准人口的年龄组人口数(wi)相乘

3、各年龄组的ai 与wi 的积相加得到∑aiwi

4、各年龄组wi 相加得到∑wi

5、计算年龄调整率(标化率)ASR= ∑aiwi/ ∑wi


3846853

  • ASR是一理论率(“假值”),由关注人群的年龄别率与参照人口构成计算而获得。

  • 参照人口被称作标准人口。

  • 标准人口的各年龄组(i)的人口数称为权数Wi。

  • 有很多套权数可以运用。

  • 不同的标准人口计算出的标化率不同。

  • 通常用世界标准人口(Segi‘s世界标准人口)、中国82年人口构成。

  • 进行率的比较时,强调参照“新”的标准人口无任何意义(只会造成混乱与不便)。


3846853

年龄调整发病率(1/10万)


3846853

年龄调整发病率

ASR=48.8/10万


3846853

截缩(年龄)调整发病率(TASR)

TASR= = 0.35+…+10.63/6000+…+4000

=

截缩率往往在数据质量不可靠时(如老年组及低年组率)用的多。


3846853

截缩率考虑到癌症发生的高峰年龄及

老年人群癌症登记数据的完整性和有效性问题,数据的灵敏度及稳定性佳。

儿童肿瘤的截缩率相对应的年龄别发病率和标准人口为0-14岁,即i从1到3,计算方 法相同。


3846853

胃癌标化率比较举例

卡利,哥伦比亚:

年龄 0-44 45-64 65+

病例数(1982-86) 39 266 315

男性人口数 (1984) 524220 76304 22398

年龄别发病率ai(/10万) 1.5 69.7 281.3

世界标准人口wi 74000 19000 7000

ai × wi 111000 132400 196900

ASR= ∑aiwi/ ∑wi=111000+1324000+196900/7400+19000+7000

=3404000/100000=34.04/10万


3846853

伯明翰,英格兰:

年龄 0-44 45-64 65+

病例数(1982-86) ri 79 1037 2352

男性人口数 (1984) ni 1683600 581500 291100

年龄别发病率ai(/10万) 1.2 44.6 202.0

世界标准人口wi 74000 19000 7000

ai × wi 89000 847000 141400

ASR= ∑aiwi/ ∑wi=89000+847000+141400/7400+19000+7000

=2350000/100000=23.5/10万


3846853

卡利与伯明翰地区男性胃癌比较

不同地区人群 胃癌

(暴露) (结果)

年龄

(混杂)

去除年龄的混杂影响:

伯明翰 Crude=33.9; ASR=23.5

卡利 Crude=19.9; ASR=34.0


3846853

年龄调整率(直接法)的标准误及可信区间

年龄调整率方差:

Var(ASR)=

标准误 s.e.(ASR)=

可信区间 ASR ± Zα/2× (s.e.(ASR))


3846853

  • 方差公式为Binomial 近似法(另一种为Poisson近似法)

  • 可信区间常用 95% 和 99% , Zα/2值分别为1.96和2.58


Poisson

年龄调整率标准误计算(Poisson 近似法)


3846853

调整率方差:

标准误:

ASR 95%可信区间:

ASR±Zα/2 × (s.e.(ASR))=90.62±1.96×0.73

=89.19 — 92.05


3846853

两个标化(年龄调整)率(直接法)的比较

公式: (ASR1/ASR2) 1±2α/2/x

ASR1/ASR2 为标准化率比(SRR)

X=

Zα/2 =1.96 为95%水平

Zα/2 =2.58 为99%水平

第一步计算出SRR

第二步计算X值

第三步计算SRR 95%(或99%)的上下限值,区间内不包括1.0,差异

有显著性意义


3846853

举例

苏格兰:1980-84年男性肺癌标化发病率90.6(ASR1),标准误0.73。

1960-64年男性肺癌标化发病率68.3(ASR2),标准误0.67。

计算SRR=ASR1/ASR2=90.6/68.3=1.326

X= = =

=22.51

95%可信区间( Zα/2 =1.96)下限=(1.326) 1-(1.96/22.51)=1.29

上限=(1.326) 1+(1.96/22.51)=1.36

如果两个率相同那么SRR等于1,现SRR为1.326,而且95%区间(1.29-1.36)

不包括1,则两率的差异在5%的水平上有显著性意义。


3846853

累积率

定义

累积率(Cumulative rate):出生到74岁每岁的发病率相加后,以百分

数表示(儿童肿瘤为0-14岁)。

累积危险度(Cumulative risk):个体在某一年龄期间(如0-74)发

某种疾病的危险度,以百分数表示。

0-74岁累积率:如;0.0+0.0+………..265.7+354.1+369.2=1263.8

1263.8×5=6319.0

(6319.0 /1000000)×100(%)=6.3%


3846853

累积危险度

相互关系

例子

6.1%

累积率可作为累积危险度的近似估计值


3846853

比、比例

  • 比(ratio),定义为一个变量的数值被另一个变量的数值来除所得到的商。这两个变量可以是单位相同,也可以不同。比的分子和分母是彼此分离的(不相包含或重叠)。比没有单位,其数值代表两个两个指标对比的一个指数。

    如:男女性别发病比,死亡发病比等。

  • 比例(proportion),表示同一事物局部与总体之间数量上的比值,分子分母单位相同,分子是分母的一部分。

    如:发病(死亡)构成比、诊断依据百分比,病理组织学诊断比例,

    死亡补发病的比例,未指明部位的肿瘤新病例的百分比等。


3846853

各死因死亡数占死亡总数百分比

恶性肿瘤占死亡总数的百分比(发病的百分比?)

胃癌占恶性肿瘤发生(死亡)总数的百分比(发病指标?)


3846853

数据审核与整理


3846853

内容

审核:数据质量

  • 主要完整性指标

  • 主要有效性指标

    整理:表和图


3846853

数据审核

分子-病例数

分母-人口资料

(1)年度间人口总数的比较(不应出现较大的波动)

(2)人口数的年度变化趋势是否合理

(3)如果各年人口数出现较大变动或不合理的变化趋势,应查找原因

(行政区的从新划分、人口的迁移(入)、自然灾害等),并作出充

分说明。

登记处内不同时间的发病动态稳定(存在随机波动,但不应出现突然

明显变化)

相似地区(登记处内、外)的肿瘤发病数(率)应大体一致


3846853

xxx肿瘤登记处肿瘤新病例报告卡

编 号_______________

ICD编码__________

  门诊号______________

  住院号______________ 身份证号 口口口口口口口口口口口口口口口口口口

   患者姓名___________ 性别__________ 实足年龄__________岁

   出生年月——年——月——日 民族____________________

   职 业

(具体工种、性质)______________ 工作单位_____________________

   正式户口

   详细地址_______________ 区、县_____________ 街道、乡________________

   诊 断_____________________________

   病理学类型_________________________

(如是继发性肿瘤请尽可能注明原发部位)

   诊断日期______年____月____日

   报告单位____________________报告医师__________报告时间_______年_____月_____日

   死亡日期________年_____月_____日 死亡原因________________________________

诊断依据:在序号上打∨

1 临床  6 病理(继发)

2X线、CT、超声   7 病理(原发)

3 手术、尸检(无病理) 8 尸检(有病理)

4 生化、免疫 9 不详

5 细胞学、血片 0 死亡补发病


3846853

简单地讲:主要就是对发病报告卡上有关的变

量作频数。

查看报告卡内变量取值分布是否合理。

主要讲述:病理组织学诊断的比例

死亡补发病的比例

同期死亡发病比

未指明部位的肿瘤新发病例的百分比


3846853

组织学诊断确认的比例(HV%)

(对诊断依据中编码5、6、7、8的做频数)

  • 登记病例中组织学(或镜检)方法作出诊断的百分比(HV%)是广泛地用

    作评价数据完整性和有效性的一个指标。

  • HV%的比例应在合理的范围,而非越高越好,较高比例的组织学诊断病

    例,可能是由过多依赖于病理学实验室作为信息来源的病例发现的过程

    引起,而通过其它信息来源的病例就会漏掉。因此非常高的HV%应当怀疑

    病例的漏报(不完整性)。

  • 不同肿瘤的HV%变化很大,同时依赖于当地医疗服务状况。

  • 影像学技术(放射、超声)及生物技术的发展与应用影响HV%的高低。


3846853

组织学诊断确认比例

  • 组织学确认(HV%)比是评价肿瘤登记有效性的正向指标。

  • 组织学确认的诊断暗含部分可疑肿瘤病例已被病理学家排除。

  • 一些难做病理学诊断的器官(脑、胰腺、肝脏等),如果HV%高,则被认为是转移癌的可能性小。

  • 细胞学检查包括在组织学确认的范畴内。

  • HV%计算时,登记的全部肿瘤作分母(包括DCO病例)


3846853

  • 组织学确认(HV%)的比例

    所有部位肿瘤的HV%接近100%,可能有漏报。

    不同部位、不同地区(医疗服务水平不同)

    HV%存在差异。


2004 hv

还要分部位、性别、年龄组计算

比较时可作年龄调整

发达地区高于欠发达地区

大部分部位男性高于女性

全部肿瘤(皮肤癌除外)计算时,女性高于男性(乳腺、子宫较易HV)

2004年我国部分登记处资料的HV%


3846853

死亡补发病病例(DCN)

  • 如果不对DCN病例进行追溯调查:

    DCN=DCO 诊断日期为死亡日期(生存期=0)

    追溯调查时: DCN>DCO

  • DCN发生的原因

    (1)登记系统缺陷(漏登报)

    (2)肿瘤的诊断时间与死亡时间接近或在死亡后,

    有时则是由于死亡报告早于发病卡的接收时间。

    (3)病例诊断时间早于登记处开始运行的日期(在登

    记处建立初期常见)

    (4) 死亡证书中死因错填


3846853

  • DCN百分比是常评价肿瘤登记完整性的常用指标。

  • DCN比例在早期较高,随登记年限的增加及工作的逐步改进应该呈稳步的下降趋势(可作动态评估)。

  • DCN病例高,提示完整性差,发病率被低估。

  • DCN不可能为0

  • 对各个部位的病例作评估,在评估低死亡率的癌种时敏感性差。


3846853

仅有死亡证明书病例(DCO)

DCO病例是指在死亡证明书中提及有肿瘤发生,通过追朔调查未能获取相关临床信息的病例。

在有效性评估时以DCO占全部病例的比例为指标。

DCO为负向评价指标:越高表示准确性越差


3846853

  • DCO比例大小受病人的诊断方法、医疗服务水平及登记处覆盖的病例来源影响。

  • DCO病例的诊断日期为死亡日期,计算生存期时可去除或定为0。

  • 一般讲,登记处早期时DCO比例高,应呈逐步下降趋势。

  • 只有DCN病例经追溯调查后才能定为DCO病例。


3846853

  • 只有死亡医学证明书的百分比(DCO%)

    要求: DCO%<15% and >1%(除非登报系统

    有非常有效的死亡病例追溯程序)


3846853

同期死亡/发病比(M:I)

  • 同一时间段内死亡病例和发病病例需要有一致的诊断(?)

  • 如果死因报告准确、时间段内发病水平和生存状况稳定,则:死亡/发病比=(1 - 生存率)

  • 死亡/发病比与肿瘤部位及诊治水平关联

  • 全部肿瘤的死亡/发病比及各部位死亡/发病比


3846853

国内部分登记处恶性肿瘤死亡数与发病数之比


3846853

正常情况,死亡/发病比<1,如果大于1,则

通常提示存在漏报。但下列情况要注意;

(1)小的登记处及稀有肿瘤(比值的可信区间宽)时,死亡/发病比>1。

(2)发生率快速下降

(3)通常的原因是死亡原因不准确

任何时候被采用的死亡证明的信息准确性低于肿瘤登记的信息!


3846853

原发部位不明

  • 原发部位不明比例高,表明登记质量差:

    1、病人未能获得合理医疗资源服务。

    2、病例报告单填写不完整,报告流程存在缺陷。

  • 原发部位不明%(PSU%)<10%


3846853

登记处资料整理

  • 登记机构简介

  • 登记地区及人口

  • 恶性肿瘤分类

  • 性别、年龄和部位分组例数

  • 常见恶性肿瘤(前十位)


3846853

肿瘤登记机构简介

  • 机构名称、地址、负责人及其专业及登记机构工作概况

    病例报告形式(主动收集、被动报告,混合)

    随访情况(主动、被动)

    资料的计算机化程度


3846853

登记地区及人口情况

介绍登记覆盖地区范围及医疗资源情况(肿瘤诊治水平)

分性别、分年龄组的人口


3846853

肿瘤编码标准及报告病例范围

  • ICD-O, ICD-10

  • 尸检、筛查病例

  • 中枢神经系统良性肿瘤

  • 原位癌

  • 细胞学诊断是否作为病理组织学诊断登记


3846853

报告期内恶性肿瘤分性、别按年龄和部位病例数及死亡数如下表:某地某年X性恶性肿瘤发病例数(死亡数)


3846853

十个常见肿瘤部位

  • 分性别的十个常见肿瘤部位的登记病例数、粗发病率(死亡率)和年龄调整率,见下表:

    表 xx 某地某年性前十位恶性肿瘤发病率(死亡率)(1/10万)

    *世界标准人口构成


3846853

报告内常用的一些统计指标

  • 登记时期分性别的各部位年龄组发病(死亡)率、粗率、及年龄调整率。

  • 35-64岁截缩率

  • 0-74岁累积率

  • 各部位肿瘤新病例(死亡)数占新病例(死亡)总数的构成比。


Xx x 1 10

表XX 某地某年X性恶性肿瘤发病(死亡)率(1/10万)


3846853

图示法图X 年龄别发病(死亡)率曲线图


3846853

图X 某市恶性肿瘤世界人口调整发病(死亡)率


3846853

图X 某地恶性肿瘤发生构成


3846853

地理分布图


3846853

  • 肿瘤登记处对分析指标和审核指标可以分地区及报告单位进行统计分析。

  • 率的分地区(区、乡镇)统计时,要注意相应的分母数据(人口数)的收集。


3846853

癌症登记报告的时效性

及时报告癌症发生信息是癌症登记的优势之一,及早提供信息可增加登记处声誉。

登记数据何时能利用(受制于完整性和有效性的要求,后滞是一定的)?

时效性(无正式的定义): 发病日期(诊断日期)到数据被利用时(年报、研究报告、

论文)的间隔。

该一时间段的要求现无国际的指导意见,但一些北美国家的机构制定了一些标准:

美国外科学院(American College of Surgeons):病例在第一次接触后6个月内完成病

例摘录。

美国CDC的癌症登记规划:诊断年份后的12个月内,90%病例上报登记中心;24个月达

到95%。

美国NCI:诊断年份后的22个月上报完整的数据。

北美癌症登记协会:登记处在诊断年份后的23个月,至少应有95%的可报告病例。

参文:Freddie Bray, D. Max Parkin,Evaluation of data quality in the cancer registry: Principles and methods. Part I: Comparability, validity and timeliness . EUROPEAN JOURNAL OF CANCER 4 5 ( 2 0 0 9 ) 7 4 7 –7 5 5

我国的规定???


3846853

思考题

1.粗率与年龄调整率含义的区别?

2. 简述(直接法)年龄调整率的计算步骤

3.请描述常用的评价指标及要求?


  • Login