510 likes | 717 Views
病例对照研究 case-control study. 朱 益 民 浙江大学医学院 流行病与卫生统计学系. 问 题. 某单位某日发生许多腹泻病人,初步调查发现可能与该单位食堂就餐有关。如何调查此次事件的病因?. 以目标人群中患有某种疾病的人 ( 病例组 )和未患该病或正常人( 对照组 )为研究对象,调查过去暴露于某个危险因素的情况及程度,比较两组暴露史的差别,以分析暴露因素与疾病有无关联以及关联程度的大小。. 一、病例对照原理. 病例对照研究模式图. 过 去. 现 在. 暴露率. 人数. 暴露状况. 是否患病. +. a. 病例组.
E N D
病例对照研究case-control study 朱 益 民 浙江大学医学院 流行病与卫生统计学系
问 题 某单位某日发生许多腹泻病人,初步调查发现可能与该单位食堂就餐有关。如何调查此次事件的病因?
以目标人群中患有某种疾病的人(病例组)和未患该病或正常人(对照组)为研究对象,调查过去暴露于某个危险因素的情况及程度,比较两组暴露史的差别,以分析暴露因素与疾病有无关联以及关联程度的大小。以目标人群中患有某种疾病的人(病例组)和未患该病或正常人(对照组)为研究对象,调查过去暴露于某个危险因素的情况及程度,比较两组暴露史的差别,以分析暴露因素与疾病有无关联以及关联程度的大小。 一、病例对照原理
病例对照研究模式图 过 去 现 在 暴露率 人数 暴露状况 是否患病 + a 病例组 A/(a+b) - 研究 人群 b + 对照组 c c/(c+d) - d
病例对照研究的特点 • 属于观察性研究方法 • 回顾性研究 • 从果到因研究
二、病例对照研究的设计与实施 • 明确研究目的,提出假设 • 病例对照研究主要检验某因素与疾病之间的关系。 • 通过查阅文献和描述性研究, 提出研究假设-选题。 • 2. 病例选择 • 病例定义 在研究时已经患病的人 • 确定诊断标准(防止错分偏倚) • 疾病分型和严重程度 • 原则 选择病例的原则是进入病例组的病例足以代表总体(即产生这组病人的目标人群)中该病的全部病例。
病例的来源 医院:一家或多家医院住院或门诊已明确诊断病例。 社区人群:普查结果;疾病发病或死亡登记报告资料。 • 病例的类型 新发病例:回忆偏倚低;代表性好;受生存因素影响少;易合作 现患病例、死亡病例:易发生Neyman bias
3. 对照选择 • 对照的定义:研究时不患所研究疾病的人,包括其他病人和健康人 • 设立对照的目的和选择原则:代表性、可比性、暴露不能作为选择对照的依据。 • 对照的来源 以人群为基础的病例对照研究 以医院为基础的病例对照研究
4.病例和对照的匹配 • 匹配的概念 选择对照的方法,使对照在某些因素的分布与病例组保持一致。 • 匹配因素 常用的配比变量有年龄、性别、居住地、出生地、社会经济水平、民族、病情轻重、疾病类型。 一旦被匹配后,就无法分析该匹配因素与疾病的关系。 • 匹配的作用 增加病例组与对照组的均衡性与可比性。控制外部因素,消除非研究因素的作用,提高提高研究效率。 • 匹配的类型:群体匹配和个体匹配
群体(或频数)匹配(frequency matching) 在选择对照组时,使某些因素在对照组中与病例组中的分布在整体上相同。 年龄、性别、种族等分布一致 N2对照 N1 病例 成组的病例对照研究
按年龄频数匹配后,病例组和对照组年龄的分布按年龄频数匹配后,病例组和对照组年龄的分布
个体匹配 (Individual matching) 根据病例组中每个个体的匹配因素的特点,选择与其相匹配的对照。配比的病例对照研究 cases controls pair age, sex, race
配比的病例对照研究: 1 case: R controls • 配对病例对照研究 1 case: 1 control 如何在病例数受限的条件下,如少见病或罕见疾病,进行病因研究?
配对病例对照研究的对子类型 配对病例对照数据整理
实例:青年女性阴道腺癌的病因调查 研究背景 研究设计 • 1966-1969年波士顿Vincent纪念医院收治7例阴道腺癌患者,年龄15-22岁; • 通常阴道癌占女性生殖系统肿瘤的2%,而阴道腺癌仅占阴道癌的5~10%;以往阴道腺癌的年龄均在25岁以上; • 因此,这7例异常病例:肿瘤类型异常;时间、地区分布异常集中;年龄分布异常 • 分布差异提示了线索:该地区有某些因素与阴道腺癌异常发病有关。 • 病例组:8例(同地区另一医院一例),均经病理确诊; • 对照组:每个病人配4个对照,共32个对照,选自与病例同一医院(病房)出生、出生日期与病例前后不超过5天的女青年。 • 调查:设计几十种有关因素,对病例组、对照组及其她们的母亲进行了调查。研究因素包括母亲年龄、吸烟史、母亲以前流产史、此次怀孕阴道出血史、母亲怀孕期间使用过己烯雌酚激素的情况、哺乳史和妊娠期间射线接触史等。
匹配过头(Overmatching):把不应该匹配的因素进行匹配,不仅增加了工作难度,而且使病例组和对照组在这个因素的分布人为一致;如果该因素与研究的暴露因素存在联系,就可能使研究因素和疾病之间的关联减弱或消失。匹配过头(Overmatching):把不应该匹配的因素进行匹配,不仅增加了工作难度,而且使病例组和对照组在这个因素的分布人为一致;如果该因素与研究的暴露因素存在联系,就可能使研究因素和疾病之间的关联减弱或消失。
5、病例对照研究的样本含量 影响样本含量的因素 • 被研究因素在对照人群中的暴露率(率越高样本越小)。 • 估计该因素造成的相对危险度(RR)或暴露比值比(OR) OR越大样本越小。 • 需要达到的检验显著性水平,α=0.01样本大于α=0.05。 • 要求的把握度1-β 把握度要求越高样本越大。 • 设计类型:成组设计和配比设计
成组设计的病例对照研究样本含量估计 Z和Z分别是和值对应的标准正态分布分位数(查表) p0和p1分别是所研究因素在对照组和病例组的估计暴露率 q0 = 1p0,q1=1p1; P=(p0+p1)/2, q= 1p’; p1=(ORp0)/(1p0+ORp0);
样本含量估计实例 Schlesselman用病例对照研究小儿先天性心脏病与母亲孕期口服避孕药(OC)关系。假定育龄妇女中应用OC者占30%,孕期服用OC与小儿先天性心脏病的RR=3,=0.05(双侧检验),=0.10;查表Z=1.96,Z=1.28。 q0 = 10.3=0.7 p1=(30.3)/(10.3+30.3)=0.5625 q1=10.5625=0.4375 P=(0.3+0.5625)/2=0.4313; q=10.4313=0.5687 n=73 在此条件下研究,病例组和对照组至少各需73人
采用成组病例对照研究设计,当α=0.05,β=0.20时,两组不同的暴露率下的样本量。采用成组病例对照研究设计,当α=0.05,β=0.20时,两组不同的暴露率下的样本量。
1:1 配对病例对照研究的样本含量 m为需要结果不一致的对子数。 M = m/pe pe p0q1+p1q0 M为研究需要的总对子数,pe为病例组和对照组暴露情况不一致的对子数出现的频率。 p0和p1分别是人群中估计的暴露率和病例组估计的暴露率。
6、暴露资料的收集及测量 • 对每一种暴露因素必须有严格的定义,并尽量与其他研究者的定义一致,以便相互比较。 • 根据研究目的精选暴露因素 • 回顾性方法调查暴露状况:问卷调查、查阅记录、电话访问等。 • 制定调查表
吸烟的标准 Never smokers were defined as subjects who had never smoked or had smoked fewer than 100 cigarettes in his or her lifetime. Former smokers reported a history of smoking but had stopped at least 1 year before being diagnosed with lung cancer (or 1 year before enrollment in the study, for control subjects). Current smokers were currently smoking or had stopped smoking less than 1 year before being diagnosed with lung cancer (or less than 1 year before enrollment in the study, for control subjects).
四、资料分析 1、一般步骤 (1)资料整理:核对、分组、归纳、数量化。 (2)描述性统计分析: 研究对象的一般特征,如描述年龄、性别、职业等的分布频率; 资料均衡性检验。 (3)分析病例组与对照组之间有关因素的暴露率有无显著性差异 (4)暴露与疾病的关联强度分析。
一般情况和均衡性比较 病例组 对照组 χ2 P 性别: 男 女 年龄: <15 15- 45- 65- 疾病类型:
2、成组病例对照研究的资料分析 (1)成组资料整理表 >3.84, P<0.05; >6.63, P<0.01 (2)分析病例组与对照组的暴露率有无显著性差异?
(3)联系强度的计算 相对危险度(RR):反映暴露与疾病发生(发病或死亡)关联强度的指标,危险比(risk ratio ) 在病例对照研究中RR一般无法计算
比值比 ( Odds ratio,OR ) 即优势比。优势(odds)是某事件发生(暴露)与未发生(非暴露)的概率之比。反映病例与对照在暴露程度上的差异。
如所研究疾病的发病率较低 (<5%),可用比值比来估计相对危险度
OR的95%可信区间 • Woolf法:LnOR的95%可信区间 • Miettinen法:
例 Doll和Hill关于吸烟与肺癌关系的病例对照研究
(4) 剂量反应关系分析 Doll 和Hill研究男性吸烟与肺癌关系 每日吸烟量 0 1- 5- 15- 合计 肺癌 2 (c) 33(a1) 250(a2) 364(a3) 649(n1) 对照 27(d) 55(b1) 293(b2) 274(b3) 649(n2) 合计 29(mo) 88(m1) 543(m2) 638(m3) 1298(n) OR 1.0 8.10 11.52 17.93 2=43.15, 自由度=3, P<0.001 2趋势检验, 自由度为1
2趋势检验, 自由度为1 在上一例中: T1=1625 T2=8002 T3=1625 V=164.0039 2=40.01 v=1 P<0.01 Xi为每个暴露水平
每日酒精消费量与食管癌发病危险的关系 趋势检验 2=151.9, p<0.001
(5)分层分析 为了控制混杂偏倚,将资料按某些特征分成不同的层次,分析不同层内暴露因素与疾病的关系。
3. 配对资料分析 联系强度 OR=c/b a,b,c,d分别代表病例和对照配对的对子数 (3)分析病例组与对照组的暴露率有无显著性差异
五、病例对照研究中的偏倚 • 选择偏倚:选入者与未选入者某些特征上存在差异引起 入院偏倚、现患-新发病例偏倚、检出征候偏倚、时间效应偏倚等 • 信息偏倚:收集信息时由于测量及获得数据的方法不正确而造成。回忆偏倚、测量偏倚 • 混杂偏倚:
六、病例对照研究的优点 • 研究所需的时间短,人力、财力、物力均较节省,并较易组织实施、容易得出结果 • 适用于少见病的研究 • 一次病例对照研究可调查多种因素与疾病的关系。病因筛选
病例对照研究的缺点 • 样本代表性差 • 暴露资料准确性较差 • 不能计算RR和发病率,不能直接估计联系强度(只能计算OR)
分 组 母亲数 合 计 生短肢畸形儿 无短肢畸形儿 妊娠8周内服用反应停者 12 2 14 早期未服反应停者 38 88 126 服用反应停与短肢畸形发生的关系 比值比 OR=12×88/(38×2)=13.9