450 likes | 648 Views
第二十章 分析性 研 究 第一节 队列研究. 邹焰. 分析性研究 (analytical study) ,亦称分析流行病学,该方法一般是选择一个特定的人群,对由描述性研究提出的病因或流行因素的假设进行分析检验。常用的分析性研究有队列研究和病例对照研究。. 一、概念. ( 一 ) 定义 队列研究 (cohort study) 是选定暴露于某因素及末暴露于某因素的两组或不同暴露水平的人群,追踪观察一定的时间,比较各组人群疾病结局发生率的差异,从而判断所研究因素与疾病之间有无因果关联及关联强弱的一种观察性研究方法。.
E N D
分析性研究 (analytical study),亦称分析流行病学,该方法一般是选择一个特定的人群,对由描述性研究提出的病因或流行因素的假设进行分析检验。常用的分析性研究有队列研究和病例对照研究。
一、概念 (一)定义 队列研究(cohort study)是选定暴露于某因素及末暴露于某因素的两组或不同暴露水平的人群,追踪观察一定的时间,比较各组人群疾病结局发生率的差异,从而判断所研究因素与疾病之间有无因果关联及关联强弱的一种观察性研究方法。
Cohort一词即“队列”,是指在相同时期内出生或生活经历相同的一批人,也可泛指共同暴露于 (或未暴露于)某一因素 、某一环境,或者具有 (或不具有)某种共同特征的一组人群。
暴露 (exposure)是流行病学常用术语,泛指研究对象接触过某物质,具有某特征或行为,或处于某种状态,这些因素、特征或状态即为暴露因素。 暴露因素可以是机体的特征,也可是体外的;可是先天的、人体固有的,也可是后天获得的;暴露因素对人体可以是有害的,也可以是有益的。简而言之研究者所关心的任何因素都可以叫暴露因素,暴露因素也叫研究变量 。
在队列研究中研究对象必须是末患所研究结局疾病的人群。暴露于某研究因素的研究对象称为暴露组或研究组,末暴露于该因素的研究对象称为非 (未)暴露组或对照组。两个组除暴露情况有差别外,其余各方面条件应基本相似,即要求两组具可比性,两个组所有观察对象都被同样地追踪一个时期,观察并记录其疾病结局的发生情况。
队列研究可以直接观察到人群暴露于病因的情况及其结局,从而确定危险因素与疾病的因果关系,在验证假说上,是一种介于病例对照研究与人群实验之间的一种研究方法,可对病例对照研究初步检验的病因假设再进行验证。队列研究可以直接观察到人群暴露于病因的情况及其结局,从而确定危险因素与疾病的因果关系,在验证假说上,是一种介于病例对照研究与人群实验之间的一种研究方法,可对病例对照研究初步检验的病因假设再进行验证。 队列研究也曾被称为发病率研究(incidence study)、前瞻性研究 (prospective study)、纵向研究 (longitudinal study)或随访研究 (follow-up,study),但这几种名称只反映本研究方法的某一方面特性,而不能全面准确地表达该研究方法。
队列研究中的队列可分为两种:一种叫做固定队列(fixed cohort),是指人群都在某一固定时间或一个短时期之内进入队列,并对他们观察随访,直至观察期终止,不再加入新成员。另一种叫动态人群(dynamic population),即根据某时期确定队列后,可以随时增加新的观察对象,在追踪随访中有可能有退出者。
(二)特点 1·属于观察法 暴露情况不是人为决定的,而是客观存在,有别于实验研究。 2·设立对照组 设立专门的对照组即非暴露人群以资比较,从而有别于描述流行病学而成为分析流行病学的共同特点之一。对照组可与暴露组来自同一或不同的人群,但应具有可比性。 3·是由‘因“及 ”果“的研究 队列研究在探求暴露因素与疾病的先后关系上,先确定原因再前瞻观察究其结果,使队列研究能明确提出暴露与疾病的时间关系,因此有很强的验证病因能力。
二、队列研究的用途 1·检验病因假设 2·评价疾病(防治效果或)预后 只能是非治疗的自然预后观察,防治效果的观察应属于实验性研究。 3评价自发的预防效果 有时人群会自动发生由暴露状态改为非暴露状态,如有部分吸烟者自动戒烟,结果发现戒烟人群的肺癌发病率较吸烟人群降低,由此说明戒烟对预防肺癌有效。由于这种预防作用不是人为因素控制而是自发出现的,在队列研究中能观察到这种现象,并可以评价其预防效果,因此称为人群“自然实验"。 4·描述疾病的自然史
三、队列研究的类型 按研究开始的时间不同可分为三类: 1·前瞻性队列研究(prospective cohort study) 研究对象的确定与分组是根据研究开始时的人群暴露情况确定的,研究的结局需随访观察一段时间才能得到。这种设计又称即时性或同时性队列研究 (concurrent cohort study),是队列研究的基本形式。 前瞻性队列研究的最大优点是研究者可以直接获取暴露及结局的第一手资料,资料的偏性比较小。但如果需要观察大量人群,则花费太大;如果疾病的潜伏期很长,则需要观察的时所很长,所以进行该种队列研究难度很大。
2.历史性队列研究(historical cohort study) 研究是现在开始的,起点是过去某个时间,研究对象的确定与分组是根据人群过去的暴露情况而定,研究的结局在研究开始时已经发生,研究暴露到结局的方向是由因到果的过程,而研究工作的性质是回顾性的。这种设计又称非即时性或非同时性队列研究 、回顾性队列研究 。 历史性队列研究节省时间、人力和物力,出结果快,因而适宜于长诱导期和长潜伏期的疾病,且所研究的暴露因素有详细记录或有确凿证据可查的,如原子弹爆炸与白血病之间的关系研究即可用此方法。该法也经常用于职业危害的研究。但是历史性队列研究常常缺乏混杂因素的资料,以至影响可比性。
3·双向性队列研究(ambispective cohort study) 将以上两种方法结合进行,即先进行历史性队列研究之后,继续进行前瞻性队列研究,称为双向性或混合性队列研究。这种研究具有上述两种研究的优点,在一定程度上弥补了它们各自的不足。
四、选择队列研究方法的指征 队列研究往往需研究的人数多、观察的时期长,实施起来较为复杂,研究的难度大,所以进行队列研究之前要考虑有无选择该研究的条件和必要。
(一)前瞻性队列研究的选择指征 1·要有明确的研究目的和检验假设 2·所研究疾病的发病率或死亡率一般不应太低 (>5‰)。 3·要有把握获得足够数量的观察人群和准确的暴露资料,并且能被长期随访,而取得完整可靠的结局资料。 4·要有确定研究结局 (发病或死亡)的简便、可靠、可行的手段。 5·要有足够的人力、物力和财力保证研究的进行。
(二)历史性队列研究的选择指征 足够数量的完整可靠的记录或档案材料,是实施历史性队列研究最重要的前提,因为历史性队列研究完全依赖于有关暴露、疾病和生死状况的完整真实的历史记录。
五、队列研究设计与实施 进行队列研究,首先要进行科学严谨的设计,并严格按设计方案实施。 队列研究的设计重点应包括确定研究因素及观察结局、选择研究对象、估计样本含量、资料收集和分析方法、预计分析指标、偏倚的控制以及组织计划与经费预算等。
(一)确定研究因素 队列研究只能确定一种或一组不同等级的暴露因素,该因素通常是在描述性研究或病例对照研究的基础上,高度怀疑与某疾病发生有关的因素。人们把导致疾病事件增加的暴露因素称为危险因素或致病因素,把导致疾病事件降低的暴露因素称为保护因素。 对于暴露因素必须在调查前有明确的规定,尽可能采用国内外统一的标准,最好能测量其暴露程度、接触年数、暴露是否连续。将暴露因素与暴露程度分级是很有意义的,可分析暴露因素与疾病间是否存在剂量-反应关系。
(二)确定研究结局 结局 (outcome)亦称结局变量 (outcome variable),指研究者预期的结果事件,结局不仅限于发病,还可以是死亡或各种化验指标、生理特征的变化。 判断结局的标准应尽量采用国际或国内统一的标准,考虑到疾病的不同类型,不同的临床表现等,应详细记录观察者的症状、体征以及相关情况,以备详细分析使用。
(三)确定研究对象 1·暴露人群的选择 暴露人群应该处在某种暴露因素中或已有某种特殊暴路史,并能提供可靠的暴露因素资料,且便于追踪和观察。 (1)特殊暴露人群或职业人群(特殊暴露人群指对其因素有高的暴露水平的人群) (2)一般居民 (3)有组织的人群团体
2·对照人群的选择 对照人群的设立是为了与暴露人群进行比较,对照组人群一般选非暴露人群,与暴露组应具有可比性 ,即对照人群除暴露因素的影响外,其他各种因素的影响或人群的特征,如年龄、性别、职业、民族等,都应尽可能与暴露组相似。 (1)内对照:在同一研究人群中,采用没有暴露或暴露水平最低的人员作为对照即为内对照,这是最理想的对照。 (2)外对照:按照规定,在某人群中选择一组有暴露的人群作为暴露组,在另一人群中选择一组非暴露的人群作为对照组,称为外对照组。 A.特设对照 B.总人口对照 C.设立多重对照 (3)多重对照
(四)确定样本大小 1·队列研究样本量的决定因素 (1)非暴露组中所研究疾病的发病率(p0) (2)所研究因素与疾病的关联强度(RR) (3)统计学显著性检验水平(a) (4)效力或把握度 (power)为1一β
3·通过查表估计样本大小 当已知 p0、RR、β和α四个基本参数时,可以采用查表或计算机程序获得。 在队列研究中失访常常是不可避免的,因此估计样本量时要考虑到失访率,防止在研究的最后阶段因数量不足而影响结果的分析,通常按计算出的样本量再加10%作为实际样本量。
(五)随访 在队列研究正式开始之前首先要进行研究人群的有关暴露、混杂因素、观察结局的基础资料调查,然后进行随访。 开始随访和终止随访日期均应明确。随访时间的长短主要取决于疾病的潜伏期长短,也取决于暴露与疾病的关联强度。失访不能过多。随访要收集三方面的资料,即有关暴露、结局事件、影响研究结论的混杂因素资料。 随访的方法有: 1、利用记录或档案 2、进行特殊安排的随访 3、有时需对环境调查与检测,以确证研究对象的暴露情况
六、资料整理分析 (一)资料整理 1、原始资料核查 对随访所收集的原始资料仔细核查,将资料中不足或错误之处加以弥补或纠正,使之尽可能完整可靠。 2、资料编码、归纳、输入计算机 先将资料归纳、编码,建立数据库,输入计算机,利用计算机软件进行逻辑检错,利用适当的统计软件整理分析。
(二)资料分析 1、调查资料的描述性分析 2、统计学推断 (1)率的计算: a、累积发病率 (cumulative incidence):当观察期间人群比较稳定,且能在较长一段时间内固定地维持观察,可以以观察时的人口数为分母,整个观察期内发病或死亡人数为分子计算累积发病率 (或死亡率)。 b、发病密度(incidence density):若暴露人口不稳定,人群产生了较大的变动,应将变动的人群转变为观察人时数代替观察人数做分母,分子为观察期间发病或死亡人数,此种发病率称发病密度。观察人时数就是观察人数乘以观察时间,常用单位是暴露人年。
(2)精确法:可以先计算出每个人实际随访人年数,再将每个人的随访人年数相加计算出总人年数。此法利用计算机程序计算很方便。
由于RR值是对暴露与疾病关联程度的一个点值计算,而点值计算总是有其变异性,计算出这个变异的区间有助于进一步了解联系的性质及程度,因此,需对RR值估计其可信区间 (confidence interval,CI),一般估计95%的可信区间采用Miettinen法计算: RR的95%CI=RR(1士 1.96/ ) 计算RR可信区间除了有助于估计变异范围的大小外,还有助于检验RR值的意义,如区间跨越1,则暴露与疾病无关联,其意义与统计学假设检验两组率差异无显著性的结果相同。
RR和AR同为估计暴露与疾病关联强度的指标,彼此关系密切,但其公共卫生学意义不同,RR说明个体在暴露情况下比非暴露情况下致病危险程度的倍数,具有病因学意义。RR和AR同为估计暴露与疾病关联强度的指标,彼此关系密切,但其公共卫生学意义不同,RR说明个体在暴露情况下比非暴露情况下致病危险程度的倍数,具有病因学意义。 AR是对于暴露人群来说,在暴露情况下比非暴露情况下增加所致疾病的数量,消除暴露因素,就可以减少这一数量的疾病,具有疾病预防和公共卫生学意义。
(三)分级暴露资料的分析 分级暴露资料的分析是将不同暴露水平的资料由小到大或由大到小分成多个有序的暴露等级,计算各组人群的疾病结局发生率,并分别将不同水平的发生率与无暴露或最低水平暴露的发生率做比较,计算各暴露级别的RR、AR等指标,根据各暴露级别的RR、AR有无规律性的升高或降低判断暴露因素与所研究疾病之间有无剂量-反应关系,以加强因果关联推断的依据。
例如Doll和Hill在研究吸烟与肺癌的队列研究中获得以下结果,表明吸烟与肺癌有剂量-反应关系。例如Doll和Hill在研究吸烟与肺癌的队列研究中获得以下结果,表明吸烟与肺癌有剂量-反应关系。
七、队列研究中的偏倚及其控制 (参阅本书第二十四章) • 选择偏倚 • 失访偏倚 • 信息偏倚 • 混杂偏倚
八、队列研究的优点与局限性 (一)优点 1、可以直接获得暴露组与非暴露组的发病率或死亡率,因而可以直接计算相对危险度等暴露与发病的关联强度指标。 2、由于是由"因"及"果"的研究,故所得结果真实可靠,检验病因假说的能力较强。 3、有助于了解疾病的自然史,并且可以获得一种暴露与多种疾病结局的关系。 4、所收集的资料完整可靠,不存在回忆偏倚,选择偏倚较小。
(二)缺点 1、不适于发病率很低的疾病的病因研究,因为需要较大的人群,研究实施有一定困难。 2、由于长期的研究与随访,因为死亡、退出、搬迁等造成的失访难以避免。 3、研究费时间、费人力、花费高。 4、研究的设计要求高,实施难度大。暴露人年计算工作量较为繁重。