第九章流行病学研究中的偏倚

第九章流行病学研究中的偏倚 误差的概念偏倚的概念及方向常见偏倚的种类与特点偏倚的控制

误差 • 概念：真实值与研究结果值之差。 • 误差的大小：绝对误差与相对误差 • 误差的方向：夸大、缩小、颠倒

误差的种类 • 随机误差：流行病学研究中的随机误差的主要来源于研究对象的选择过程，即抽样误差。没有固定方向和大小，统计学方法估计大小，无法避免，但增大样本量较少之。 • 系统误差：由研究设计(方法的本身特点、设计的缺陷等)与实施过程的不恰当所致。流行病学调查研究中的各种系统误差也称偏倚。有固定的大小和方向，可以计算，通过严谨的设计和质量控制可以避免。

一、偏倚概述 （一）定义：指在研究或推论过程中所获得的结果系统的偏离真实值。（二）偏倚的方向：OR:真值 OR’：测量值正偏倚与负偏倚、趋于无效假设远离无效假设颠倒例：

偏倚的方向 正偏倚与负偏倚 OR’ > OR：正偏倚 (OR=2.5 OR’=4.8) OR’ < OR：负偏倚 (OR=4.9 OR’=2.5)

偏倚的方向 • 趋于无效假设 (toward the null) OR’=1.3 OR=5.0 OR’=0.9 OR=0.3 • 远离无效假设 (away from the null) OR’=8.0 OR=2.0 OR’=0.5 OR=0.8 • 颠倒(switchover bias) OR’=0.5 OR=2.0 OR’=2.0 OR=0.8

偏倚的大小 偏倚的大小通常以相对数表示: 测量值－真实值 Bias＝ --------------------- ×100％真实值

偏倚的大小 RR’=1.2 RR=2.00 1.2 －2 Bias＝ ------------×100％＝ -40％ 2 大小：40％方向：为负Bias , 趋于无效假设。

（三）偏倚的分类 偏倚可发生于设计、实施、分析至推断过程中；可存在于各种研究类型中，形式各异大致可分为： • 选择偏倚(selection bias) • 信息偏倚(information bias) • 混杂偏倚(confounding bias)

二、选择偏倚 • 定义：在流行病学研究中，由于选择研究对象的方法存在问题，导致被选入到研究中的研究对象与未被选者特征上的差异而使得研究结果偏离真实情况。多见于现况研究、病例对照研究、历史性队列研究。

常见类型：入院率偏倚 现患病例-新病例偏倚检出症候偏倚易感性偏倚无应答偏倚

（一）入院率偏倚admission rate bias， Berkson bias 指在进行病因研究、临床试验、预后判断等研究时，利用医院就诊或住院病人作为研究对象，病例与对照入院率或就诊机会不同而导致的偏倚。

因不同入院率而住院的A、B病患者及其与因素X的关系因不同入院率而住院的A、B病患者及其与因素X的关系 800 ×0.5 200×0.5+100 ×0.4 800 ×0.2 200×0.2+160 ×0.4 造成不同疾病入院率不同的原因：医院技术特长；患者疾病严重程度、经济状况,就诊方便程度等（医院病人双向选择）。

（二）现患病例-新病例偏倚 (prevalence incidence bias，Neyman bias) 病例对照研究中如选择现患病例作病例，他们是过去一段时间新发病例的幸存者，如果幸存者所反映的暴露情况比新发病例高或低，则会导致此种偏倚的出现。

以医院中心肌梗死病人为病例进行病例对照研究，得到结论：大量饮用咖啡与心肌梗死无关。以医院中心肌梗死病人为病例进行病例对照研究，得到结论：大量饮用咖啡与心肌梗死无关。而队列研究表明：大量饮用咖啡者心肌梗死发病危险性是对照的2倍。原因：Neyman bias • 50％的心肌梗死患者入院前死亡。调查对象只是心肌梗死后的幸存者； • 死亡者多是大量饮用咖啡者且时间较长； • 入院的未死亡病例只是一般的饮用者；

此外，现患病例有时会主动改变其对危险因素的暴露，导致对危险因素与疾病关系的低估。此外，现患病例有时会主动改变其对危险因素的暴露，导致对危险因素与疾病关系的低估。队列研究发现高胆固醇血症与冠心病的RR为2.4。而病例对照研究中，RR为1.16。原因：病例对照研究中的现患病例已改变了他们高胆固醇的饮食习惯。

（三）检出症候偏倚 (detection signal bias， detection bias， unmasking bias) 指某因素与某疾病在病因学上虽无关联，但由于该因素的存在而引起该疾病症状或体征的出现，从而使患者及早就医，接受多种检查，使该人群有较高的检出率，以致得出该因素与该疾病相关联的错误结论。

检出症候偏倚(例) 子宫内膜癌与服用雌激素：服雌激素导致子宫容易出血频繁就医接受检查早发现

1978年，Horwitz和Feinstein：口服雌激素与子宫内膜癌的高度关联是虚假的，是一种检出偏倚。1978年，Horwitz和Feinstein：口服雌激素与子宫内膜癌的高度关联是虚假的，是一种检出偏倚。（1）人群中有一定量无症状的子宫内膜癌早期病人。（2）无症状的子宫内膜癌早期病人如服用雌激素易发生子宫出血而去肿瘤科就诊，由此被发现而选入病例组。（3）对照组为一般住院病人。结果：雌激素服用率高于对照组。

（四）易感性偏倚 (susceptibility bias) 观察结局除与暴露因素有关外，还与观察对象的易感性有关。有些因素可能直接或间接地影响暴露人群或对照人群的对所研究疾病的易感性，导致偏倚的产生，这种偏倚称为易感性偏倚。

如：当研究某种有毒物质对工人的健康危害时，常发现暴露于有毒物质的工人的死亡率比一般人群还低，这主要是接触该有毒物质的工人，其初始的健康水平要比一般人群要高，其易感性低。如：当研究某种有毒物质对工人的健康危害时，常发现暴露于有毒物质的工人的死亡率比一般人群还低，这主要是接触该有毒物质的工人，其初始的健康水平要比一般人群要高，其易感性低。

（五）无应答偏倚 (non-respondent bias) 指研究对象中那些没有按照研究设计对被调查的内容予以应答。某个特定样本中的无应答者的患病状况，以及对某一或某些研究因素的暴露情况与应答者可能不同，由此而产生的偏倚。

如：安阳县食管癌普查，普查率仅20％左右，不能代表总体。造成无应答的主要原因：研究对象不了解研究目的；调查内容不当，过于繁琐，涉及隐私；对象不能正理解调查内容（文化低、高龄等）；对象病重、外出。

失访偏倚：是一种无应答，主要发生在前瞻性队列研究和实验研究中。（1）随访过程中因种种原因拒绝继续留在观察组中。（2）观察对象在出现预期的结果之前死于其他疾病或事故。如果暴露组与对照组观察对象均有500人，随访过程中均失访100人，其结果是否可靠？？？

（七）志愿者偏倚 志愿者与非志愿者在关心健康、注意饮食卫生及营养食疗、戒烟戒酒、体育锻炼等方面有系统差别。如选择志愿者为对象，而非志愿者常落选，可能会产生偏倚。例如：观察体育锻炼预防冠心病的效果实验组为志愿者，非志愿者为对照组。

（八）时间效应偏倚 潜隐期的病人（特别是慢性病）被纳入健康对照组。在遗传病中：未到外显年龄的观察对象被分入健康对照组。可产生负偏倚。

选择偏倚的控制 • 研究者对在整个研究中可能会出现的各种选择偏倚应有充分的了解、掌握。 • 采用严格科学的研究设计 • 严格掌握研究对象纳入与排除的标准。 • 在研究中采取相应措施，以获得尽可能高的应答率，并对无应答者进行评价。 • 尽量采用多种对照。

三、信息偏倚 (Information Bias) 又称：观察偏倚(Observation Bias) 错分偏倚(Misclassification Bias) 定义：指在流行病学调查收集资料阶段，由于测量暴露或测量结局的方法有缺陷，使各比较组所获得的信息产生的系统误差。

信息偏倚的来源 • 测量不可靠(暴露、疾病) • 诊断标准不明确(疾病) • 原始记录不完整

常见信息偏倚 • 回忆偏倚(Recall Bias) • 报告偏倚 (reporting bias) • 诊断怀疑偏倚(diagnostic suspicion bias) • 暴露怀疑偏倚(exposure suspicion bias) • 测量偏倚(measurement bias)等

（一）回忆偏倚(Recall Bias) ： 指研究对象在回忆以往发生的事情或经历时，由于在准确性和完整性上的差异所致的偏倚。小儿白血病－－－母亲怀孕时接受x线的回忆死于白血病的小儿的母亲增加了暴露于x线的回忆。病例医院对照社区认真回忆暴露史暴露经历易遗忘或不重视

类风湿关节炎的家族史 类风湿关节炎患者比其同胞更能提供阳性家族史

（二）报告偏倚(reporting bias) 研究对象有意夸大或缩小某些信息而导致的偏倚。如隐瞒与隐私有关的暴露史保护调查对象声誉隐瞒不良暴露史夸大职业暴露

（三）诊断怀疑偏倚(diagnostic suspicion bias) 研究者事先已经知道研究对象的暴露史，怀疑他们已经患某种疾病，于是在对暴露者和未暴露者作诊断或分析时，采取了不可比的做法，从而导致偏倚。多见于临床试验、队列研究，特别是在诊断亚临床病例、判断药物的不良反应时最易产生。

研究口服降糖灵治疗2型糖尿病是否导致心血管病死亡率升高研究口服降糖灵治疗2型糖尿病是否导致心血管病死亡率升高降糖灵组：死亡者均尸体解剖，寻找心血管病的死因。其他组：（对照组、胰岛素组）难得解剖

（四）暴露怀疑偏倚(diagnostic suspicion bias)： 研究者事先知道研究对象的患病情况，而采用不可比的方法在病例组和对照组中探索可疑的致病因素导致的偏倚。

（五）测量偏倚(measurement bias)： • 由于研究中所使用的仪器、设备、试剂、方法和条件的不精良、不标准、不统一或研究指标设定不合理、数据记录不完整造成的研究结果系统地偏离其真值的现象称为测量偏倚。 • 测量偏倚可发生在各种流行病学研究的设计、实施和资料处理过程中。

两种结果 • 无差异性错误分类暴露或疾病的错误分类同研究分组无关，各比较组间不存在差异；在多数情况下模糊了研究组的差异，使OR偏低 • 差异性错误分类暴露或疾病的错误分类同研究分组有关，各比较组间存在差异；造成高估或低估效应值

信息偏倚的控制 （一）制定明细的资料收集方法和严格的质量控制方法（二）尽可能采用“盲法” （三）尽量收集客观指标的资料。（四）收集资料的范围可以适当有意识地扩大些，借以分散调查人员和研究对象对某项因素的注意力，减少某些偏见带来的偏倚。（五）通过调查知情人或采用相应的调查技术，获取正确信息，避免报告偏倚。（六）选择一个与暴露史有联系的鲜明的记忆目标帮助其联想记忆或选择新病例作为对象。

四、混杂偏倚confounding bias 混杂偏倚或称混杂，是指在流行病学研究中, 由于一个或多个潜在的混杂因素(confounding factor)的影响，掩盖或夸大了研究因素与疾病(或事件)之间的联系，从而使两者之间的真正联系被错误地估计。混杂偏倚在分析性研究、实验性研究中均可发生，以前者为多见。

混杂因素（confounding factor） • 定义指与研究因素和研究疾病均有关联，可以掩盖或夸大研究因素与疾病之间真正关联的因素。 • 特点混杂因素必须是所研究疾病的独立危险因素；混杂因素必须与所研究暴露因素存在统计学联系；混杂因素不应是暴露因素与疾病因果链中的一个环节或中间变量；在比较的人群组中分布不均匀。年龄和性别是最常见的混杂因素。

如何判断混杂因素 几种情况： E E E E E:研究因素 D D D D D:疾病 F F F f F F:外来因子 E E E E f:伴随因子 D D D D :因果关系 F F F F :一般相关

混杂因素的测量

在研究中，判断某因素是否混杂因素： 计算粗OR（cOR）；按可疑混杂因素分层后，计算调整后的OR（aOR)； 1. cOR ≠aOR； 2.在非暴露组中，疾病与可疑混杂因素之间的OR≠1； 3.在对照组中，暴露与可疑混杂因素之间的 OR ≠1

判断及测量混杂偏倚： 计算粗OR（cOR）；按混杂因素分层后，计算各层OR: OR(f+) OR(f-) 1.进行一致性检验，若同质（P>0.05），计算aOR； 2.若aOR=cOR，则f不是混杂因素，不存在混杂偏倚； 3.若aOR ≠ cOR，则f为混杂因素；存在混杂偏倚； 4.若不同质（P<0.05)，认为各层资料不属同质资料，不能计算aOR，考虑 f为效应修饰因素，分别讨论各层的结果。

混杂的程度及其方向 cRR - aRR 混杂偏倚=-------------------- aRR cRR= aRR: 无混杂 cRR> aRR: 正混杂(positive confounding)，亦称阳性混杂，使cRR高估了研究因素与研究疾病之间的联系。 cRR< aRR: 负混杂称阴性混杂, cRR低估因素与研究疾病之间的联系。

第三节研究的偏倚 例：病例对照研究

第三节研究的偏倚 （1）按可能的混杂因素吸烟分层 aibim1i cidim0i nin0ti

第九章 流行病学研究中的偏倚