610 likes | 754 Views
第十九章 疾病诊断试验与筛查试验. 第一节 诊断试验 临床上对于疾病的确实诊断,除了依据患者的症状、体征以 外,还要借助各种检查、检验手段,这些检查、检验手段统称为 诊断试验 (diagnostic test) 。 一种诊断试验可用于多种疾病的诊断,一种疾病的诊断往往需要借助多种诊断试验。 如何对某一诊断试验对每一种疾病诊断的特征、准确度做出系统的理解认识,在临床上科学合理地应用,灵活地把握,提高诊断试验的效益与效率,就是对诊断试验研究与评价的内容。. 一、诊断试验研究与评价的理论依据
E N D
第十九章 疾病诊断试验与筛查试验 第一节 诊断试验 临床上对于疾病的确实诊断,除了依据患者的症状、体征以 外,还要借助各种检查、检验手段,这些检查、检验手段统称为诊断试验(diagnostic test)。 一种诊断试验可用于多种疾病的诊断,一种疾病的诊断往往需要借助多种诊断试验。 如何对某一诊断试验对每一种疾病诊断的特征、准确度做出系统的理解认识,在临床上科学合理地应用,灵活地把握,提高诊断试验的效益与效率,就是对诊断试验研究与评价的内容。
一、诊断试验研究与评价的理论依据 就大多数诊断指标而言,在正常人中符合正态分布,在病人中也符合正态分布,但病人 和正常人之间有部分重叠。 如图19-1所示,A、B之间既有病人又有正常人,A为病人的最低值,B为正常人的最高值。如果我们把诊断标准定在A上,则有一部分正常人被判为病人如果把诊断标准定在B上,则有一部分病人被判作正常人;如果诊断标准定在C上则既有病人被判作正常人,又有正常人被判作病人。 这就是临床上的漏诊和误诊问题。
例如,以舒张压为诊断指标在病人与正常人群中检查。如果将诊断标准定为90mmHg例如,以舒张压为诊断指标在病人与正常人群中检查。如果将诊断标准定为90mmHg l2kPa),则有部分本是正常人,但按此标准被判为高血压病人。亦有部分本是高血压患者但按诊断标准被判为正常人。即有些人舒张压虽未超过90mmHg(l2kPa),但是高血压患者。降低诊断标准,使正常人被判为高血压的比例增加;提高诊断标准,使病人被判为正常人的比例增加。 这种分布上的重叠是由于机体的个体差异所造成的。由于重叠使得临床疾病的诊断较为复杂。也由于分布的重叠,使得对诊断试验的研究和诊断标准的把握成为临床工作之必需。
正常人与病人间分布上的重叠是研究诊断试验的理论依据。对诊断试验研究的目的在于正确地认识重叠,制定合理的诊断标准,正确区分正常与异常,做出疾病的准确诊断。正常人与病人间分布上的重叠是研究诊断试验的理论依据。对诊断试验研究的目的在于正确地认识重叠,制定合理的诊断标准,正确区分正常与异常,做出疾病的准确诊断。 对一种诊断试验的研究与评价包括三方面内容:确定医学参考值范围(正常值范围);对诊断试验进行评价;确定诊断标准。
二、诊断试验的评价 某一诊断试验在临床应用,或某一指标的正常值范围用于疾病诊断时,要对其做出评 价,以了解其对疾病诊断的基本特征,来指导实际应用。 (一)评价方法 诊断试验评价最基本的方法是待评价的诊断试验所得结果与诊断该病的金标准(gold standard)进行同步测试和结果比较。
因此评价方法分为三个步骤: 1·确定金标准 对诊断试验进行评价理论上是该诊断试验测得的结果与实际有病或无病一致程度进行比较。但在工作中,实际谁有病、谁无病并不清楚,因此需要确定 一个可以反映有病或无病实际情况的诊断方法,这就是金标准。 所谓金标准是指当前医学界公认的,诊断某病最可靠、最权威的诊断方法。 例如,肿瘤的诊断以组织学诊断结果为“金标准”;外科疾病手术证实结果为"金标准"。
2·选择研究对象 诊断试验评价的研究对象应包括病人和非病人,即按金标准诊断划分有病者和无病者。 筛查试验的评价应从整个社会人群中选择研究对象。因为筛查试验的应用对象就是社会整个人群,其中包括某病患者与非患者。诊断试验则应选择患研究疾病的可疑人群或高危人群作研究对象,因为诊断试验的对象就是可疑患者,即到医院就诊者。
3 ·同步测试 对确定的每个受试对象,用金标准和被评价的诊断试验同时进行测试。 可以理解,将受试对象用金标准诊断分为病人与非病人,而用待评价的诊断试验测试,在真正病人中有的将被判为病人 (阳性),有的将被判为非病人 (阴性),即将其分为两部分。在真正非病人中待评价的诊断试验也将其判为两部分,病人 (阳性)与非病人 (阴性),将这四部分人数列入表19-1中。
(二)评价指标 诊断试验评价指标有两个方面,即真实性和可靠性。 真实性(validity),指测量值与实际值的符合程度。这里的测量值就是待评价的诊断试验所得结果。实际值就是每个受试者实际上患某病或末患某病。这是一个理论上的概念,事实上是不知道的,所以是以“金标准”诊断结果作为实际值。评价真实性的具体指标有灵敏度、特异度等。 可靠性(reliability),指在相同条件下重复试验获得相同结果的稳定程度。具体指标有一致率等。根据表19-1。
具体评价指标如下: 1·灵敏度(sensitivity) 也称敏感性,是指实际有病而诊断试验也正确地判为有病的百分率。即由“金标准”诊断为有病的病例组内,诊断试验检出阳性病例的比例,亦称该试验的真阳性率。 灵敏度越高则漏诊率就越低,在分布图形中表现为病人的分布重叠到正常人分布的面积小,表示发现疾病能力强。
2·特异度 (specificity) 也称特异性,指实际无病而诊断试验正确地判为无病的百分率。即由“金标准”将诊断为无病的对照组内,诊断试验检出阴性者所占比例。亦称真阴性率。 特异度越高则误诊率越低,在分布图形中表现为正常人的分布重叠到病人分布的部分少,表示把非病人判为病人的概率小,故也反映排除疾病的能力。
3·误诊率 指实际无病,但被诊断试验判为有病的百分率,即在非病人组,被诊断试验判为病人的比例。也称假阳性率,一类错误。误诊率和特异度的关系是:特异度=1一误诊率。 4·漏诊率指实际有病,但被诊断试验判为无病的百分率,也称假阴性率。检验中属二类错误。
5·粗一致率 也称符合率,是病人中诊断正确与非病人中诊断正确总例数占受检者的比例,其反映试验的准确性,越接近1表示诊断试验和实际越符合。 6·调整一致率 表示意义同粗一致率,只是为了减少误差在计算上做了校正。
7·约登指数 是综合考虑诊断试验真实性的一个指标,分布在0-1之间,越接近1表示诊断结果和实际情况越符合。 8·患病率 表示受试人群中患有研究疾病的频率。
例19·1某医院心血管内科在最近一段时间共接诊了360名心肌梗死疑似者,经 “金标准”诊断230名为心肌梗死患者,130例不患心肌梗死,为了评价血清肌酸磷酸激酶(CPK)诊断心肌梗死的准确性,对每个就诊者同时作了CPK测试,结果是病人中215例CPK阳性,而非病人中16例CPK阳性,将结果列入表19-2。
需要说明的是,此处的患病率是指到该医院心内科因疑似心肌梗死而就诊人群患心肌梗死的频率,与通常所说的某人群的患病率表示不同的含意。
(三)灵敏度与特异度的关系 对诊断试验真实性的评价,最主要的指标是灵敏度与特异度,这两个指标是矛盾统一的关系。 图19-1 表19-3 可说明灵敏度与特异度的关系。
三、诊断标准的确定 通常用的均数士2倍标准差正常值范围作为划分正常与异常的标准,这是不合理的。因为各种诊断指标在正常与异常间分布的重叠状况不相同。因此在对诊断试验评价过程中,要进行该诊断试验标准的确定。 在临床诊断试验的不同应用情况下,对其灵敏度和特异度的要求不同。因此确定诊断标准要参考临床应用目的。
1·要求灵敏度高的情况 即要求避免漏诊,保证所有病人尽可能被发现。见于如下5种情况: (1)筛选无症状病人, 如某病体检,健康检查等。 (2)疾病的早期诊断。 (3)病死率高,因漏诊会造成严重后果的疾病 (4)基层卫生机构。 (5)有几个诊断假设,为排除某病的诊断。
2·要求特异度高的情况 即要求降低误诊率,常见于以下几种情况: (1)因假阳性结果而采取不当防治措施而导致病人精神上、肉体上严重损害者。 (2)对疾病的确诊。如在专科医院接诊转诊病人,有临床表现高度疑似者,此时并不是要发现可疑患者,而是要做出确实诊断。 (3)治疗效果不理想,治疗费用较高的疾病。 (4)科研中挑选典型病例
3·要求灵敏度和特异度两者相对较高 在常规情况下或对一般疾病,尽可能使二者相对均较高。
根据上述诊断试验的三种应用要求,确定诊断标准方法如下:根据上述诊断试验的三种应用要求,确定诊断标准方法如下: 1·根据实际情况人为确定诊断标准 以正常人群和病例的测量值的分布资料为基础,权衡漏诊、误诊的比例和利弊,经专家讨论后制定的。如此制定的标准一般比较符合临床实际。
2·应用受试者工作特征曲线(receive operator characteristic curve,ROC曲线) ROC是用灵敏度为纵坐标,假阳性率为横坐标所绘的曲线。可用来确定最佳临界值。 将不同诊断标准时求得的灵敏度与假阳性率在坐标中的点连接成线,在该曲线最靠近左上角 的那一点或曲线的拐点处为最佳临界点,即最佳诊断标准。该法用于常规情况,即灵敏度、 特异度同样重要的情况。
3·通过计算确定 通过计算可求得在对灵敏度、特异度不同要求情况下的诊断标准。 见例19·2。
例19·2 肝大指数作为肝病病人的判断依据时,由于正常人与病人间分布的重叠,不论把标准定在何处均有误诊与漏诊。 已知:正常人肝大指数 肝病病人肝大指数 C为肝大指数诊断标准 误诊率: 漏诊率: 通过计算求得最佳诊断标准 (灵敏度、特异度相对均高,而误诊率、漏诊率相对均低的诊断标准)。
根据计算U值的公式,有下列关系 (C为所求的肝大指数): (C一6·08)/0·45= (8·38一C)/0·81 C=6·90 此值为一类误差与二类误差相等,即灵敏度、特异度相等时的诊断界值。 (6·90一6·08)/0·45=1·82 (8·38一6·90)/0·81=1·82 当U=1·82,P/2=0·034,即误诊率、漏诊率都是3·4%。
四、诊断试验的应用 评价某诊断试验的准确性及根据不同临床目的选择诊断方法时,主要参考的是灵敏度和特异度,但是当将某一诊断试验具体应用到临床实践后,临床医生所关心的就不再是诊断试验的灵敏度和特异度,而是其预测值,即诊断试验的应用问题。
(一)预测值的概念 预测值也叫预告值,是在将诊断试验应用到具体疾病诊断后,得到阳性或阴性结果时,对患者做出诊断中所参考的指标。
其计算公式为: 阳性预测值=a/(a+b) X100% 阴性预测值=d/(c+d) X100% 阳性预测值(positive predictive value):由诊断试验检出的全部阳性例数中,真正患该病者所占比例。即从阳性结果中能预测真正患病的百分率。也可理解为当某一受检者诊断试验结果为阳性时,患病的概率。 阴性预测值(negative predictive value):由诊断试验检出的全部阴性例数中,真正没有患该病者所占比例。即从阴性结果中可排除疾病的百分率。临床应用是在受检者得到阴性结果时排除患病的概率。
例19·1: 阳性预测值=215/231X100%=93.07% 阴性预测值=114/129X100%=88·37% 阳性预测值93.07%表示用肌酸磷酸激酶诊断心肌梗死,结果阳性者中有93.07%确实患心肌梗死,或者说某受检者得到阳性结果时,有93.07%的可能患心肌梗死。 阴性预测值88.37%则表示结果为阴性者不患心肌梗死的比例,即得到阴性结果时,排除患心肌梗死的概率。
(二)预测值与灵敏度、特异度、患病率的关系 1·预测值与患病率的关系 当灵敏度、特异度一定时,阳性预测值随着患病率的升高而升高;阴性预测值随着患病率的降低而升高。 Sketch做了一个冠状动脉狭窄的诊断研究,取了195个受试者。动脉造影以动脉狭窄≥75%作为异常,而运动试验以心电图判断。结果见表19-4。
患病率高时,阳性预测值高;患病率低时,阴性预测值高。患病率高时,阳性预测值高;患病率低时,阴性预测值高。
2·预测值与灵敏度、特异度的关系 当患病率一定时,预测值与灵敏度、特异度亦存在相互关系。 灵敏度高时,则阴性预测值高;特异度高时,则阳性预测值高。 例19.1。
3·预测值的计算 预测值并非诊断试验本身的特点,而是由受试人群的患病率和诊断试验的真实性所确定。
五、提高诊断试验效率的方法 提高诊断试验的效率有两个途径: 1、提高诊断试验的灵敏度与特异度 2、合理使用诊断试验 提高诊断试验的灵敏度与特异度主要靠新的诊断方法的发明与应用、诊断技术的改进、专业人员诊断水平的提高等。这对于临床医生来讲是无能为力的。因此重点是合理使用诊断试验,选择合适的诊断指标和诊断标准等。
(一)依据就诊者选择诊断试验 尽管一种疾病可采用多种诊断试验,但是每一种诊断试验对不同疾病诊断的准确度是不同的,因此临床医生在对具体患者做诊断检查时要注意以下几方面:
1、根据症状体征所表现出可能的疾病,选择诊断该病最准确的方法,即在了解病史及作体格检查后再考虑使用何种检查手段。决不能对就诊者一律作某些检查后考虑患什么病, 也不能对所有患者将医院具有的各种诊断手段通通查一遍。 2、同样情况下选择简便易行、费用低、出结果快的诊断试验,不要一味求先进。 3、对疾病的诊断过程要有一个明确思路,首先选什么诊断试验,在其结果阳性时再用什么诊断试验,阴性结果时、鉴别诊断时、待确诊的病确诊时该用什么诊断试验。
(二)根据临床目的选择诊断试验 临床目的可分为三个方面: 1、发现疾病 其目的是在无明显临床表现的人群中发现疾病或疾病早期。见于两种情 况:一种是疾病筛查 (screening);另一种是对某些到医院就诊者, 希望受检者只要有病,就能够被检出,因而要求这种试验具有较高的灵敏度。 2、排除疾病 排除疾病是一种鉴别诊断。目的在于有效排除一种或几种可疑的疾病,所以该类试验是费用较高、相对复杂、准确性较好的试验。 3、证实疾病 证实疾病的诊断试验是在采用发现疾病与排除疾病的诊断试验后对高度怀疑患某病者做出确实诊断,因此应尽可能使假阳性率降低,即选择特异度高的诊断试验。
(三)选择患病率高的人群 从前面所述的预测值与患病率之间的关系可以看出,患病率越高,阳性预测值越高,因而选择患病率高的人群应用诊断试验,可有效地提高诊断试验的质量与效率。 尽管临床医生难以做到这点,但在实践中注意下列人群的患病率相对较高:⑴转诊患者;⑵高危人群;⑶有临床症状人群。
(四)联合试验 任何一种诊断试验均不可能尽善尽美,有些灵敏度高,有些特异度高。例如对于肺癌的诊断,胸部X线灵敏度较高,但特异度低;支气管镜特异度高,但灵敏度低。因此临床上常常同时采用几种诊断试验以提高其灵敏度或特异度,这称作联合试验。 联合试验分为以下两种: