470 likes | 621 Views
第二章 医学数据和计量症状学. 教学目标:通过本课学习,学生应该能够回答 医学数据和信息有哪些特点?如何区别之? 哪些因素造成了医学数据的变异? 用什么指标来评估医学检查和症状在诊断上的价值?. 第二章 医学数据和计量症状学. 教学内容. 一、医学数据与信息 医学数据与信息 医疗数据的变异 医疗数据的解释. 二、计量症状学 检查的诊断价值 症状的情报价值 症状预测价值的评估方法. 一、医学数据与信息. 数据、信息和知识基本概念 数据、信息和知识 诊治过程中的数据和信息. 医学数据的类型. 医学数据的分布类型. 医疗数据的组成元素.
E N D
第二章 医学数据和计量症状学 • 教学目标:通过本课学习,学生应该能够回答 • 医学数据和信息有哪些特点?如何区别之? • 哪些因素造成了医学数据的变异? • 用什么指标来评估医学检查和症状在诊断上的价值?
第二章 医学数据和计量症状学 教学内容 • 一、医学数据与信息 • 医学数据与信息 • 医疗数据的变异 • 医疗数据的解释 • 二、计量症状学 • 检查的诊断价值 • 症状的情报价值 • 症状预测价值的评估方法
一、医学数据与信息 数据、信息和知识基本概念 数据、信息和知识 诊治过程中的数据和信息 医学数据的类型 医学数据的分布类型 医疗数据的组成元素 医学信息的类型 病人信息 知识信息
数据(Data): 载荷或者记录信息的,按照一定规则排列组合的物理符号。 Data=symbols 表现形式: 1,23, 哇哇哇…… Sort on Name 在医疗领域: 一条数据( A datum):在这里是指对病人的一项观察。 医学数据(medical data):有关一个病人的观察的集合。 数据、信息和知识 中国医科大学医学信息学系
数据、信息和知识 • 信息(Information): • 带有某种解释或者附加含义的成组的数据。 • 从数据中抽出的有意义或者有用的事实。 • 简称之为解释过的数据(interpreted data)。 • data that are processed to be useful; provides answers to "who", "what", "where", and "when" questions • 数据+背景=信息 • 王小二体温37°C+医学知识王小二没发烧
数据、信息和知识 • 知识(Knowledge): • 信息接受者通过对信息的提炼和推理而获得的正确结论 • 知识告诉我们,这组数据意味着什么。 • 是人的大脑通过思维重新组合【悟】的、系统化的信息集合 • 是人通过信息对整个世界的认识和掌握 • 一组用于从数据和信息中创造信息的规则、公式或者探索方法。 • 距离=速度*时间 • Knowledge: • application of data and information; answers "how" questions
观察 病人 决策 计划 诊治过程中的数据和信息 数据 信息 诊断 治疗
一、医学数据与信息 数据、信息和知识基本概念 数据、信息和知识 诊治过程中的数据和信息 医学数据的类型 医学数据的分布类型 医疗数据的组成元素 医学信息的类型 病人信息 知识信息
医学数据的类型 • 叙述(narrative): • 由医生纪录,主诉、现病史等。 • 测量数值(numerical measurements): • 血压、体温、化验值。 • 编码数据(coded data): • ICD-10中的类号。 • 文本数据(textual data): • 某些以文本形式报告的结果。 • 纪录的信号(recorded signals): • 心电图、脑电图等等。 • 图像 • X线等。
医学数据的类型 计量资料(measurement data):对每个观察对象的观察指标用定量的方法测定该指标的数值大小所得的资料。一般用度量衡单位表示,如身高、体重、浓度等等。 计数资料(enumeration data):先将观察对象的观察指标按性质或者类别进行分组,然后计数各组该观察指标的数目所得的资料。如人群的血型分布。 等级分组资料:具有计数资料的性质,同时又兼有半定量的性质。如化验结果的加号。 上述的资料可以转化。
医学数据的类型 面向变量(被观察单位的特征或指标)的分类方法: 分类变量(categorical variable):定性变量,有两个或多个互不相容的类别或属性。又进一步分为无序分类和有序分类。无序分类包括二项分类和多项分类。 数值变量(numerical variable):定量变量,也就是计量资料。以连续形式存在的,如生理信号、ECG、EKG等。 有时可以数值化的数据与一段自由文本存放在一起。在计算机病历中往往存储这种混合式的数据(文字和数据)。固定和活动图像是另一类的混合数据,有时还附有自由文本式的文字评述。
变量类型 变量值表现 实例 资料类型 数量变量 定量(具体数值) 身高(cm) 计量 资料 分类变量 无序 二分类 对立的两类属性 性别(男,女) 计数 资料 多分类 不相容的多类属性 血型(A,B,O) 有序 多分类 类间有程度差异的属性(又称等级资料) 文化程度(初中、高中、大学...) 医学数据的类型
医学数据的类型 • 每一条医疗数据至少应当包括4种元素: • 病人姓名(如韦小宝) • 问题的属性或参数(如年龄) • 参数的值(如40) • 观察的时间(如1999年9月5日9:12)
信息的类型 基本的类型: 病人信息(patient-specific):信息来自于病人治疗。如数值、文本、图像。 知识信息(knowledge-based):有关于医疗保健的科学文献。即以研究和实践为基础的科学知识纪录。
1 医学数据与信息 (总结) 数据、信息和知识基本概念 基本概念 诊治过程 医学数据的类型 医学数据的分布类型 医疗数据的组成元素 医学信息的类型 病人信息 知识信息
第二章 医学数据和计量症状学 一、医学数据 医学数据与信息 医疗数据的变异 计量症状学 医疗数据的解释 检查的诊断价值 症状的敏感度和特异度 症状预测价值的评估方法
2 医学数据的变异—精确度和准确度 一条数据可能因为不精确和或不准确而偏离实际值。 精确度:代表测量的可靠性。如果同一对象重复测量,应该获得同样的结果。 准确度:代表被测值被系统地集中于变量真值的周围的趋势。 医疗数据通常不能提供完全的信息,也不能用肯定程度来确认病人。
仪器内 仪器间 观察者内 观察者间 个体间 个体内 仪器 观察者 个体 分析或方法性上 生物学上 总变异 2 医学数据的变异—变异的来源 变异(variation)同值个体同指标之间的差异叫变异。
医学数据和计量症状学 医学数据 医学数据与信息 医疗数据的变异 计量症状学 医疗数据的解释 检查的诊断价值 症状的敏感度和特异度
3 医学数据的解释—医疗数据的使用 • 体温39 °C,血红蛋白=115g/L,…… • 看起来很客观的参数,只有参考其 • 开出检验的动机(为什么要检查?) • 采样的条件(采的是什么部位?) • 测量方法(用什么仪器设备测量的?) • 才能对其做出解释,只有这样才能把数据变成信息。 • 一个症状、临床体征或放射线体征的发现其实是复杂的决策过程的结果。
3 医学数据的解释—医疗数据的使用 计量变量值的精度(如脉搏)是由测量性质决定的。对其解释也主要根据测量时的具体情况(如病人的体位)和病人以前的病情才能做出。 在对生理现象进行解释时,经常要把几个基本的数值型数据结合起来考虑。如收缩压要和舒张压相联系。 由这些解释所产生的自由文本是建立在只有使用者能看懂的句法和语法之上的。因此要求编制术语集和分类表以规范化的形式表达医学概念。
第二章 医学数据和计量症状学 医学数据 医学数据与信息 医疗数据的变异 计量症状学 医疗数据的解释 症状和体征的分布情况 诊断价值的评价指标 症状预测价值的评估方法
4 什么是诊断价值? 症状学研究疾病的症状与体征的科学。 症状(Symptoms):病人自己向医生陈述(或是别人代述)的痛苦表现,如头疼、腹痛、鼻塞、恶心、呕吐等; 体征 (Signs):医生给病人检查时发现的具有诊断意义的征候,例如:右下腹麦氏点反跳痛是诊断阑尾炎的阳性体征;角弓反张、颈项强直是诊断破伤风的阳性体征; 计量症状学运用一些工具来评价医疗信号和数据的情报价值。
4 什么是诊断价值? 不是所有的医学数据都在诊断研究中有意义。进而言之,一个症状的出现不一定说明有该病;没有该症状也不等于没有该病。 如果症状S能够把病人从健康人群中区分出来(或将A病从B病中分离出来)的话,我们说S具有诊断价值。 P(D)=D的前置概率 P(D|S)=D的后置概率 0 0.5 1 即:该症状S在健康人群和病人之间(或两种病A和B之间)出现的频率差异显著。
4.计量症状学 4.1 分类变量诊断价值的分布:阴性或者阳性,离散 4.2 数值变量诊断价值的分布:具体数值的诊断,连续
症状(S) 已知诊断(D) 患病 未患病 有 TP FP 无 FN TN 4.1 分类变量的分布 假设有一个人群,已经通过一个金标准检验,知道人群中的对象可以分成两类:有D疾病的,没有D病的。 现在,要根据是否有症状S来建立疾病D的诊断。 下面的四格表显示了各种可能的情况。 TP+FP TN+FN TP+FN FP+TN N
症状(S) 已知诊断 患病 未患病 有 真阳性(TP):有病又有症状。 假阳性(FP):没病但有症状。 无 FN假阴性(FN):有病但无症状。 真阴性(TN):没病又没症状。 4.1 分类变量的分布 从症状或者体征的角度看:可能有四种情况, TP真阳性; FP假阳性; TN真阴性; FN假阴性; N病例总数。
4.2 数值变量的分布 对数值变量,设定一个正常值,将数值变量转换为分类变量,高于某一阈值的结果认为是异常,进行同样的计算。阈值可以根据研究人群中参数的分布,应用统计学方法确定。 频数 正常 异常 疾病人群 健康人群 数值 阈值
医学数据和计量症状学 医学数据 医学数据与信息 医疗数据的变异 计量症状学 医疗数据的解释 症状和体征的分布 诊断价值的评价指标 症状预测价值的评估方法
5 分类变量评价指标 • 我们假设有两个人群,一群有病,另一群没有病。 • 症状(S)的敏感度或真阳性率(TPR) • 指病人中有症状S的百分比。 • Se=TP/(TP+FN)
5 分类变量评价指标 • 特异度或真阴性率(TNR)系指健康人群中没有该症状的百分比。 • Sp=TN/(TN+FP) • 如果一个症状在没有该病的人群中很少见到的话,它对该病有特殊的意义。 • 一个特异度等于1的症状称作“特异性症状”,如麻疹中的克氏征。
5 分类变量评价指标 一个好的诊断试验其特异度和敏感度都应该高,似然比(Likelihood Ratio,LR): LR=Se/(1-Sp) 一个理想的症状或体征应当是特异度和敏感度均为“1”,敏感度是来自于样本中的病人,特异度来自于没有病的人,它们与疾病D的发病率(表示疾病在人群中的发生率)是相互独立的。
5 计量变量评价指标 • 计量数据选择正常值,转换为分类变量。 • 在选定的阈值中,每个阈值A都可以计算其特异度和敏感度,从而发现最好的一对敏感度与特异度。 • 可以在正常人群和患病人群参数的分布曲线重叠的地方寻找到敏感度和特异度为1的阈值。 • 任何特异度的增加都会带来敏感度的损失,反之亦然。
SGOT>100 25 4 SGOT≤100 23 42 SGOT>120 22 3 SGOT≤120 26 43 5 症状的情报价值--敏感度和特异度-计量数据 • 对94个有胸痛的病人测量其SGOT率,已经知道样本中患有冠状动脉栓塞的病人数。 • 将100单位作为阈值,高于100为阳性,检验出的敏感度是25/48或52.1%,其特异度是42/46,91.3%; • 以120单位为阈值,敏感度为22/48,即45.8%,特异度为43/46,93.5%。 患者 健康人 患者 健康人 总计: 48 46 48 46
5 症状的情报价值--敏感度和特异度-计量变量 一个检查在诊断中的情报价值可以通过改变其正常值,用一个〔Se,1-Sp〕来表示。 这种曲线称作ROC曲线(receiver-operating characteristic),即受试者作业特征曲线。 比较不同检查的ROC曲线可以判别其情报价值,最高的就是曲线判别能力最强的。 受试者作业特征曲线 Se 0 1 1-Sp
医学数据和计量症状学 医学数据 医学数据与信息 医疗数据的变异 计量症状学 医疗数据的解释 检查的诊断价值 检查诊断价值的指标 症状预测价值的评估方法
6 症状预测价值的评估方法 • 了解检验的结果之后,行医疗决策时,应当考虑: • 疾病的前置概率:P(D)疾病在一般人群中的发病率 • 真阳性、假阳性、真阴性、假阴性的四种情况。 • 通过上述指标来估计一个症状 • 阳性预测值:有症状,检验阳性,患病的可能性多大? • 阴性预测值:没症状,检验阴性,无病的可能性多大?
6 症状预测价值的评估方法 一个个体有某症状同时又患病的概率P(D|S),称为阳性预测值(PPV)或诊断值。 根据贝叶斯定理: P(D|S)=P(D∧S)/P(S) PPV:positive predictive value S D^S
6 症状预测价值的评估方法 如果诊断值等于: 如果Sp=1,PPV=1,则症状是特异症状。 如果Se=1-Sp,则PPV=P(D);症状对于疾病而言没有诊断价值(患病的概率不因该症状的存在而发生改变)。 如果A比B好(即Se(A)>Se(B),而且Sp(A)>Sp(B)),那么A的诊断价值大于B。 我们可以用阳性预测值评价在诊断阳性情况下的症状,因为它仅仅涉及到了一种错误:假阳性。如果我们考虑在同一时刻的两种预测值,如果PPV(A)>PPV(B),而且同时NPV(A)>NPV(B)的话(实际上这两种情况很少发生),我们可能更愿意采用A症状作为诊断指标。
6 症状预测价值的评估方法 一个个体没有症状同时也没有疾病的的概率为 ,称为阴性预测值(NPV) 由此,我们可以得出结论:
医学数据和计量症状学 医学数据 医学数据与信息 医疗数据的变异 计量症状学 医疗数据的解释 检查的诊断价值 检查诊断价值的指标 症状预测价值的评估方法
回顾 教学目标: 通过本课学习,学生应该能够: 区分医学数据和信息 描述医学数据的变异来源 使用有关指标来评估医学检查和症状 诊断学价值