580 likes | 694 Views
医学信息的分类与编码. 一 . 信息分类 分类的基本原则与要求 分类的基本方法 二 . 信息编码 代码的功能 编码的基本原则 代码的种类 代码的表现类型 三 . 疾病的分类与编码 疾病分类法概述 疾病分类编码要求. 为什么要信息分类编码?. 医学语言的特点 造成了交流的障碍. 词汇极其广泛,丰富:基础、临床、人体、化学、物理、社会、精神等等; 专业性强:专业术语多,如幅奏(辐辏)反射、鼻衄,有的生涩难懂; 含义不清:所用的词往往模糊和不精确,缺乏明确的定义:
E N D
医学信息的分类与编码 一.信息分类 分类的基本原则与要求 分类的基本方法 二.信息编码 代码的功能 编码的基本原则 代码的种类 代码的表现类型 三. 疾病的分类与编码 疾病分类法概述 疾病分类编码要求
为什么要信息分类编码? 医学语言的特点造成了交流的障碍 • 词汇极其广泛,丰富:基础、临床、人体、化学、物理、社会、精神等等; • 专业性强:专业术语多,如幅奏(辐辏)反射、鼻衄,有的生涩难懂; • 含义不清:所用的词往往模糊和不精确,缺乏明确的定义: • 同一疾病可以有多种名称或表述,称为同义词(对眼儿,斗鸡眼); • 一个词有时会有多种含义,称为一词多义(lead)。
为什么要信息分类编码? 这种情况并不妨碍医务人员之间、医患之间的交流,因为谈话人之间可以通过具体的语言环境加以判断其含义。但却给计算机在医疗实践和科研中的应用带来困难。
为什么要信息分类编码?信息分类和编码的临床意义为什么要信息分类编码?信息分类和编码的临床意义 • 医疗差错:美国人第五大死因。 • 1999年,美国医学会的报道《人皆犯错》: • 由于医疗差错造成惊人的人力和财力支出。美国每年大约有4.4万-9.8万人死于医疗差错,超过了交通事故或乳腺癌致死人数,其造成的经济损失在170亿-290亿美元。 • 这些医疗差错并不是某个人的错误,而是医疗系统自身缺陷所造成的。 • 如果能系统地收集和分析有关医疗差错的数据,确定原因,很多损失和死亡是可以避免的。 • 标准的术语表成为医疗保健服务中亟待解决的关键问题。 • 信息分类编码是信息标准化工作的一项重要内容,本节将介绍信息分类编码的基本知识和方法。
一、信息分类 • 分类有两种不同含义:1)设计一种分类方法的过程;2)通过使用分类概念标识的编码或术语,对对象进行编码或描述。 • 本课程讨论的是分类的第一种含义。 • 分类:是某一领域内概念的序化系统,体现了显式或隐式序化原理。
一、信息分类 • 分类:是反映事物本质属性的思维产物。 • 属性: • 乳腺癌基因表达研究中的病人临床数据: • 性别、年龄、种族、口服避孕药、吸烟、病理学分期、病理学分型、治疗后复发、手术后送检时间、吸烟类型、临床分期、临床分型……
一、信息分类 • 分类的目的:支持医疗保健统计或医学科研工作。 • 对心电图异常进行分类。 • 对病人疾病诊断进行分类。 • 分类法让我们有可能把不同环境中收集的信息进行相互比较。 • 计算医院里各年龄段所需要的床位数,年龄分组方法: • 婴儿 0 - 3 岁 • 儿童 4 - 12岁 • 青年 13 -18 岁 • 成人 19 - 64 岁 • 老人 65 岁以上 • 在这个例子中,分类的根据是一个简单的属性:年龄。年龄是判别标准。
一、信息分类 • 步骤 • 首先,收集某一领域的概念集,领域指就诊原因、诊断、医疗步骤。 • 如《国际疾病分类法》即对疾病的分类。 • 然后,概念根据隶属关系被有序化 • 肺炎为一种肺部疾病: • 肺炎:相对狭窄的概念, • 肺部疾病:相对宽泛的概念。
基本原则 一、信息分类 科学性:通常要选择事物或概念(即分类对象)最稳定的本质属性或特征作为分类的基础和依据。 图书、文章、光盘、网页、病人、疾病、手术…… 系统性:将选定的事物、概念的属性和特征按一定排列顺序以系统化,并形成一个合理的科学分类体系。
一、信息分类 基本原则 可扩延性:通常要设置收容类目,以便保证增加新的事物或概念时,不至于打乱已建立的分类体系,同时,还应为下级信息管理系统在本分类体系的基础上进行延拓细化创造条件。 兼容性:与有关标准(包括国际标准)协调一致。 综合实用性:分类要从系统工程的角度出发,把局部问题放在系统整体中去处理,达到系统最优化状态,即在满足系统总任务、总要求的前提下,尽量满足系统内各有关单位的实际需要。
基本方法 一、信息分类 面分类法 线分类法 层次分类法 hierarchical classification 它将初始的分类对象按所选定的若干属性或特性逐次地分成相应的若干个层积累目,并排成一个有层次的、逐级展开的分类体系。 Facetedclassification 将所选定的分类对象的若干个属性或特征视为若干个“面”,每个面中又可分成彼此独立的若干类目。使用时,可根据需要将这些面中的类目结合在一起,形成一个复合类目。
代码 名称 13 1301 1302 . . . 1322 132221 132222 河北省 石家庄市 唐山市 . . . 邢台地区 邢台县 沙河县 一、信息分类 基本方法 线分类法 分类体系 上位类 隶属关系 下位类 同位类 不交叉不重复 同位类
一、信息分类 基本方法 线分类法 原则: 由上一位类划分出的下位类类目的总范围应当与其上位类类目范围相等。 当某一个上位类类目划分成若干个下位类类目时,应选择一个划分标准。 同位类类目之间不交叉、不重复,并只对应于一个上位类。 分类要依次进行,不应有空层或加层。
一、信息分类 基本方法 线分类法 优点: 层次性好,能较好地反映类目之间的逻辑关系。 使用方便,既符合手工处理信息的习惯,又便于电子计算机处理信息。 缺点: 结构弹性较差,分类结构一经确定,不易改动。 效率较低,当分类层次较多时,代码位数较长,影响数据处理的速度。
一、信息分类 基本方法 面分类法 例如:服装的分类。 使用时,将有关类目组合起来,如纯棉男式医生工作服,等等。
一、信息分类 基本方法 面分类法 原则: 根据需要选择分类对象的本质属性和特征作为分类对象的各个面。 不同面内的类目不应相互交叉,也不能重复出现。 每个面有严格的固定位置。 面的选择以及位置的确定,根据实际需要而定。
一、信息分类 基本方法 面分类法 优点: 具有较大的弹性,一个面内的类目改变,不会影响到其他的面。 适应性强,可根据需要组成任何类目,同时也便于机器处理信息。 易于添加和修改类目。 缺点 不能充分利用容量,可组配的类目很多,但有时实际应用的类目不多。 难于手工处理信息。
医学信息分类与编码 一.信息分类原则 分类的基本原则与要求 分类的基本方法 二.信息编码方法 代码的功能 编码的基本原则 代码的种类 代码的表现类型 三. 疾病分类与编码 疾病分类法概述 疾病分类编码要求
细数那些有趣的名字 • 记得中学校医室有个校医名叫“段珍”,晓得她的名字后,我们都不去她那儿打针了。 • 我晓得哥哥的同学里有一个人叫朱逸群,一个叫杨宜知。 • 有个人叫秦寿生,不知道他父母是怎么想的。 • 初中一个女孩叫倪杨,小女孩身体不好,老是生病,每次班主任点名叫她,都是倪杨……倪杨……,最后就干脆喊成“娘”了:“娘没来吗?娘又生病了吗?” • 吴安全??是个司机。 • 上大二时,期末考试,《马克思主义哲学原理》全系只有一个人没过,他的名字叫??马哲。 • 宋秋波,一起上过一个学期的课。
细数那些有趣的名字 我初中时,学校教导主任叫“矫厚根”,念起来怎么听都觉得是“脚后跟”。 有一同学叫“段明”,普通话不标准者念起来就与“断命”一样,后改名。 记得看电视,晓得有一女记者名叫“胡云”,有一女记者名叫“胡月(曰)”,报出的新闻能有人相信吗? 高中一个同班男孩,叫吴礼坚,平常大家念都太平无事,偏偏来了个外地老师,“吴”“胡”发音不清,结果变成“狐狸精”,几次哄堂大笑之后此同学再也没有被点名。 有个孩子叫子腾,本来挺文雅的名字,偏偏老爹姓杜。 前几年我一个同事闲得无聊乱翻电话簿,居然找到一个人叫陈尿,拿公家电话照号码打过去,“……喂,我找陈尿…….”“我就是!” 高中时的一个女同学及其姐姐,有一对很奇怪的名字:王浴天骄,王浴神州。怎么样,够霸气吧。
二、信息编码 信息编码就是将事物或概念(编码对象)赋予有一定规律性的、易于计算机和人识别与处理的符号。
代码的功能 二、信息编码 1.标识:代码是鉴别编码对象的唯一标志。 2.分类:当按编码对象的属性或特征(如科别、专科等)分类并分别赋予不同的代码时,代码又可以作为区分编码对象类别的标志。 3.排序:当按编码对象发现(产生)的时间、所占有的空间或其他方面的顺序关系分类,并分别赋予不同的代码时,代码又可以作为区别编码对象排序的标志。伯仲叔季,孟。 4.特定含义:由于某种客观需要采用一些专用符号时,此代码又可提供一定的特定含义。
基本原则 二、信息编码 唯一性:虽然一个编码对象可以有很多不同的名称,也可按各种不同方式对其进行描述,但是,在一个分类编码标准中,每一个编码对象仅有一个代码,一个代码只唯一表示一个编码对象。【标识功能】 合理性:代码的结构要与分类体系相适应。【分类功能】 可扩充性:必须留有适量的后备容量,以便适应不断扩充的需要。【研究生院系部门代码】
基本原则 二、信息编码 简单性:代码结构应尽量简单,长度要尽量短,以便节省机器存贮空间和减少代码的差错率,提高机器处理的效率。 适用性:代码要尽可能反映编码对象的特点,有助记忆,便于填写。[电话号码:1-800-go-ups] 规范性:在一个信息分类编码标准中,代码的类型、代码的结构以及代码的编写格式必须统一。
代码 无含义代码 有含义代码 顺序码 无序码 系列顺序码 数值化 字母顺序码 层次码 特征 组合码 复合码 代码的种类 二、信息编码
二、信息编码 代码的种类 1.无含义代码:即无实质含义的代码。此种代码只作为编码对象的唯一标识,只起代替编码对象名称的作用,而不能提供有关编码对象的其他任何信息。 无序码:将无序的自然数或字母赋予编码对象。此种代码无任何编写规律,是靠机器的随机程序编写的。 顺序码:是最简单、最常见的代码。将顺序的自然数或字母赋予编码对象。如GB 2261-80《人的性别代码》中,[1]为男性,[2]为女性。早期的汽车牌号,自行车牌号。
二、信息编码 代码的种类 有含义代码:是具有某种实际含义的代码。此种代码不仅作为编码对象的唯一标识,有代替编码对象名称的作用,还能提供编码对象的有关信息(分类、排序、逻辑意义等)。 系列顺序码 数值化字母顺序码 层次码 特征组合码 复合码
二、信息编码 代码的种类 系列顺序码 是一种特殊的顺序码。此种代码是将顺序码分为若干段(系列)并与分类对象的分段一一对应,给每段分类对象赋予一定的顺序码。一般对分类深度不大的分类对象进行编码时,常采用这种代码。 如GB 4657-84《国务院各部、委、局及其他机构名称代码》 : 300-399 表示国务院各部、委。 400-499 表示国务院各局、办公机构和直属于国务院各部、委的国家局级机构。 700-799 表示全国性的人民团体。
二、信息编码 系列顺序码举例
二、信息编码 系列顺序码的优缺点 优点:能表示编码对象一定的属性或特征,易于添加。 缺点:空码较多时,不便于机器处理,不适用于复杂的分类体系。
二、信息编码 数值化字母顺序码 按编码对象名称的字母排列顺序排列,然后分别赋予逐个增加的数字码。 如:按英文字母顺序排列的数值化字母顺序码
二、信息编码 数值化字母顺序码的优缺点 • 优点:编码对象容易归类(不存在可多处列类的现象),容易维持并可起到代码索引的作用,便于检索。 • 缺点:预留编码问题。 • 编制标准时,需要一次性地为以后可能出现的分类编码对象留有足够的空位; • 如果预留的空位不足,为了保证新增加的分类编码对象的排列次序,就需要重新编码; • 各类目密集的程度不均匀。 • 此种代码使用寿命相对较短。
二、信息编码 层次码 常用于线分类体系,它是以分类对象的从属、层次关系为排列顺序的一种代码。 对产品来讲,这个排列顺序可以是按工艺、材料、用途等属性来排列。 编码时,将代码分成若干层级,并与分类对象的分类层级相对应,代码自左至右表示的层级由高到低,代码的左端为最高层级代码,右端为最低层级代码,每个层级的代码可采用顺序码或序列顺序码。
1 2 3 4 5 X X XX X XX 农、林、水产类代码 药用部位代码 中药材序号 加工炮制方法代码 中药材类代码 二、信息编码 层次码 如,GB 7635-87《中药分类与代码》就是采用的5层7位数字的层次码,其结构如下图所示:
二、信息编码 层次码的优缺点 优点: 能明确地表明分类对象的类别; 有严格的隶属关系; 代码结构简单;容量大,便于机器汇总。 缺点: 代码结构的弹性较差 当层次较多时,代码位数较长。 R738 运动系肿瘤 运动系肿瘤 肿瘤学 医学
二、信息编码 特征组合码 常用于面分类体系。它是将分类对象按其属性或特征分成若干个面,每个面内诸类目按其规律分别进行编码。 因此,面与面之间的代码没有层次关系,也没有隶属关系。使用时,根据需要选用各面中的代码,并按预先确定的面的顺序将代码组合,以表示类目。
第一面 第二面 第三面 第四面 1-不锈钢 2-黄铜 3-钢 1-φ0.5 2-φ1.0 3-φ1.5 1-圆头 2-平头 3-六角形头 4-方形头 1-未处理 2-镀铬 3-镀锌 4-上漆 二、信息编码 特征组合码 例如,对机制螺钉可选用材料、直径、钉头形状及螺钉表面处理状况四个面,每个面内又分成若干各类目,并分别编码,见表。使用时,将各面的代码组合。 2342=??
二、信息编码 特征组合码 优点:代码结构具有一定的柔性,适于机器处理。 缺点:代码容量利用率低,不便于求和、汇总。
二、信息编码 复合码 是一种应用较广的有含义代码。它常常是由两个或两个以上完整的、独立的代码组成。 例如,将分类编码对象的代码分成分类部分和标识部分两段。分类部分标识分类编码对象的属性或特征层次、隶属关系。标识部分起这分类编码对象注册号(即登记号)的作用,常用顺序码或系列顺序码。 R738.2/4==??
二、信息编码 复合码 优点: 代码具有很大的柔性。易于扩大代码容量和调整代码对象的所属类别。 代码标识部分可以用于不同的信息系统,因而便于若干系统之间的信息交换。 缺点: 代码总长比较长。
二、信息编码 代码的表现类型 数字型代码 123333 AK 字母型代码 数字与字母混合型代码 AK-47
二、信息编码 代码的表现类型 数字型代码:是用一个或若干个阿拉伯数字表示编码对象的代码,可以简称为数字码。 • 数字型代码的特点是: • 结构简单使用方便、排序容易,并且易于国内、外推广。 • 对编码对象特征描述不直观。 • 数字型代码是目前各国广泛采用的一种代码形式。
二、信息编码 代码的表现类型 字母型代码:是用一个或多个字母表示编码对象的代码。可以简称为字母码。 • 缺点: • 不便于机器处理信息: • 编码对象数目较多 • 添加、更改频繁 • 编码对象名称较长 • 出现重复和冲突的现象。 优点: 容量大。26 > 10 便于识别。BJ, HB 因此,这种字母组合型代码常用于编码对象较少的情况。
二、信息编码 代码的表现类型 • 数字与字母混合型代码:由数字、字母组成的代码,或数字、字母、专用符号组成的代码。可以简称为字母数字码或数字字母码。 • 数字与字母混合型代码的特点 • 基本兼有了数字型代码、字母型代码的优点,结构严密,具有良好的直观性,同时又有使用上的习惯。 • 由于代码组成形式复杂也带来了一定的缺点,即计算机输入不方便,录入效率低,错误率增高,不便于机器处理。
医学信息分类与编码 一.信息分类原则 分类的基本原则与要求 分类的基本方法 二.信息编码方法 代码的功能 编码的基本原则 代码的种类 代码的表现类型 三. 疾病分类与编码 疾病分类法概述 疾病分类编码要求
三、疾病分类法 疾病分类法概述 • 分类法 • 是一种归纳概括的方法,是专业信息编码的依托和基础。 • 疾病分类法 • 是根据人体的内在联系和疾病表现之类的信息特点归类的方法。 • 疾病分类学 • 将成千上万的疾病名称信息加以整理,按照其属性,分门别类地依次排列成序,以便为各种目的使用。
三、疾病分类法 疾病分类法概述 分类学的具体工作就是把事物按规律系统化,欲达到系统化必须设立系统结构,在疾病分类方法中,首先要确立分类标准,就是以什么分类轴心作为基准去归类信息。如下几个轴心可以作为标准 1. 解剖部位 4.机能障碍 2.发病原因 5.其他相关因素 6.症状分类 3.组织病理改变
三、疾病分类法 疾病分类法概述 • 人体患病部位显示于身体的某一部位,例如: • 按照临床的分类习惯,可以有皮肤、呼吸系统、消化(胃肠)系统、循环(心血管)系统、泌尿生殖系统等疾病信息。 • 伤寒、中毒等可侵犯全身属于整体部位; • 外伤则多限于局部,单发或多发。 • 这是疾病分类法中最简单易行的,但是只靠解剖部位这一个轴心是表达不了各种不同病原体或病理改变在人体内所至的病态,所以必须还要有其他的轴心。