1 / 52

计算机检索

计算机检索. 遵义医学院 医学文献检索教研室 8608202 zmcwxjsjys@163.com. 计算机检索. 第一节 计算机检索与数据库 第二节 如何制定检索式. 第一节 计算机检索与数据库. 一、 计算机检索的定义及其优点 二 、计算机检索发展史 三 、数据库的结构与类型 四 、计算机检索步骤. 一、 定义及优点. (一)定义: 就是通过计算机及与其 相连的通讯设备和线路 在存储文献的数据库中

abe
Download Presentation

计算机检索

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 计算机检索 遵义医学院 医学文献检索教研室 8608202 zmcwxjsjys@163.com

  2. 计算机检索 • 第一节 计算机检索与数据库 • 第二节 如何制定检索式

  3. 第一节 计算机检索与数据库 • 一、 计算机检索的定义及其优点 • 二 、计算机检索发展史 • 三 、数据库的结构与类型 • 四 、计算机检索步骤

  4. 一、 定义及优点 (一)定义:就是通过计算机及与其 相连的通讯设备和线路 在存储文献的数据库中 查找信息的过程。

  5. (二) 计算机检索的优点 • 效率高,速度快 • 检索途径多 • 适合检索复杂课题 • 资源可共享,资源更新快 • 检索结果可直接输出 • 入手容易

  6. 二、计算机检索发展简史 脱机检索 联机检索 光盘检索 网络检索

  7. 三 、数据库的结构与类型 1、数据库的结构 • 文档--记录--字段 • 文档(file):数据库中一部分记录的有序集合(顺 排文档,倒排文档) • 记录(record):描述原始信息的外部特征和内部特 征。数据库中一条记录代表一篇文献 • 字段(field):比记录更小的单位,是组成记录的 数据项目(如TI、AU、 SO、AB……)

  8. 文献信息数据库 全文型数据库 事实型数据库 类型 书目型数据库 数值型数据库 多媒体数据库 2、数据库的类型

  9. (1)书目型数据库 是二次文献数据库,主要存贮相关主题领域的各类文献资料的书目信息,包括机读版的文摘、题录、目录、索引等。 如:EM、IM、CA、BA……

  10. (2)全文型数据库(Full-text atabase) CJFD、BMJ、FMJS、OUP……

  11. (3)事实型数据库(Fact Database):提供有关事物、人物、机构等方面的事实性信息。如: Clinical Trials(临床试验数据库)、中国中药数据库、疾病诊疗数据库、中国医药产品数据库……

  12. (4)数值型数据库(Numeric Database):提供数据性信息,包括各种统计数据、科学实验数据、各种测量数据等 如:WHOSIS和美国疾病控制与预防中心(CDC)的Data and Statistics等。可以获取死亡原因统计、卫生从业人员统计、人口统计、HIV/AIDS信息与数据统计数据和资料等统计数据、中药成方制剂标准数据库……

  13. (5)多媒体数据库(Multimedia Database) :是数据库技术与多媒体技术相结合的产物,是文本、图像、声频、视频等多媒体信息的集合。 如美国的可视人、可视脑计划……

  14. 四、计算机检索途径及步骤 • (一)检索途径 • (二)检索步骤

  15. (一)计算机检索途径 • 自由词检索 • 主题词检索 • 题名检索 • 著者检索 • 机构检索 • 刊名检索 • 默认检索 • 分类检索 • 引文检索 • ……

  16. 2、 检索步骤 分析检索课题 选择数据库 确定检索词 构筑检索式上机检索 否 浏览结果 是 输出结果

  17. 第二节 如何制定检索式

  18. 如何制定检索式 一、检索式与运算符的定义 二、运算符类型及其应用 三、检索效果评价

  19. 一、 检索式与运算符的定义 • 检索式:用运算符将检索词连接起来构成 的式子称成为检索式 • 运算符:又称为逻辑算符,是用来表达词 与词之间的逻辑关系和限定关系 的运算符号

  20. 二、运算符类型及其应用 • (一)布尔逻辑运算符:boolean operator • (二)位置符:position operator • (三)截词符:truncation node • (四)限定符:limit incantations

  21. 又称为“布尔算符”,由英国数学家乔治布尔提出又称为“布尔算符”,由英国数学家乔治布尔提出 (一)布尔逻辑运算符: • 用来连接两个或多个检索标识的符号 包括:AND、OR、NOT。

  22. 1、布尔算符 AND 的含义及应用 A B (1)含义:AND又称为逻辑“与”,表示“相交”关系,用于缩小检索范围(查准率) (2)应用形式:A AND B

  23. 例1 在CBM中找干扰素治疗白血病的文献 检索式为:干扰素AND白血病

  24. 2、布尔算符 OR 的含义及应用 (1)含义:“OR”又称为逻辑“或”,表示“并列”关系,扩大检索范围(查全率) (2)应用 表示形式:A OR B B A 例如:查找有关艾滋病的文献 检索式为:艾滋病 OR 爱滋病 OR AIDS OR 获得性免疫缺陷综合征

  25. CBM检索结果

  26. 总结:提高查全率从以下几个方面考虑 • 全称、简称及缩写同时使用; • 规范词兼顾自由词(包括同义词、近义词); • 查上位词时勿忘下位词; • 注意外来词译写变化; • 采用多途径检索。

  27. 例2:用CBM查找1978年以来乳腺癌的检索结果 用CBM查找1978年以来脑梗塞的检索结果

  28. 例3:用MEDLINE检索近3年乳腺肿瘤的检索结果

  29. 例4: 用CBM查找脑血管疾病的有关文献 下位词 上位词

  30. 例5 用CBM查找拉米夫定的有关文献

  31. 例6 免疫性疾病的文献 (多途径检索)

  32. 3、布尔算符 NOT 的含义及表示形式 (1)含义:NOT又称为逻辑“非”,用于 排除不需要的检索结果 (2)应用 表示形式:A NOT B B A 例如:白血病非放射性治疗的文献

  33. 白血病的非放射性治疗检索结果

  34. 4、运用“布尔算符”的注意事项 布尔逻辑运算符运算顺序为: NOT→AND→OR 1)运算符遵循数学运算法则; 2)在检索式中只有AND、OR前后的检索标 识可以交换; 3)检索式中有NOT时前后检索词不能交换。 备注: ( )必须在半角和英文状态下输入

  35. (二)位置符 作用: 表示两个检索词之间位置的检索符。用于缩 小检索范围 包括: NEAR WITH 1、表示前后两个检索词出现在同一个句子中; 2、near后加上数字时,表示两个检索词之间 所间隔单词的数量为0至数字-1个 要求左右两个检索词出现在同一个字段中。

  36. 应用举例(一) • NEAR • 形式: A NEAR(n) B • 实例:检索乳腺肿瘤的检索式可简化为: breast near1 (cancer or neoplasms or Tumor or sarcoma or carcinoma)

  37. 应用举例(二) • WITH • 形式: A WITH B • 实例:Leukemia with complications

  38. (三)截词符 • 作用:表示不确定字符的检索运算符,用于 扩大检索范围 • 包括:“*”(%、$)无限截词符“?”有限截词符(通配符)

  39. 应用举例(一) “*”的应用 如:1、急性*胰腺炎:可检出急性胰腺炎、急性重症胰 腺炎、急性出血坏死型胰腺炎、急性胆源性胰 腺炎、急性出血性胰腺炎等急性胰腺炎的所 有文献。 2、immun*: 可检出immune、 immunity、 immunology、 immunohistochemical 等所有含immun前缀的检索词的文献。

  40. 检索结果(CBM新版数据库) 可检索出急性胰腺炎、急性重症胰腺炎、急性胆源性胰腺炎、急性出血坏死型胰腺炎等

  41. 急性%胰腺炎的检索结果页

  42. 使用MEDLINE(06/7-06/10)查找免疫相关的文献结果使用MEDLINE(06/7-06/10)查找免疫相关的文献结果

  43. 应用举例(二) “?”的应用 例如:拉米?定:可检出含拉米夫定和拉米呋定 定的文章;  Protein?:可检出含 Proteins 和 Protein的所有文章 注:“?”必须在半角或英文状态下输入

  44. ……

  45. (四)限定符 作用:对特定字段的限定检索, 包括:“in”、“=”、“[]”、“.”等 表现形式:检索标识 限定符 字段名 实例:PY=2003; shi j sin au; shi j s[au] shi j s.au

  46. 总结:提高查准率从以下几个方面着手 • 检索结果多时采用“AND”缩小检索范围 • 检索下位词时不使用上位词 • 使用 “NOT”将不需要的检索标识排除 • 将“AND”改为限制词语间位置关系的位置符 • 使用限定符限定检索标识所在字段

  47. 三、检索效果评价 (一) 评价标准 查全率、查准率、漏检率、误检率 查全率P=a/(a+c)×100% 查准率R=a/(a+b)×100% (a:检出的相关文献量;b:检出的非相关文献 量;c:系统中未检出的相关文献)

  48. (二)影响检索效果的因素 1、影响查全率的因素 文献存储:收录不全;词汇缺乏控制和专指;词 表结构不完整;标引不详或遗漏等 信息检索:策略简单;逻辑组配不当;途径和方 法太少;业务不熟;系统不具备截词 功能等。

More Related