1.55k likes | 1.69k Views
网络信息资源获取与管理. 第一章 网络检索基础及检索工具的利用. 授课单位:图书馆 电话: 020-36585807 课件下载:图书馆网站. CONTENTS. 课程作用与目标. 授课与 考核 方式. 基础理论. 其它检索工具. 课 程 作 用. 学会获取各类信息的方法,减少大脑记忆的负担。 培养高素质复合型人才,是终身教育的基础。 科学研究的基础。 继承和借鉴前人成果 避免重复研究 节省科研工作时间,提高科研效率 协助决策者作出正确决策. 你是否有和科研相关的信息需求. 科研过程. 论文写作. 课题设计 基本知识 背景信息 信息论证.
E N D
网络信息资源获取与管理 第一章 网络检索基础及检索工具的利用 授课单位:图书馆 电话:020-36585807 课件下载:图书馆网站
CONTENTS 课程作用与目标 授课与考核方式 基础理论 其它检索工具
课 程 作 用 • 学会获取各类信息的方法,减少大脑记忆的负担。 • 培养高素质复合型人才,是终身教育的基础。 • 科学研究的基础。 • 继承和借鉴前人成果 • 避免重复研究 • 节省科研工作时间,提高科研效率 • 协助决策者作出正确决策
你是否有和科研相关的信息需求 科研过程 论文写作 课题设计 基本知识 背景信息 信息论证 研究过程 全面论证 信息研究与分析 特定信息 知识点追踪 信息需求
你是否有过信息焦虑 • 总是找不到所需的信息 • 总是得到大量不需要的信息 • 信息量太大,无法阅读
误 区 • 某博士倾尽多年精力产生的研究成果,而几年前国外已有同样观点、同样方法、同样结论的文章报道。 • 部分医学研究人员,发表的文章,引用的论文还是七、八年前的,不会有意识、有目的的检索和跟踪最新的信息。 • 我国中药新药的研发有90%属重复研究,医学其他领域的科研重复率,也高达70%
课程目标——培养信息素质 • 信息素质 • 信息意识:对信息的重视和敏感性 • 信息能力:获取、评价、利用、交流信息的能力 • 信息道德:信息活动中应遵循的道德规范。 • 具体表现:明确需求、高效获取、正确评价、合理组织、创新利用。
授 课 方 式 • 共30个学时。 • 中文摘要式检索工具(SinoMed) • 外文摘要式检索工具(PubMed) • 全文检索工具 • 引文检索 • 特种文献检索 • 网络信息检索 • 个人文献管理与利用 • 科研立项的文献调研与分析 • 课堂讲授与实践相结合,比例为2:1。
参 考 资 料 • G252.7/201009 医学信息检索与利用/代涛主编.—北京:人民卫生出版社,2010.9 • G252.7/200506-2/2d医药信息检索与利用/周晓政主编.—2版.—南京:东南大学出版社,2012.10 • R-058/201006 中医药文献信息检索/刘军凤, 刘树春主编.—上海:上海科学技术出版社,2010.6 • G252.7/200902 生物医学信息检索与利用/杨克虎主编.—北京:人民卫生出版社,2009.2
考 核 方 式 • 考核:平时考核成绩40%,期末考试占成绩60%。 • 综合实习报告:结合本人或导师的科研选题进行,从检索方案的设计、信息资源的选择、信息的整合与组织,信息的加工与提炼的整个流程,撰写报告。 • 强调诚信。
基 础 知 识 • 信息:既非物质,也非能量(维纳);信息是事物的存在的形式和运动状态的表征 。 • 文献:夏礼吾能言之, 杞,不足徵也; 殷礼吾能言之, 宋,不足徵也。文献不足故也;以文字、图形、符号、声频、视频等技术手段记录人类知识的一切载体。 • 知识:具有普遍和概括性质的高层次的信息。是被验证过的,正确的,而且被人们相信的。
文献的分类 一次文献:图书、论文 二次文献:书目、文摘、索引 三次文献:综述、述评、年鉴 零次文献:笔记、手稿、信件 • 按加工程度 • 按载体形式:印刷型、声像型、缩微型、数字型 • 按出版形式:图书、期刊、专利、会议、科技报告、政府出版物、学位论文、标准、产品资料和其它文献 。
信息检索系统 • 信息的特点——海量 • 信息检索系统是指由一定的设备和信息集合构成,具有一定存储、检索与传送技术设备,提供一定的存贮与检索方法及检索服务功能的工作系统。 • 输入功能、存贮功能、处理功能、输出功能、传输功能、控制功能
信息检索系统的类型 手工信息检索系统 计算机信息检索系统
手工信息检索系统 • 书本式、期刊式、单卷式、附录式、卡片式 • 目录、题录、文摘、索引 • 《全国报刊索引》 • 《中文核心期刊要目总览》 • 《全国新书目》 • 《全国总书目》 • 《中国中医古籍总目》
计算机信息检索系统数据库的分类 • 按照数据库的记录形式划分 • 文摘型:如SinoMed,不能直接获得全文,时间跨度大,没有版权限制,保证收录文献的全面性和连续性。 • 全文型:如维普、中国期刊网,可直接获得全文,收录文献时间上限较晚,涉及更多的版权问题。 (SinoMed和维普的关联性) • 按照数据库的收录范围划分 • 综合型:如维普、中国期刊网等 • 专科型:如 SinoMed PubMed等,数据的选择与收录比较精良,标引比较精确,信息组织更加有序,能保证较高的检准率 • 按照收录的数据类型划分 • 期刊论文数据库、专利数据库、学位论文数据库、事实数据库、全文图书数据库
信息检索 • 广义:指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。 • 狭义:指信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程。 • 信息检索包括存储和检索两个方面。检索是存储的反过程。 • 想实现高效的信息检索,必须了解信息资源的建设者(标引人员)在存储阶段是如何组织信息起来。
检索语言 • 根据信息检索的需要创造出来的一种人工语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。 • 检索语言(检索阶段)=标引语言(存储阶段) • 检索语言沟通信息存储和检索两个阶段,是标引人员和检索人员双方思想的桥梁。 • 检索用语和标引用语一致的时候,检索结果才被输出。 • 两大系统:分类语言 主题语言
信息检索的基本原理 文献信息 标引人员 检 索 工 具 信息分析、处理和标引 标引语言 检索语言 检索结果 课 题 分析 用 户 制定检索策略
分 类 语 言 • 用分类号和相应的分类款目名称来表达信息内容的主题概念,并按学科体系的逻辑次序将信息资源系统地加以划分和组织的语言. • 分类语言是按照文献信息所载知识的学科属性,根据文献信息内容之间的相关性,组织成科学的分类体系,便于文献的管理。 • 集中反映学科的系统性、反映它们的相关、从属、派生等关系,从总体到局部分层、分面展开,形成分类体系。 • 以类号和类名作为检索语言,构成分类表,类号一般是字母与数据混排的号码标识系统。
中国图书馆分类法 • A马、列、毛、邓理论 • B哲学、宗教 • C社会科学总论 • D政治、法律 • E军事 • F经济 • G文化、科学、教育、体育 • H语言、文字 • I文学 • J艺术 • K历史、地理 N自然科学总论 O数理科学和化学 P天文学、地球科学 Q生物科学 R医药、卫生 S农业科学 T工业技术 U交通运输 V航空、航天 X环境科学、安全科学 Z综合性图书
R21 中医预防、卫生学 R22 中医基础理论 R24 中医临床学 R25 中医内科 R26 中医外科 R271中医妇产科 R272中医儿科 R273中医肿瘤科 R274中医骨伤科 R275中医皮肤科 R276中医五官科 R277中医其他学科 R278中医急症学 R28 中药学 R289 方剂学 R29 中国少数民族医学 R254外感病证 R255一般病证 R256脏腑病证 R259现代医学内科疾病 • R1 预防医学、卫生学 • R2 中国医学 • R3 基础医学 • R4 临床医学 • R5 内科学 • R6 外科学 • R71妇产科学 • R72儿科学 • R73肿瘤学 • R74神经病学与精神病学 • R75皮肤病学与性病学 • R76耳鼻咽喉科学 • R77眼科学 • R78口腔科学 • R79外国民族医学 • R8 特种医学 • R9 药学 R256.1肺系病证 R256.2心系病证 R256.3脾胃系病证 R256.4肝胆系病证 R256.5肾膀胱系病证
分类语言的优缺点 • 一种体现知识分类等级概念的标识系统,具有按学科或专业集中、系统揭示文献信息内容的功能,具有较高的查全率。 • 将概念逐级划分,具有等级结构,便于扩大和缩小检索范围。 • 既能用于组织检索工具和检索系统,又能用来组织图书资料的分类和排架 • 分类法用分类号作为检索标识,不能直接表达概念。 • 分类法不能经常修订,因而不能及时反映新的科学技术主题。 • 不可能详尽无余地列举一切事物概念,遇到检索主题狭窄的课题,难以找到相应的类目,查准率不高。
主题语言——受控词 • 需经人工标引,受词表控制,《医学主题词表》 (MeSH) • 叙词(主题词):是经过规范化处理的,以基本概念为基础的表达信息内容的词和词组。由在概念上不可再分的基本概念单元词汇组成,检索时可以利用这些单元词进行组配,以表达一个复杂的概念。 • 肾功能衰竭,慢性 • 消除歧义,保障查准率;整合同义词,保障查全率。
主题语言——自由词 • 关键词:为适应计算机自动编制索引的需要而产生的,出现在文献标题、摘要或全文中的词语。 • 不需人工标引,计算机自动抽取,不受词表控制,能及时检索到最新概念的各类文献。可任意选取专指性强的词语。 • 不能排除自然语言中的同义词和多义词现象,容易造成漏检和误检。 • 肾功能衰竭/肾衰竭 安定(药)/安定(平静)
字 段 • 字段是文献著录的基本单元,反映文献的外部特征和内容特征的每一个项目。 • 【篇名】瞬目反射检查在慢性肾功能衰竭患者中的应用 • 【英文篇名】Application of blink reflexion on chronic renal • 【作者】余能伟; 高国勋; 杨友松; 刘英 • 【文献出处】临床脑电学杂志 • 【中文关键词】瞬目反射; 慢性肾功能衰竭 • 【摘要】目的:观察慢性肾功能衰竭患者瞬目反射(BR)的特点并探讨其临床意义。方法:检测17例慢性肾功能衰竭患者及30名健康成人BR。结果:…… • 【分类号】R692.5
记 录 记录是由若干不同字段组成的文献单元。 一条记录
截 词 检 索 • 利用计算机检索系统提供的截词符,保留检索词中的相同部分,允许检索词可有一定的变化,以提高查全率。 • 有限截词:fib?? = fiber, fibre • 无限截词:comput*=comput, computer, computing, computation • 前截断:前截断只检索后缀相同的一类词 • 后截断:词的单复数、作者、年代、同根词等方面的检索时,采用后截断技术 • 中截断:检索词的单复数或英美式不同拚法: wom?n,可查到Woman,Women
科学研究中的文献调查法 • 文献调查法是指针对科研选题,选择不同文献信息源,综合运用多种检索手段,检索出大量与课题相关的文献信息,并对之进行鉴别与选择,抽取其中最有价值的信息的过程。
文献调查的目的 选题阶段 • 全面认识现有研究成果,证明选题的创新性 • 搜集充足的文献资料,证明选题的可行性 研究阶段 补充知识储备的不足 引用他人的数据和论点,证明或反证自己的论点
信息检索流程 输出 选择检索系统和数据库 分析课题,明确需求 编制检索表达式 确定检索词 检索结果分析 检索式的调整
分 析 课 题 • 需要什么类型的资料(图书、论文、专利文献等),对查全率、查准率、时间范围等都有什么要求。 • 分析课题在学科知识网络中所处的位置、主题内容,并找出能代表这些概念的若干个词或词组。 • 选取核心概念。 • 风湿性心脏病患者的手术治疗 • 析出隐含概念。 • 生乳合剂的制备工艺: • 从生乳和乳汁不足两方面来查
对检索能力要求低,直接获取原文, 符合传统阅读习惯,知识连贯系统 信息量极大 检索方便快捷 能保证较高查全率 选择检索系统 • 图书馆收藏的纸质文献:图书 期刊 报纸及其它文献 • 我校图书馆订购的电子资源: • 中国生物医学文献数据库(CBM) • 维普全文期刊数据库(VIP) • 中国知网(CNKI) • 电子图书: 超星电子图书 读秀电子图书包库 • 外文数据库:BIOSIS PREVIEWS OVID EBSCO PUBMED • 免费网络资源:PUBMED 国家知识产权局的专利查询服务 GOOGLE学术等
选择检索系统 • 检索系统与信息需求是否结合紧密, 收录文献种类、专业覆盖面、年代跨度是否对口。 • 是否需要获取原文。 • 需要查找最新文献信息时,可选择更新周期短的信息源 • 考察检索系统的学科收录范围、检索方式、可检字段、检索技巧等。 • 还要考虑检索费用
确定检索词 • 选用规范化词汇作为检索词。如果用关键词检索,必须考虑其同义词、近义词及相关词。 • 避免用一词多义的词汇,或限制在某学科范围或补充限义词与该词组合检索。 • 不能只从字面上选词。 • 排除比较泛指、检索意义不大的概念, 如“研究”、 “生产”、“发展”、“趋势”、“现状”、“过程”、“进展”等。
质量标准 检索效率评价指标 • 检全率 • 检全率=检出相关文献数/相关文献总数×100% • 检准率 • 检准率=检出相关文献数/检出文献总数×100% • 费用指标 • 为检索课题投入的费用 • 时间指标 • 检索准备时间、检索过程时间、鉴别和获取文献时间
检全率和检准率的关系 • 最理想的检索结果是检全率和检准率都达到100%。 • 检全率与检准率存在互逆关系 • 合理的检索策略可以同时保证较高的查全率与查准率 • 采用进阶检索,根据不同的检索结果调整检索策略。 • 检全率可以通过多次检索,不断修正实现。 • 检准率体现每次检索的效率。
影响检全率的因素 影响检准率的因素 检索效率的影响因素 • 数据库质量:收录文献不全,对同义词缺乏控制,标引遗漏,标引用词不准确 • 检索策略:选词和组配不当,检索用词的网罗度不够,没有考虑概念的多种表达方式,不恰当的范围限定 • 数据库质量:对同形异义词缺乏控制,标引过度,标引用词不能准确描述文献主题 • 检索策略:选词和组配不当,检索用词的专指度不够,没有考虑检索用词的歧义,缺乏必要的范围限定
怎么提高检全率 • 罗列尽可能多的同义词 • 肝癌/肝肿瘤 • 考虑全称和缩写,中文与外文、人名和字号、机构名称的更迭 • 降低检索词的专指度 • 针灸 + 水针 + 电针 + 针刺 + 针药 + 艾灸 + 穴位…… • 针 + 刺 + 灸 + 穴 • 进行族性检索,用检索词的上位类、上位概念进行检索,也可用检索词的下位概念进行补充检索。 • 电子病历:自动化——自动化病案系统 • 心脑血管疾病:心脑血管疾病+心脏病+高血压+脑卒中……
怎么提高检全率 • 将一个复杂概念分解为几个简单概念进行组配检索。 • 慢性肾功能衰竭:肾功能衰竭*慢性 • 适度运用截词检索,尤其是在英文和不具备自动截词功能的中文检索系统中 • 删除不必要的时间、学科、年龄组等限定 • 在CBM MEDLINE等数据库中,进行主题词检索的时候同时要适度补充自由词进行检索
怎么提高检全率 • 调节检索式的网罗度,增加+的运算,减少and和not的运算,不要出现特点、研究、功能、进展等不具检索意义的词 • 查找已知文献的引证文献、参考文献、共引文献、相似文献等。 • 字段选择,可将关键词字段改为全文字段。 • 多种检索工具的结合使用