980 likes | 1.14k Views
第一讲 文献信息检索基础知识. 第一节 信息与信息素养 第二节 科技文献的类型 第三节 信息检索与文献检索工具 第四节 信息检索原理 第五节 信息检索的方法和途径 第六节 信息检索常用技术及检索效果评价. 第一节 信息与信息素养. 一、信息的基本含义. 1 、图书馆学和情报学领域,信息被定义为事物或记录。 2 、综合学术界对信息的定义,可以认为信息是以物质介质为载体,传递和反映世界各种事物存在方式、运动规律及特点的表征。. 风、雨、雷、电、春、夏、秋、. 自然信息. 社会信息.
E N D
第一节 信息与信息素养 第二节 科技文献的类型 第三节 信息检索与文献检索工具 第四节 信息检索原理 第五节 信息检索的方法和途径 第六节 信息检索常用技术及检索效果评价
一、信息的基本含义 1、图书馆学和情报学领域,信息被定义为事物或记录。 2、综合学术界对信息的定义,可以认为信息是以物质介质为载体,传递和反映世界各种事物存在方式、运动规律及特点的表征。
风、雨、雷、电、春、夏、秋、 自然信息 社会信息 科学信息 语言、战争、贫困、喜、怒、哀、乐 科学家破译染色体的基因信息
(一)信息与社会 从生产力的角度可以将人类社会划分为四个发展阶段: 原始社会、农业社会、工业社会和信息社会。 信息社会的主要标志是信息与知识成为社会最重要的基础性资源。
在人类漫长的发展历程中,物质、能量、信息三种资源支配着人类最基本的生产活动。在人类漫长的发展历程中,物质、能量、信息三种资源支配着人类最基本的生产活动。 物质---向人类提供材料及生活必需品 信息---向人类提供知识和智慧 能量---向人类提供动力 信息社会的主要标志是信息与知识成为社会最重要的基础性资源。
(二)信息的基本特征 1.客观性 2.时效性 3.载体性 4.传递性 5.可塑性 6.共享性 7.可开发性 8.可增值性
一个完整的信息传递过程必须具备信源(信息的发出体)、信宿(信息的接受体)、信道(信息的传递媒介)和信息四个基本要素。一个完整的信息传递过程必须具备信源(信息的发出体)、信宿(信息的接受体)、信道(信息的传递媒介)和信息四个基本要素。
(三)与信息有关的基本概念 1.知识 知识是人们对客观事物的认识和经验总和。 知识与信息的关系:知识是信息的一部分,不直接等同于信息;知识是人类大脑活动的产物,是系统化、精炼化的信息。 2.情报 情报是传递中的有用的知识或信息,是为解决特定问题所需要的知识。
3.文献 文献是记录知识的一切载体。 三个基本要素: 1)文献含有知识信息 ; 2)负载知识信息的物质载体 ; 3)记录知识信息的符号和技术 ;
二、什么是信息素养 信息素养有广义狭义之分。广义指信息社会对个人品质、道德观念、知识体系和能力要求的总合,或信息时代国民应有的素质,包括品质和能力两个方面。狭义指获取信息和使用信息的能力与品质。
信息素养教育的提出是文化积淀的产物 • 人是环境的产物。信息素养教育的提出,既是社会演进的要求也是文化积淀的结果。英语中literacy 翻译成汉语是有文化的意思,它的否定表达方式是“非文盲”,反义词是文盲(illiteracy)。在传统社会里,文盲占人口的大多数,有文化的只限于少数人。中世纪的欧洲,文化掌握在天主教神职人员之手,目不识丁的国王,屡见于史。中世纪晚期,印刷术的发明为文化的普及开辟了道路。工业社会需要有文化的劳动力,提出了扫除文盲,普及教育的要求。Literacy 的标准是会读、会写、会算。图书馆事业兴起后,开展用户教育提出了图书馆素养(或文化)问题,称之为library literacy。计算机普及后,为了加强计算机技能教育,便有了计算机文化computer literacy或计算机素养之说,也有称之为数字化素养(digital literacy)网络素养(network literacy)和媒体素养(meidia literacy)的。在信息技术和信息产业发达的国家里最早提出了信息素养(information literacy) 的概念。美国信息产业协会主席保罗 . 泽考斯基(Paul Zurkowaski)1974年在美国全国图书馆与情报学委员会上,最早提出了信息素养的概念,他把信息素养概括为:“利用大量的信息工具及主要信息源使问题得到解答的技术和技能。”
一、文献的主要类型 (一) 按载体类型分: 印刷型、缩微型、电子型、声像型 (二) 按出版类型分: 图书、连续出版物、特种文献 (三)按加工深度分:一次、二次、三次
(一) 根据文献的载体形式划分 印刷型 缩微型 电子型 声像型 图 书 连续出版物 资 料 缩微胶片 缩微胶卷 缩微平片 磁带、磁盘 光 盘 联机网络版 录音带、录像带 唱片、幻灯片 电影胶卷
印刷型文献 利用纸张为存储介质,以手写、印刷为记录手段而产生的文献。包括油印、铅印、胶印、复印等印刷品及手稿。 载体:纸张 实例:教科书 记录手段:油印、石印、 铅印、胶印、复印 特点:可直接阅读,方便 使用;但难于实现机 械化和自动化;收藏 文献占用空间大。
缩微型文献 是以感光材料为存储介质,利用缩微照相技术使文献缩微化的文献。 • 载体:感光材料 • 实例:缩微平片、缩微胶片 • 记录手段:光学缩微技术 • 特点:体积小;价格低;不能直接阅读
声像型文献 以磁性或感光材料为存储介质,利用特定的设备及技术,直接记录声音、图像信息的文献。 载体:磁性材料、感光材料 实例:录像带、幻灯片 记录手段:磁记录、光学技术 特点:直观、生动、形象;成 本高;不易检索和更新。
电子型文献 以电子数据的方式将图、文、声、像等信息存储在磁光介质上,通过网络通信、计算机或类似设备再现的信息资源 。 载体:磁性材料 实例:磁盘、光盘 记录手段:计算机输入 特点:存储密度高、速度快; 易复制;成本高;不能 直接阅读。
(二) 根据文献的编辑出版形式划分 按出版形式及内容的不同 图 书 期刊 报纸 连续出版物 科技报告 会议文献 政府出版物 专利文献 标准文献 产品资料 学位论文 特种文献
图书的含义 凡篇幅达48页以上并构一个书目单元的文献称为图书。 国际标准书号(ISBN)
国际标准书号(ISBN) (International Standard Book Number) 每一种正式出版的图书的唯一标识代码,是专门为识别图书等文献而设计的国际编号。 例如:《信息检索原理与方法教程》,赵岩碧主编,化学工业出版社,2005年3月出版。其ISBN号为:7-5025-6431-4 ISBN 7-5025-6431-4 (旧号) ISBN 978-7-5025-6431-5 (2007年后出版图书采用的新号) 第一段:978是由国际物品编码(EAN·UCC)系统专门提供给国际ISBN管理系统的产品标识编码。 第二段:7 语区号,代表国家、地区、语种 如0和1-英,2-法,3-德,4-日,5-俄,7-中,88-意大利,9971-新加坡 第三段:5025 出版社代号,由国家或地区ISBN中心分配; 第四段:6431 出版图书号,由出版社按出版顺序所给; 第五段:校验位
期 刊 期刊又称杂志,它是指采用统一名称定期或不定期出版的连续性出版物。 国际标准刊号( ISSN )
国际标准连续出版物号(ISSN) • 正式出版的期刊有ISSN代码,即国际标准连续性出版物编号,是国际连续出版物数据系统国际中心为在该系统登记的连续出版物分配的号码。 • 采用ISSN编码系统的出版物有期刊、会议录等。 如:《中国图书馆学报》 国际标准刊号:ISSN1001—8867 全长8位,前7位为刊名代号,末位为校验位
期刊的特点 A、期刊以品种为单位形成知识流; B、报道文献速度快,内容新颖,能及时反映世界科 技水平,但不如图书成熟; C、品种多,数量大,覆盖了人类所以知识领域及各 学科专业,具有很强的容纳性。 D、科技期刊 是最重要的一次文献。
核 心 期 刊 *少数刊载某一学科大量高质量专业论文的期刊。 * 特点 (1)刊载专业文献密度高,信息含量高; (2)水平较高,代表本学科的最新发展水平; (3)出版相对稳定,所载文献寿命较长; (4)利用率和被引率较高。 目前,许多单位核心期刊的判定是以 《中文核心期刊要目总览》为标准
报 纸 是以报道新闻及评论为主,出版周期比期刊更短,多为活页性连续出版物。其特点是内容丰富、信息量大、出版迅速、发行量大、读者众多。
科 技 报 告 科技报告是科技工作者对科学、技术研究结果或研究进展的记录。 科技报告的特点 (1)反映新的科研成果迅速; (2)内容多样化; (3)质量参差不齐; (4)保密性强; (5)每份报告独立成册,有连续编号。
会 议 文 献 会议文献是指在各 种会议上宣读、交流的 论文、报告及其它有关 文献。
政 府 出 版 物 政府出版物是指由政府机构制作出版或由政府指定出版商出版的文献。 政府出版物的类型 (1)行政性文件 (2)科技文献
专 利 文 献 专利文献是指实行专利制度的国家申请、审批专利过程中所产生的专利申请书、说明书及官方文件或出版物。其中最重要的是专利说明书。
标 准 文 献 与标准化活动有关的一切文献都称为标准文献。其主体是标准,还包括标准形成过程的各种档案、宣传推广标准的手册及其它出版物。 标准是按规定程序制订,经权威机构公认或主管部门批准的在特定范围内执行的规格、规则、技术要求等规范性文件。
产 品 资 料 指厂商为推销产品而印制的各种宣传资料、技术资料。如公司介绍、产品目录、样本、说明书等,它反映厂家、公司及产品的有关信息,对产品采购,仪器设备的维护、使用及新产品开发具有重要价值。
(三)不同加工层次的文献信息 一次文献 三次文献 二次文献 按文献 的加工 深度分
一 次 文 献 *作者以自己的研究成果为基础创作或撰写, 并通过某种渠道而公开的文献; * 对知识的第一次加工;具有创造性; * 大多数期刊论文、科技报告、学位论文、会 议文献、专利文献、技术档案等。
二 次 文 献 *对一次文献进行浓缩、整序及加工处理而成 的具有报道和检索作用的文献; * 对知识的第二次加工;有序化;提供一次文 献线索; * 目录、题录、文摘等检索工具。
三 次 文 献 * 指从一次文献中提取数据、事实和有关结论, 并经过综合分析与重新组合而编写的文献。 * 对知识的再加工;提供文献检索; * 综述、专著;字词典、百科全书
一次、二次、三次文献三者之间的关系 从检索的角度来看 一次文献是检索的对象(目标) 二次文献是检索的工具(手段) 三次文献是情报研究的成果(检索目标+检索手段)
一次、二次、三次文献三者之间的关系 从知识加工角度来看 从一次文献到二次文献、三次文献是一个由博到约、由分散到集中、由无组织到系统化的过程,也是科技文献资源的层次结构由无序走想有序、由一种有序结构演变为另一种完善的有序结构的过程。
一、信息检索的定义及类型 (一)信息检索的定义 广义的信息检索: 是指将信息按一定的方式组织和存储起来, 并根据信息用户的需要找出有关信息的过程和技术。全称为“信息存储与检索” 。 狭义的信息检索: 指该过程的后半部分,即从信息集合中找出所需要的信息的过程, 相当于人们通常所说的信息查寻。 人们多用“文献检索”的概念,强调了检索对象。
(二)信息检索的类型 1、按检索内容划分: 文献检索、数据检索、事实检索 2、按信息检索手段划为: 手工检索、计算机检索 3、按信息组织方式划分: 全文检索、超文本检索、超媒体检索
信息检索的原理 • 将文献检索标识与文献存贮标识进行类比,二者若取得一致(即二者匹配),就可将文献库中符合检索提问要求的文献取出来。 • 将文献检索标识与文献存贮标识进行类比,二者若取得一致(即二者匹配),就可将文献库中符合检索提问要求的文献取出来。 简而 言之 检索标识 存贮标识 匹配 检索命中
原始文献 加工整理 提 问 数据库 检 索 存 储 输 出 检 索
检索过程分析 表达需求 检索系统 检索者 反馈结果 信息源(大量信息) 充分标注(检索语言) 可检索(检索技术、规则等) 可显示(屏幕显示或打印) 信息之间的连接等 信息检索的本质,实际上就是信息集合与需求集合的匹配与选择。
检索语言主要有: 1、分类语言: 以学科体系为基础,将各种概念按学科性质进行分类和系统排列,并用分类号予以编排组织成一个完整的体系。 2、 主题语言: 用词语来表达各种概念,即用规范化或未规范化语言中的名词、名词性词组或短语作为主题词,来表达各种概念,将各种概念不管其相互关系,完全按字顺排列。 3 、号码语言: 按文献代码,如专利号、 标准号、报告号等的顺序排检。