330 likes | 462 Views
文 献 信 息 检 索 基 础. 2007-05-17. 如何开始:文献信息检索必备. 须对文献信息检索的一些概念有一个基本的了解; 须了解所处的文献信息环境,有哪些文献信息源可供检索利用; 须掌握一些基本的检索技术和方法;. 第一部分:基本知识. 1.1 什么是文献?. 文献是记录知识的一切载体。 具体地说,文献是将知识、信息用文字、符号、图像、音频等记录在一定的物质载体上的结合体。由此定义我们可以看出,文献具有三个基本属性,即文献的 知识性 、 记录性 和 物质性 。它具有存贮知识、传递和交流信息的功能。. 1.2 具体什么是文献?. 文献按照出版类型:
E N D
文 献 信 息 检 索 基 础 2007-05-17
如何开始:文献信息检索必备 • 须对文献信息检索的一些概念有一个基本的了解; • 须了解所处的文献信息环境,有哪些文献信息源可供检索利用; • 须掌握一些基本的检索技术和方法;
1.1 什么是文献? • 文献是记录知识的一切载体。具体地说,文献是将知识、信息用文字、符号、图像、音频等记录在一定的物质载体上的结合体。由此定义我们可以看出,文献具有三个基本属性,即文献的知识性、记录性和物质性。它具有存贮知识、传递和交流信息的功能。
1.2 具体什么是文献? • 文献按照出版类型: 常见文献 1.图书 2.期刊 3.报纸 更多…… 特种文献 4.专利文献 5.会议文献 6.科技报告 7.学位论文 8.标准文献 9.技术档案 10.产品资料
1.3 什么是文献深度 • 零次文献:实验记录、手稿、原始录音、档案 • 一次文献:全文!!期刊论文、图书等 • 二次文献:非全文!!检索工具,目录、题录、文摘,比如图书馆书目检索系统、搜索引擎、中文社会科学引文索引 • 三次文献:工具性!综述、进展报告、百科全书、手册、年鉴、辞典等
1.4 什么是文献信息检索? • 就是查找文献信息,即以科学的方法利用专门的工具,从大量的文献资料中迅速、准确、完整地查找到文献资料的过程。 • 核心:是用户信息需求与文献信息集合的比较和选择, 是两者匹配(match)的过程。[通过检索语言匹配]
1.6 什么是检索途径? • 检索点或说检索字段 • 信息组织方法==检索途径 外部特征 1 题名途径 2 著者途径 3 序号途径 4 引文途径 内部特征 5 关键词途径 6 分类途径 7 主题途径 8 其他
1.7 什么是关键词 • 所谓关键词是指那些出现在文献的标题(篇名、章节名)以至摘要、正文中,对表达文献主题内容具有实质意义的语词,亦即对揭示和描述文献主题内容来说是重要的、带关键性的(可作为检索“入口”的)那些词语。 概括地说,能描述其主题概念的那些具有关键性的词抽出。
1.8 什么是检索词? • 就是您输入检索框中的文字或字符,也就是您想让系统为您寻找的东西。 • 通常需要能表达一个主题概念。我们一般用关键词作为检索词进行检索。 比如: 1.检索课题:网络资源的知识产权保护 关 键 词:网络资源、网络信息资源、知识产权、版权、著作权限、合理使用 参阅:检索课题分析举要
1.9 为什么校外不能访问数据库? • 数据库采用IP地址控制对这些资源的利用。也就是说,一个学校或单位订购了网络数据库时都会登记一些IP地址。从这些登记过的IP地址登录该网络数据库的用户有权使用。 • 有些数据库是整体销售,那么从这些登记过的IP地址登录该网络数据库的用户有权使用整个数据库。但大部分数据库采用零售方式,这时,从这些登记过的IP地址登录该网络数据库的用户有权使用你订购的那部分数据。
1.10 什么是检索策略? • 就是在分析检索提问的基础上,根据所处的信息环境,确定检索的数据库、检索用词,并明确检索词之间的逻辑关系和查找步骤的科学安排。 检索目的是什么?【简单浏览、深入研究】 检索的用途是什么?【研究型、技术型、商贸型、大众型】 需要什么类型的信息?【全文型、目录型、指南型、数值型】 有一些知道的信息源吗?【作者信息、期刊名、论文、会议】
有什么样的语言限制?【中文、英文、其它语言】有什么样的语言限制?【中文、英文、其它语言】 对文献信息有什么样的时间要求?【近2年、近5年、全部】 对检索结果有什么要求?【信息条数、打印/复制/扫描/数字格式等、按照年代排序】 概念分析(学科分类、同义词、近义词、上位类词、下位类词、英文词语) 编制检索式 根据信息环境选择数据源
第二部分:了解信息环境 • 数字资源整合服务系统
如何了解一个数据库? • 服务形式(WEB、光盘、联机检索、单机)校内、国内、国外。镜像 • 涵盖学科或主题范围 • 文献类型(出版形式、内容层次) • 收录年限,收录对象 • 数据量(记录数) • 文种、更新频率 • 访问模式(口令,IP控制) • 其它信息:帮助信息、出版者、发行者、在同行中的地位。
如何了解一个数据库样例:书生数字图书 • 服务形式:WEB/镜像 • 涵盖学科或主题范围:所有学科 • 文献类型(出版形式、内容层次等):电子图书,全文(一次文献) • 收录年限,收录对象:2001~2003,纸本图书的数字化 • 数据量(记录数):11.4万 • 文种:中文
如何了解一个数据库样例(续): • 更新频率:目前没有更新 • 访问模式(口令,IP控制)口令+IP控制 知识点:数据库的访问模式 • 数据库的其它信息:出版者、发行者、在同行中的地位。重要的中文数字图书数据库之一
第三部分:计算机检索技术 • 布尔逻辑 • 截词检索 • 限定检索 • 词位置限制检索 • 下面以DIALOG系统为例来学习计算机的基本检索技术。
布尔检索 • 布尔逻辑组配是现行计算机检索的基本技术,主要通过“与(and,*)”、“或(or,+)”、 “非(not,-)”将检索词联络起来,对A、B两词而言其AND、OR、NOT的逻辑含义用图表示是:AND[*][&][空格]A and B 逻辑与。A和B都为真时,结果才为真,即:A*B
OR [+][|] A or B 逻辑或。A或B中只要有一个为真时,结果就为真,即:A+B NOT[-][^][!]A not B 逻辑非。A为真、B为假时,结果才为真,即:A-B
布尔逻辑运算符的运算次序 • 括号优先[与计算机编程中一样](A OR B) AND C NOT D • 不同的系统次序有差别,但总的来说一般次序为: • NOT AND OR
例A:查找有关信息检索的非英文文献 信息[information] 检索[retrieval] 英文[english] (信息 and检索 ) not英文 (information and retriever) not english
上海零售业的现状与发展趋势 上海 零售业 现状 发展趋势 上海 and零售业 and (现状or发展趋势)
截词检索 • 截词包括后截、中截、前截等。用?作为截词符(有些系统用*),主要包括下列情形: • ? 中截一字符,后截断n个字符 • 如 wom?n • 可以检索出: woman, women • 如coumput? • 可以检索出Compute, Computer, Computing, computable
补充:通配符 [%] [?][*] 前方一致:“%国庆” 将检索出所有字段为张国庆、欧阳国庆、国庆等的记录。 后方一致: 如:“热电材料% ”将检索出热电材料梯度化、热电材料及其梯度化等的记录。
第四部分:数据库检索 • 如果你要求不高,检索,就这么简单! 只要在检索框中输入关键词,并按一下“检索”按钮,系统就会在数据库中自动找出符合检索条件的信息。
4.1 一般检索步骤是怎么样的? 明确需求,分析主题 选择检索工具|数据库 激发新的需求 确定检索词 构造检索表达式|检索 修改检索式 显示检索结果 不满意 完成
4.2 如何检索一个特定的数据库 • 了解数据库,熟悉界面。 • 利用数据库提供的检索指南(帮助、FAQ)。 • 了解检索与浏览模式(一般检索、高级检索、分类检索、特色检索等;按主题浏览、按出版物字顺浏览等)。 • 检索结果的获得 • 全文阅读工具(PDF、专用阅读器)
4.3 如何编制检索式 例A:查找有关信息检索的非英文文献 信息[information] 检索[retrieval][retriever]搜索[searching] 英文[english] (信息 and检索 ) not英文 (information and retriev*) not english 通过组合检索框实现
4.5 实例演示:IPv6技术应用现状 • 中国期刊全文数据库之组合检索界面