1 / 67

文献数据库检索与利用 -- 数据库系列讲座

文献数据库检索与利用 -- 数据库系列讲座. 文献数据库概述. 学位论文数据库的检索利用. 第一章. 第四章. 第二章. 第五章. 图书数据库的检索利用. 专利文献数据库的检索利用. 第三章. 期刊数据库的检索利用. 课程纲要. 第 1 章 文献数据库概述. 本章内容 1. 文献数据库概念及构成 2. 文献数据库种类 3. 文献数据库功能(提供的检索方式) 4. 信息检索语言 5. 信息检索技术 . 第 1 章 文献数据库概述. 1. 文献数据库概念及构成

connie
Download Presentation

文献数据库检索与利用 -- 数据库系列讲座

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 文献数据库检索与利用 --数据库系列讲座

  2. 文献数据库概述 学位论文数据库的检索利用 第一章 第四章 第二章 第五章 图书数据库的检索利用 专利文献数据库的检索利用 第三章 期刊数据库的检索利用 课程纲要

  3. 第1章 文献数据库概述 本章内容 1. 文献数据库概念及构成 2. 文献数据库种类 3. 文献数据库功能(提供的检索方式) 4. 信息检索语言 5. 信息检索技术

  4. 第1章 文献数据库概述 1. 文献数据库概念及构成 文献数据库 就是在计算机存储设备上按一定方式储存的文献数据集合,是检索系统的信息源,也是用户检索的对象。 文献数据库的构成 文档→记录→字段

  5. 第1章 文献数据库概述 • 记录是构成数据库文档的基本单元。一个数据库往往由几十万条甚至几千万条记录组成。在期刊论文数据库中,每条记录就是指每篇期刊论文;在图书全文数据库中,每条记录就是指每一本完整的图书。 • 字段是构成记录的最小单元,一条记录包括若干个字段如:篇名字段、著者字段、关键词字段、文献出处、作者机构、摘要、出版时间、分类号等等。

  6. 第1章 文献数据库概述 2.文献数据库种类 按语种划分:中文数据库、外文(区别于中文的其它语种)数据库 按收录文献类型划分:图书数据库、期刊数据库、报纸数据库、学位论文数据库、会议论文数据库、专利数据库、标准数据库、多媒体数据库、工具书数据库等 按所收文献提供完整程度划分:文摘/索引数据库(参考数据库)、全文数据库、事实数据库

  7. 第1章 文献数据库概述 参考数据库指包含各种数据、信息或知识的原始来源和属性的数据库。数据库中的记录是通过对数据、信息或知识的再加工和过滤如编目、索引、文摘等形成的。一般来说,参考数据库主要是针对印刷型出版物而开发的。目的是指引用户能够快速、全面地鉴别和找到相关信息。 参考数据库主要包括:书目数据库、文摘/索引数据库

  8. 第1章 文献数据库概述 • 参考数据库最重要的用途是用于搜集文献线索,快速和全面地查询某个学科、领域或主题的文献信息。 • 其次,参考数据库还常常被用来进行统计和评估工作,如著名的三大索引数据库就常被一些高校或科研院所选用作为统计个人论文成果、机构科研水平等的评价工具。 • 常用的参考数据库:ISI Web of Knowledge (SCI/INSPEC/BIOSIS Previews/ISI Proceedings) CA PQDD博硕论文文摘数据库 CSSCI等

  9. 第1章 文献数据库概述 • 全文数据库收录有原始文献全文的数据库,如国内著名的全文数据库有超星数字图书馆、APABI电子图书、CNKI中国期刊全文数据库、重庆维普的中文科技期刊数据库;国外有ProQuest系统、EBSCOhost 系统、以及Elsevier Science、IEEE/IET系统、Springer Link等等。

  10. 第1章 文献数据库概述 全文数据库的特点: • 直接性: 即用户可以直接检索出原始文献; • 学术性、实用性较强: 以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主。 • 检索功能完善: 基于互联网的检索系统。一般都具备简单检索、复杂检索、二次检索、浏览、索引等多种检索功能;并提供多个检索入口。 • 提供检索结果的多种处理方式,可以浏览并标记记录,以打印、存盘、E-MAIL发送等方式输出。

  11. 第1章 文献数据库概述 事实数据库 指包含大量数据、事实,直接提供原始资料的数据库,又分为数值数据库、事实型数据库。 • 数值型型数据库,以数值为主要内容的数据库。如China InfoBank,贝尔斯坦/盖墨林化学数据库等; • 事实型数据库,直接提供可用的事实为目的,事实既可以是既有数字又有文字的统计资料,也可以是纯文字的知识资料或信息资料,也可以是一篇叙述性文献。如公司名录、百科知识数据库、网络词典、人物传记数据库等。

  12. 第1章 文献数据库概述 • 事实和数值数据库的作用就是提供对特定的事实或数据的检索与利用,直接面向问题以特定的事实或数字回答用户的查询。 • 事实和数值型数据库的主要特点: ① 检索速度快。 ② 范围广。 ③ 针对性强,检索结果往往只是单元的值、一组数据或某一个事实。

  13. 第1章 文献数据库概述 3.数据库(检索系统)的功能 指数据库(检索系统)在检索界面上提供给用户的基本功能。它与系统的检索技术是紧密结合的。比较通用的检索功能有浏览、索引、简单检索、复杂检索、二次检索(或进阶检索)、命令检索等。

  14. 第1章 文献数据库概述 (1)浏览 (Browse) 由系统提供一个树状结构的概念等级体系,分层次按其属性及相互从属关系对知识进行并行或树状排列,逐级展开到最小知识单元。

  15. 第1章 文献数据库概述

  16. 第1章 文献数据库概述 (2)索引 (Index) 索引是一个线性表单,可以将任何一个标引字段中的概念按字母顺序不分级地线性排列起来。索引的种类很多,如人名索引、出版物索引、地名索引、主题索引、机构索引、分子式索引等。

  17. 第1章 文献数据库概述

  18. 第1章 文献数据库概述 (3)简单检索 (Simple Search、Basic Search、Quick Search)即为用户提供一个简单的检索界面,帮助非专业或初入门用户方便地提交检索式。

  19. 第1章 文献数据库概述 (4)复杂检索 (Advanced Search、 Guided Search 、Expert Search)为专业用户、资深用户提供比较复杂的检索界面,可以构造比较细致的检索式,帮助用户进行精确检索。

  20. 第1章 文献数据库概述 (5)二次检索(进阶检索)在检索结果内进一步检索,使结果更精炼、准确。

  21. 第1章 文献数据库概述 4. 信息检索语言 • 检索语言:是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。是为了沟通文献标引与文献检索而编制的人工语言。 • 检索语言的作用:检索语言的主要作用就是对文献的外部特征和内容进行多层次描述,提供多种检索途径,以方便用户从不同角度检索查找文献,获得较高的查全率和查准率。

  22. 第1章 文献数据库概述 检索语言的类型 题名 文摘 责任者 关键词 引文 全文 检索语言的类型 自然语言 分类法 人工语言 主题法

  23. 第1章 文献数据库概述 分类检索语言 按学科范畴及知识之间的关系列出类目,并用数字、字母符号对类目进行标识的一种语言体系,也称分类法。分类语言类目之间具有上下隶属,同位并列的概念等级体系。例: 中国图书馆分类法 美国国会图书馆分类法 杜威十进位分类法 IPC国际专利分类表

  24. 第1章 文献数据库概述 《中图法》分类语言举例 《中图法》按学科体系 ,划分为二十二个大类,每个大类都用一个英文字母表示。如下所示: A 马克思主义、列宁主义、毛泽东思想、邓小平理论 B 哲学 宗教 C 社会科学总论 D 政治 法律 E 军事 F 经济 G 文化 科学 教育 体育 H 语言 文字 I 文学 J 艺术

  25. 第1章 文献数据库概述 《中图法》分类语言举例 K 历史 地理 N 自然科学总论 O 数理科学 化学 P 天文学 地球科学 Q 生物科学 R 医药 卫生 S 农业科学 T 工业技术 U 交通 运输 V 航空 航天 X 环境科学 劳动保护 Z 综合性图书

  26. 第1章 文献数据库概述 《中图法》分类语言举例 Q生物科学 Q1 普通生物学 Q2 细胞生物学 Q21 细胞的形成与演化 Q23 细胞遗传学 Q24 细胞形态学 Q25 细胞生理学 Q26 细胞生物化学 Q27 细胞生物物理学 Q3 遗传学 Q4 生理学 Q5 生物化学 ┇

  27. 第1章 文献数据库概述 主题检索语言 由主题词汇构成,即将自然语言中的名词术语经过规范化后直接作为标识,按字母顺序排列,通过参照系统揭示主题概念之间的关系,也称主题法。主题检索语言常用的是叙词语言(descriptor)。主题检索语言一般都有主题词表或叙词表。 以下为EBSCO(ASP)中的主题词表

  28. 第1章 文献数据库概述

  29. 第1章 文献数据库概述 自然语言 自然语言是直接从文献信息本身抽取的,用于揭示信息内容的自由词。主要依赖于计算机自动抽词技术。包括关键词语言、题名、责任者、摘要、引文、全文等等。 其中,关键词直接从信息资源名称、正文或文摘中抽出的代表信息主要内容的重要语词。

  30. 第1章 文献数据库概述 5.信息检索技术 • 布尔逻辑检索 • 截词检索 • 字段限制检索 • 位置算符检索 • 短语检索 • 嵌套检索

  31. 第1章 文献数据库概述 3.1 布尔逻辑检索(boolean operator) 布尔逻辑检索是采用布尔代数中的逻辑“与”逻辑“或”、逻辑“非”等算符,对检索词进行组配,表达概念间的逻辑关系. 限定检索词在记录中必须存在的条件或不能出现的条件。凡符合布尔逻辑所规定的条件的文献,即为命中文献。

  32. 第1章 文献数据库概述 布尔逻辑运算符 ——————— 1、逻辑“或” OR 2、逻辑“与” AND 3、逻辑“非” NOT

  33. 第1章 文献数据库概述 1、逻辑“或” ——————————————— 用符号“or”或“+”表示,其逻辑表达式为: A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词B, 或同时含有检索词A和B的,均为命中文献。如: subprime crisis or finance crisis

  34. 第1章 文献数据库概述 2、逻辑“与” ———————————————— 用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B 其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。

  35. 第1章 文献数据库概述 3、逻辑“非” ——————————————— 用符号“not”或“-”,其逻辑表达式为: A not B 或 A-B 其意义为:检索记录中含有检索词A,但不能 含有检索词B的文献,才算命中文献。

  36. 第1章 文献数据库概述 检索实例: 1.检索有关克隆人立法方面的文章 “human cloning” AND legislat* 2.检索文昌鱼遗传多样性方面的文献 (文昌鱼 OR 头索动物) AND (遗传多样性 OR 基因 OR DNA) 如百度:(文昌鱼|头索动物) (遗传多样性 | 基因 | DNA) 3.检索生物基因工程技术方面的报道而排除生物基因工程公司方面的信息 “生物基因工程技术”NOT 公司 或“生物基因工程技术”_公司 一般为 NOT 最先执行, AND 其次进行, OR 最后执行。 但是可以用括号改变他们之间的运算顺序。例如, (A OR C) AND B

  37. 第1章 文献数据库概述 截词检索 (truncation search) 截词检索是指在检索标识中保留相同的部分,用截词符代替可变化的部分。截词检索有时也称为通配符(wildcard)检索。 一般情况下,*代替任意一个或多个字符。 ?代表一个字符。 截词检索类型截词方式根据截词的位置不同,分为前截断、后截断、中截断;根据截断的数量不同,分为有限截断和无限截断。 注:截词检索在不同的计算机检索系统中规定不同。

  38. 第1章 文献数据库概述 截词检索类型 1 根据截断的数量不同,分为有限截断和无限截断。 无限截断:不限制被截断的字符数量,例如输入educat*,可以检索出:educator educators educated,educating,education,educational,等等。 有限截断:限制被截断的字符数量,例如输入educat??,表示被截断的字符只有两个,可以检索educator,educated两个词。

  39. 第1章 文献数据库概述 截词检索的类型 2 根据截词的位置不同,分为前截断、后截断、中间截断。 前截断 是将截词符号置放在一个字符串左方,是后方一致检索。 如:在 www.onelook.com 网站中, *ology 可检索出:geology sociology psychology archaeology biology ┅┅等等词汇。 又如:查找 *library 可查找到不同应用领域图书馆方面的短语

  40. 第1章 文献数据库概述 截词检索的类型 2 后截断 是最常用的截词检索技术,它是将截词符放在一串字符的右面。 如:Comput* 可检出词汇 compute computer computing computability computable computation computational ┇ 如: system??可检出词汇system systems systemic

  41. 第1章 文献数据库概述 截词检索的类型 2 中间截断又称为中间屏蔽,是一种用截词符屏蔽词中不同字符的方法。 例如:wom?n woman women defen?e defence defense

More Related