440 likes | 587 Views
中文期刊全文数据库检索. nbwangjt@gmail.com. 本讲主要内容. 数据库检索通用技术与方法 信息检索七准则 中国期刊全文数据库( CNKI )检索 中文科技期刊数据库(维普)检索 万方数据库期刊检索 检索平台中的中文期刊论文检索 中文引文数据库. 1. 数据库检索通用技术与方法. 恒变 信息环境 ----- 日新月异 数据库的检索界面、检索功能、版本形式经常会有变化 不变 基本技术与基本原理 方法或技巧. 1.1 信息检索技术与发展. 当前 信息检索是基于文本的 可检索字段信息以文本的形式存储在数据库(数据集合)中
E N D
中文期刊全文数据库检索 nbwangjt@gmail.com
本讲主要内容 • 数据库检索通用技术与方法 • 信息检索七准则 • 中国期刊全文数据库(CNKI)检索 • 中文科技期刊数据库(维普)检索 • 万方数据库期刊检索 • 检索平台中的中文期刊论文检索 • 中文引文数据库
1. 数据库检索通用技术与方法 • 恒变 • 信息环境-----日新月异 • 数据库的检索界面、检索功能、版本形式经常会有变化 • 不变 • 基本技术与基本原理 • 方法或技巧
1.1 信息检索技术与发展 • 当前信息检索是基于文本的 • 可检索字段信息以文本的形式存储在数据库(数据集合)中 • 即使是多媒体数据库,也是抽象特征进行文本化或说字符化 • 基于文本的匹配技术是信息检索的核心 • 随着信息技术的发展,以后还会有基于颜色、声音、气味、质量等等的检索。
1.2 认识数据库与数据库检索 • 数据库是存储在一起的相关数据(信息)的集合 • 数据库是信息检索的主要对象,比如针对网络信息资源的搜索引擎(谷歌、百度、雅虎)就是一个数据库,文献信息检索领域的数据库非常多。
数据库检索 • 匹配技术:有哪些匹配规则? • 数据库检索是一个多步骤的过程 • 扩检、缩减、检索词的选择与逻辑组配 • 数据库的检索也是一个知识的探索与发现的过程,别人没法替代 • 检索、浏览、判断、调整策略、再检索 • 花点时间,了解数据库特点的必要性 • 涵盖学科或主题范围 • 文献类型(出版形式、内容层次) • 收录年限,收录对象 • 数据量(记录数) • 文种 • 全文获取
1.3 数据库检索常见问题 • 对信息检索有畏惧心理 • 不理解信息检索过程或原理,无法做到触类旁通。 • 不知道选择什么样的数据库检索,到哪里检索 • 不知道如何选择恰当的检索词 • 在文摘索引数据库中想下载全文 • 仅仅用一个词检索(不会利用逻辑组配) • 在外文数据库中输入中文词检索
数据库检索常见问题(续) • 信息环境意识不强,在网络中搜索一个数据库就进行检索 • 用整个论文(或课程)题名在题名项中检索 • 检索结果太多(不会用限定和组配) • 检索结果太少(课题分析不够;检索词选取) • 检索结果的处理(排序、下载、阅读器、复制) 说说看,各位还有哪些问题?
1.4 数据库检索通用技术与方法 1.4.1布尔逻辑检索技术 1.4.2 截词检索技术 1.4.3 模糊检索方法 1.4.4 精确检索方法 1.4.5 限定检索方法
1.4.1 布尔逻辑检索技术 • 并且【逻辑与】 • 表示当两个词都出现在检索项中的时,这样的文献才被检索出来。 • 是缩检的方法 • 或者【逻辑或】 • 表示只要其中一个词出现在检索项中,这样的文献就能检索出来。 • 是扩检的方法 • 去除【逻辑非】 • 表示从已经检索的结果中去除含有该检索词的文献。 • 即检索出的文献包前面的检索词,但不包含去除的词。 • 是缩检的方法
例:网络信息资源评价研究综述 • 网络信息、信息资源、网络信息资源、选择、利用、评价 • (网络信息 OR 信息资源)AND 评价 NOT 检索工具 • (网络信息 OR 信息资源)AND (选择 OR 利用 OR 评价 ) • 如何对应于数据库的检索? • 技巧:每一次检索解决一个问题,即搜索到一个方面的信息资源。比如: • 网络信息资源 AND 选择 • 网络信息资源 AND 利用 • 网络信息资源 AND 评价
1.4.2 截词检索技术 • 截词包括后截、中截、前截等。用?作为截词符(有些系统用*),主要包括下列情形: • 截词符? 中截一字符,后截断n个字符 • 如 wom?n 可以检索出: woman, women • 如coumput? 可以检索出Compute, Computer, Computing, computable
??后、中截二字符 如:transplant?? 可以检索出:transplant、transplanted、transplanter • ???后、中截三字符 如:comput??? 可以检索出:compute;computer;computing
通配符,无限截断 [%] [?][*] • 后方一致(前截断):“%国庆” 将检索出所有字段为张国庆、欧阳国庆、国庆等的记录。 • 前方一致(后截断) : 如:“信息检索% ”将检索出信息检索原来、信息检索技术等的记录。
1.4.3 模糊检索方法 • 模糊检索 • 系统根据检索词自动拆分成更小的单元词 • 如“网络信息资源”模糊检索,相当于用: • 网络信息资源 OR 网络信息 OR 信息资源 OR 网络 OR 信息 OR 资源 • 模糊检索是一些数据库(检索系统)的默认检索模式。 • 当检索结果较少或检索不到信息时,可以选择模糊检索。 • 模糊检索是扩检(即扩大检索结果)
1.4.4 精确检索方法 • 与模糊检索相对应,检索词不能拆分开 • 精确检索是缩检(即缩小检索结果)
1.4.5 限制检索 • 针对特定年代、特定类别、特定检索点等作限制,包括前缀限制符和后缀限制符。 后缀限制符例如: /TI 限在题目中查 /AB 限在文摘中查 /DE 限在叙词标引中查 前缀限制符例如: AU= 限查特定作者 JN= 限查特定刊名 LA= 限查特定语种 PN= 限查特定专利号 PY= 限查特定年代
如在谷歌和百度搜索引擎中的 检索特定的文献类型: “报告 filetype:pdf ” 检索指定网址内的信息: “报告 site:www.google.com” 以后会看到一些数据库通常都有年代/类型等的选择
2.信息检索七准则 • 你得到什么检索结果,取决于你怎么提问(即主题概念分析) • 去信息应该在的地方检索 (即选择数据库) • 向你的检索结果提问 ―― 信息可能是真的,但内容仍然会有错的(检索结果的判断,内容的选取) • 检索是一个多步骤的过程(扩检、缩检) • 检索结果必须符合需求(检索结果的选择) • 咨询图书馆员(获得帮助) • 信息本身是无意义的,只有人提问之后才有价值(撰写论文吧,让信息增值) 信息检索准则编译自:http://www.infotoday.com/searcher/jan02/block.htm
3.中国期刊全文数据库(CNKI)检索 相关知识: • 什么是CNKI? • 中国知识基础设施工程,China national knowledge infrastructure简称CNKI。 • CNKI发展历程: • 学术期刊光盘中国期刊网 (中国知网)中国知识资源总库 • 中国知识资源总库 • 内容:从期刊论文到博士硕士论文、会议论文,从报纸、年鉴到字典、辞典、百科全书、医学图谱,从多媒体教学素材库到专业知识仓库。 • 多个子库的集成服务
3.1 简介 • CNKI即中国基础设施工程(National Knowledge Infrastructure,CNKI),也称为中国知网。为了针对不同的用户团体进行销售,数据库既有细分专门的数据库,也有整合的数据库检索形式,其产品形式和名称与经常变动(其核心产品变化不大)。比如中国学术文献网络出版总库系列数据库有: • 中国期刊全文数据库(中国学术期刊网络出版总库) • 中国博士学位论文全文数据库 • 中国优秀硕士学位论文全文数据库 • 中国重要报纸全文数据库 • 中国重要会议论文全文数据库 • 中国专利数据库 • 中国标准数据库 • 中国成果数据库 • 中国年鉴网络出版总库 • ……
中国期刊全文数据库 • 内容: 以学术、技术、政策指导、高等科普及教育类期刊为主,内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域。截至2012年10月,收录国内学术期刊 7900多种, • 收录年限:其中创刊至1993年3500余种,1994年至今7700余种,全文文献总量3500多万篇。 • 资源特色: 核心期刊收录率96%;特色期刊(如农业、中医药等)收录率100%;独家或唯一授权期刊共2300余种,约占我国学术期刊总量的34%。 • 产品形式:WEB版(网上包库)、镜像站版、光盘版、流量计费。 • 更新频率 • 网上包库:每日更新5000~7000篇, • 各镜像站:一般不会每日更新 • 专辑光盘:每月更新,专题光盘:年度更新。
CNKI中国期刊论文全文数据库 • 有多种产品形式和多种名称,但都指的同一个数据库。 • 中国期刊论文全文数据库 • 中国学术期刊网络出版总库 • 中国期刊全文数据库 • 中国知网(期刊检索)
进入“学术总库检索平台”,再选择“中国期刊网络出版总库”进入“学术总库检索平台”,再选择“中国期刊网络出版总库”
年限限定很有必要 另一个词,可为空 检索途径 逻辑关系 检索词记录 相关词 增加检索途径和逻辑组配 精确检索 网络版无效
园区入口点击链接二或本校图书馆点击园区镜像园区入口点击链接二或本校图书馆点击园区镜像
3.3 检索—以镜像站为例子 • 检索方式:提供了快速检索、标准建设、专业检索等多种检索方式,并可在检索结果中进行二次检索。同时还设有期刊导航、学科内容分类导航等多项个性化检索方式。用户还可不需要输入具体的检索词即可按分类和期刊名称字顺等方式查找所需期刊,并可链接浏览全文。 • 检索途径:关键词、题名、刊名、作者、第一作者、文摘、来源、基金、全文、参考文献、主题。 • 检索系统:支持布尔逻辑检索和限定检索,提供了学科范围和年代的限定。 • 全文下载:支持CAJ和PDF文件。
镜像站版界面 检索词记录 相关词 增加检索途径和逻辑组配
检索策略一:一个词检索 选择篇名检索途径 采用默认的无限定检索 学科领域范围限定 相似词与此间关系辅助选词
检索结果分析与调整检索策略:一 • 问题 • 检索结果太多:22384条,这么多的信息量是无法都看完的,也不知道哪些信息适合自己 • 检索结果出现误差:比如出现了“管理信息”,而且“信息”和“管理”竟然分开了,这些都不是检索需求的初衷。 • 调整检索策略—缩小检索 • 限定检索年限:根据文献老化规律,一般选择5~10年内的文献比较合适。 • 让数据库帮助自己选择高质量的文献:选择核心期刊 • 按照原意检索:选择精确检索模式。(在网络版中,精确检索无效)
检索结果分析与调整检索策略:二 • 问题 • 尽管检索结果数量大幅减少(513条),但要阅读这样多的文献也是比较麻烦的事情。 • 经过阅读检索结果标题,发现我是想检索有关“医药信息管理”方面的文献,好多不是与医药相关的。 • 再次调整检索策略—缩小检索 • 增加一个检索词“医药”,逻辑组配选择“并且”。
检索结果分析与调整检索策略:三 • 问题 • 检索结果为0!,缩减的太厉害了,看来要扩展检索了! • 再次调整检索策略—扩展检索 • 增加检索学科领域:医药卫生 • 文献质量档次降低:全部期刊(不仅仅是只要核心期刊的论文了)
OK!,可以看论文全文了! 点击篇名进入论文详细信息与下载页面
4 《中文科技期刊数据库》 • 维普资讯 • 收录了中国境内历年出版的中文期刊12000 余种,全文3000 余万篇,引文4000 余万条, • 多种产品形式、多种名称 • 维普网 • 网络版 • 全部产品,搜索引擎化服务 • 《中文科技期刊数据库》 • 镜像站版 • 经典应用 • 维普期刊资源整合服务平台 • 镜像站版 • 引文数据、学科计量分析 • 《中国科学引文数据库》(CSCD)
5 万方数据—期刊论文 • 期刊论文库:收录自1998年以来国内出版的各类期刊7千余种,其中核心期刊2800余种,论文总数量近2千万篇,每年约增加200多万篇,每周两次更新。 • 多种版本 • 镜像站 • 网络版
6 检索平台中的中文期刊论文检索 • 谷歌学术搜索 • http://scholar.google.com/ • 宁波市数字图书馆 • http://www.nbdl.gov.cn/ • 宁波市科技文献检索服务中心 • http://www.nbsti.net/ • 维普、CNKI、医学与医药领域期刊 • 超星百链云(超星学术搜索) • http://www.blyun.com/ • CNKI学术搜索 • http://scholar.cnki.net/
7 中文引文数据库 • 引文数据库,是将各种参考文献按照一定规则记录下来,集合而成的规范的数据集。 • 中文引文数据库 • 《中文社会科学引文索引》 (CSSCI) • http://cssci.nju.edu.cn/ • 《中国科学引文数据库》(CSCD) • http://sdb.csdl.ac.cn/search_sou.jsp
其它 • 博看期刊(杂志) • 包库链接: • www.bookan.com.cn/nbdxyqlib • 镜像链接: • http://bkqk.nlic.net.cn