1.3k likes | 1.47k Views
学术文献的检索与获取. 北京大学图书馆 赵飞. 前言. 数字化时代里,不断发展的技术与设备可以轻松地让图书与文献等学术资源与信息就在你的身边。 然而面对海量的学术资源 ,如何快速 和准确地找到真正需要的文献,以及如何才能合理有效地管理与利用这些资源便成为了不能不去了解的重要知识。. 主要内容. 1. 2. 3. 4. 搜索引擎的使用. 在线百科资源. 专业数据库 与 全文 的获取. 学位论文撰写规范. 搜索引擎的使用. 1. 网络搜索引擎. 什么是搜索引擎( Search Engine)
E N D
学术文献的检索与获取 北京大学图书馆 赵飞
前言 数字化时代里,不断发展的技术与设备可以轻松地让图书与文献等学术资源与信息就在你的身边。 然而面对海量的学术资源,如何快速和准确地找到真正需要的文献,以及如何才能合理有效地管理与利用这些资源便成为了不能不去了解的重要知识。
主要内容 1 2 3 4 搜索引擎的使用 在线百科资源 专业数据库与全文的获取 学位论文撰写规范
1. 网络搜索引擎 • 什么是搜索引擎(Search Engine) • 搜索引擎是指通过网络搜索软件或网站登陆等方式,将互联网上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种查询作出响应,提供用户所需的信息。 • 搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。 • 搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。 • 搜索引擎常常是用户利用网上资源的第一途径。
1. 网络搜索引擎 关于Google • 由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明。 • 约搜索30亿张网页,包括35个国家和地区的语言的资源。 • 已占有全球搜索市场的80%。Google 在中国的搜索市场的市场份额原先也已突破30%,目前已不足16%。 • Google于2010年退出中国,搜索将经过审查过滤。 PageRank算法
1. 网络搜索引擎 • www.google.comGoogle搜索引擎 • scholar.google.comGoogle学术搜索
1. 网络搜索引擎 Google的进入 • 无论是www.google.com还是www.google.cn,都会被跳转至www.google.com.hk • Tips: 如何才能打开原生的英文主页? • www.google.com/ncr (No Country Redirection)
1. 网络搜索引擎 检索技巧 • 搜索不区分大小写 • [Peking University] 与 [peking university] • 使用一对方括号 [ ] 表示一个搜索查询 • [ 北京大学 ] 与 [北京] [大学] • 标点符号(包括 @#$%^&*()=+[]\)以及其他特殊字符)都会被忽略 • 特殊情况:见后 • 搜索引擎会推测人们的行为 • 查询 [ for better or for worse ] 被视为一本非常著名的连环漫画。 • 查询 [ 34 * 87 ] 会显示计算器结果。
1. 网络搜索引擎 • 不能忽略的标点 • 热门查询词中的标点具有特殊含义,例如 [ C++ ] 或 [ C# ] • 美元符号 ($) 用于表示价格。 [ 尼康 400 ] 和 [ 尼康 $400 ] 。 • 连字符 - (- 后面无空格而前面有空格的情况属于例外) • 下划线符号 _ ,例如 [ quick_sort ]。
1. 网络搜索引擎 • 词组搜索 (“”) • 严格按照该词组的形式查找结果,例如“北京大学”。 • Google搜索自动采用同义词,例如查询 北京大学 会同时查找 北大。但用“北京大学”查到的是只有北京大学的结果。 • 可以用于搜索被默认忽略的词:如"china or india" • 精确搜索 (+) • 在搜索字词前边加一个加号 +(+号后面无空格,+号前留一空格)。 • 使用“+”将Google忽略的常用字词和字符包含在查询字词中。例如,对红与黑的搜索:red +and black
1. 网络搜索引擎 • 补全搜索字词 (*) • 查询 [北京*大学] :北京大学/北京科技大学/北京师范大学 • * 操作符只能代表整个单词或中文汉字,不能代表单词的一部分。 • OR 操作符 • “OR”必须全部是大写形式。 • 符号 | 可以代替 OR。 • [北京大学 2010 OR 2011] :包含其中任意一个年份的搜索结果; [北京大学 2010 2011] :显示同时包含两个年份的网页。
1. 网络搜索引擎 如何在特定的网站中搜索 • “site”表示搜索结果局限于某个具体网站或者网站频道。 • 搜索字词 site:域名。 • 例如,要查找哲学系的毕业论文相关信息,可以采用以下方法: • 毕业论文 site:www.phil.pku.edu.cn • site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。 • 网站域名不能有“http://”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。
1. 网络搜索引擎 如何搜索文件而不是网页 • “filetype: ”在某一类文件中查找信息。 • Google能检索微软的Office文档如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,Adobe的.pdf文档,ShockWave的.swf文档(Flash动画)等。 • 检索词 filetype:文件类型 • 如:modal logicfiletype:pdf
1. 网络搜索引擎 • 限定搜索文件类型将在检索文献全文时非常有用
1. 网络搜索引擎 URL链接与网页标题搜索 • inurl/allinurl,intitle/allintitle :搜索的关键字包含在URL链接(网页标题)中 • “inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。例如:“inurl:pdf logic” • 注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”进行搜索。例如,Google会把“cgi-bin/phf”中的“/”当成空格处理。 • 如搜索:allinurl:"cgi-bin" phf +com • 也可用于检索全文
1. 网络搜索引擎 搜索结果说明 • 网页快照该网页最后一次编入索引时的版本。 • 即时预览点击搜索结果旁的放大镜图标 即可在点击结果前预览对应的网页。 网页快照 即时预览
1. 网络搜索引擎 高级检索与检索设置 • 所有上述功能均可在高级检索中实现和进行组合。 检索结果界面的右上角
1. 网络搜索引擎 Google学术搜索 • 来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的经同行评论的文章、论文、图书、摘要和文章。 • 滤掉了普通搜索结果中大量的垃圾信息,排列出文章的不同版本以及被其它文章的引用次数。 • 搜索出来的结果没有按照权威度(譬如影响因子、引用次数)依次排列,在中国搜索出来的,前几条记录可能为书籍。
1. 网络搜索引擎 学术搜索的检索技巧 • 从标题出发的搜索 • 精确查找:输入加引号的论文标题:“A History of the China Sea”。 • Google 学术搜索会自动查找此论文以及提及此论文的其他论文。 • 一般直接输入题目,会将最匹配的结果放在前面。
1. 网络搜索引擎 • 从作者出发的搜索 • 搜索 [friedman regression] (弗里德曼 回归) 会返回以“regression”为主题的,由名为“Friedman”的人撰写的文章。 • 输入加引号的姓名:["jhfriedman"],搜索某位作者。 • 如果某个词既是人名也是普通名词,使用"作者:"操作符。 "作者:"和搜索字词之间不能有空格。 • [作者:flowers] (人名弗劳尔,也是花的意思) 会返回由名为"Flowers"的人撰写的文章,而 [flowers -作者:flowers] 会返回关于花的文章,而忽略由名为"Flowers"的人撰写的文章。 • 作者全名加引号,来进一步缩小搜索范围。尽量使用首字母而不要使用全名。 • 要查找 Donald E. Knuth(唐纳德·E. 克努特),可以尝试 [作者:"d knuth"]、[作者:"de knuth"]或[作者:"donald e knuth"]。
1. 网络搜索引擎 • 利用作者限定,还可以实现更多搜索 • 例如:搜索研究毛泽东的文献
1. 网络搜索引擎 学术搜索的高级搜索 • 出版物限制 • 只返回来自特定出版物、针对特定字词的搜索结果。 • 日期限制 • 在寻找某一特定领域的最新刊物时,可能会比较实用。 • 信息可能不完整甚至不准确;例如,许多预印本没有介绍文章是在哪里(甚至是否)最终出版,有些网站资源没有标注出版日期。 • 一本杂志名称可能会用多种方式进行拼写(例如:Journal of Biological Chemistry(《生化杂志》)经常被简写为 J BiolChem)
1. 网络搜索引擎 检索限定条件 刊物、时间限定
1. 网络搜索引擎 学术搜索的结果页面 • 被引用次数:不同于SCI的被引次数,两者覆盖文献范围不一样。点击可查看施引文献。 • 相关文章:与这篇文章相似的其他文章 • 所有版本:有这篇文章的不同的数据库或网站,有可能某个网站就可以下载全文。 • 更多:可以检索书目信息、查看全文的途径等。 • 图书馆链接:通过未名学术搜索或指定图书馆检索系统检索这篇文献。
1. 网络搜索引擎 在图书馆检索系统中检索 被引用情况 被引用情况 所有版本
1. 网络搜索引擎 巧用学术搜索的设置 • 文献信息的导出功能:支持多种参考文献格式的导出,方便日常的管理和论文中的引用生成。 • 语言设置:有目的性地搜索某种语言的文章。 • 图书馆连接设置:可以便捷地搜索图书馆是否已有该篇文献的全文。 不要忽视这里
1. 网络搜索引擎 选择所需的格式 勾选北大图书馆的连接
1. 网络搜索引擎 便捷的文献信息定制功能 • 文献引用信息的跟踪定制 • 定制某篇文献的最新引用文献信息,推送到设定的邮箱中。 • 检索的跟踪定制 • 定制符合某一检索式的最新文章信息,推送到设定的邮箱中。
1. 网络搜索引擎 检索的跟踪定制
1. 网络搜索引擎 首先点击被引链接 在引用文献界面点击创建Alert 文献引用信息的跟踪定制
1. 网络搜索引擎 学术搜索的更多功能 • 统计分析功能 • 以出版物为单位,按h5指数列出较为突出的刊物。 • h5 指数是指在过去整整 5 年中所发表文章的 h 指数。h 指在 2007-2011 年间发表的 h 篇文章每篇至少都被引用过 h 次的最大值。 可直接点击查看整体情况 也可检索某领域情况
1. 网络搜索引擎 • 个人研究成果主页 • 由个人建立,自动按个人信息抓取相符的文献。 • 可手工进行添加和筛选。 • 提供部分统计功能。 统计数据 关注他 高频次合作者 成果列表
1. 网络搜索引擎 使用Google获取全文的Tips • 一般直接用学术搜索即可,但有可能学术搜索搜不到,而google却可以搜到。 • 查看所有版本获取更多途径。 • 推荐使用英文版。
1. 网络搜索引擎 Google Books • Google Books是一款提供了全文检索的图书搜索产品,不仅搜索图书的摘要,而且可以对图书全文内容进行搜索。 • 此服务于2004年10月在法兰克福书展发布,命名为Google Print。 • 微软在2006年开发了一个类似的计划,名叫Live Search Books。它持续进行了一段时间,直到2008年5月该计划才被取消,所有的数据现已存在Internet Archive。 • 包含大量扫描获取的全文,但是版权问题存在争议。 • http://books.google.com/
1. 网络搜索引擎 Google Trends • Google 趋势可让您比较世界各地的人们对您的首选主题的关注程度。 • 您最多可输入五个主题,然后观察人们在各个时段内通过 Google 搜索这些主题的频率。 • Google 趋势还可显示您的主题在 Google 新闻报道中出现的频率,以及最常搜索这些主题的人们所在的地区。 • Google 趋势会分析部分 Google 网页搜索结果,计算人们在各个时段通过 Google 使用您输入的字词执行搜索的次数,并与同期执行的搜索总次数进行比较。 • 通过热门趋势,可以查看不同时间搜索量上升最快的搜索内容(http://www.google.com/trends/hottrends)
1. 网络搜索引擎 www.google.com/trends
1. 网络搜索引擎 • 可以很明显的看到这一天焦点事件成为人们搜索的主要热点
1. 网络搜索引擎 Google Books Ngram Viewer • 查看词组在全世界历年出版的图书中出现的频率。 • http://books.google.com/ngrams
1. 网络搜索引擎 必应Bing • 必应(Bing,中国大陆译作必应,台湾译作缤纷)是微软公司推出的用以取代Live Search的搜索引擎。由微软CEO史蒂夫·鲍尔默于2009年5月28日在《华尔街日报》于圣迭戈举办的“All Things D”公布,2009年6月3日正式在世界范围内发布。内测代号为Kumo,其后才被命名为Bing。 • 中文版目前依然为beta版 • www.bing.com
1. 网络搜索引擎 英文版非Beta 嵌入社交网络 更多搜索提示
1. 网络搜索引擎 微软学术搜索 • 对文献信息进行了部分人工整理。 • 提供了多方面的统计数据。 • 提供了针对科研人员、科研领域等的主题页面 • http://academic.research.microsoft.com/
1. 网络搜索引擎 很有特色的微软学术搜索 提供了多种可视化科研评估与分析功能
1. 网络搜索引擎 针对模态逻辑领域的统计 关键词聚类分析 相关文献信息
1. 网络搜索引擎 合作与引用关系图 针对科研人员的统计
1. 网络搜索引擎 • 合作关系图(合作越多距离越近)
1. 网络搜索引擎 • 探索两个作者间的合作关系网
1. 网络搜索引擎 • 引用关系图(引用次数越多距离越近)