1 / 42

第五章 网络信息检索

第五章 网络信息检索. 第一节 搜索引擎的使用 第二节 OA 资源. 网络能带给我们什么?. 学习、生活中所需的资料 1 、旅游信息 2 、考研信息 3 、出国留学信息 4 、火车时刻表、航班等信息 …… 科研工作中所需的资料 1 、查找相关领域的最新研究进展 2 、查找科研成果的转化对象 3 、查找原始文献的出处 ……. Internet 基本知识. 网络信息源:存在于互联网( Internet )上能通过计算机网络利用到的信息资源总和。 Internet 发源于美国国防 60 年代的研究计划。

lyle-robles
Download Presentation

第五章 网络信息检索

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第五章 网络信息检索 • 第一节 搜索引擎的使用 • 第二节 OA资源

  2. 网络能带给我们什么? • 学习、生活中所需的资料 • 1、旅游信息 • 2、考研信息 • 3、出国留学信息 • 4、火车时刻表、航班等信息 …… • 科研工作中所需的资料 • 1、查找相关领域的最新研究进展 • 2、查找科研成果的转化对象 • 3、查找原始文献的出处 • ……

  3. Internet基本知识 • 网络信息源:存在于互联网(Internet)上能通过计算机网络利用到的信息资源总和。 • Internet发源于美国国防60年代的研究计划。 • Internet遵循的是TCP/IP(也即传输控制协议/网间协议),它是一种网络通信协议,它规范了网络上的所有通信设备,尤其是一个主机与另一个主机之间的数据往来格式以及传送方式。 • IP地址:人们为了通信的方便给每一台计算机都事先分配一个类似我们日常生活中的电话号码一样的标识地址,称作网络协议地址。IP地址的长度为32位,分为4段,每段8位。用十位制数字表示,每段数字范围为1~254,段与段之间用句点隔开。

  4. Internet基本知识 • 虽然可以通过IP地址来访问每一台主机,但是要记住那么多枯燥的数字串显然是非常困难的,为此,Internet提供了域名(Domain Name)。 • 域名也由若干部分组成,各部分之间用小数点分开,例如我校主机的域名是 :“www.bvtc.edu.cn”。 • 域名前加上传输协议信息及主机类型信息就构成了网址(URL),例如我校www主机的URL就是:“http:// www. bvtc.edu.cn”。 • 通常,进行网络访问时,域名的www可以省略。如http://www.edu.cn/,可以直接输入http://edu.cn。不能省略的与域名服务器的配置有关。 • 域名一般不会变动。

  5. Internet基本知识 • 由于Internet最初是在美国发源的,因此最早的域名并无国家标识,人们按用途把它们分为几个大类,它们分别以不同的后缀结尾: • 随着Internet向全世界的发展,域名资源有限,各个国家、地区在域名最后加上了国家标识段,由此形成了各个国家、地区自己的国内域名,如:.com.cn 中国的商业.org.hk 香港的组织.net.jp 日本的网络 .com 商业公司 .org 组织、协会等 .net 网络服务 .edu 教育机构 .gov. 政府部门 .mil 军事领域

  6. 查看网络信息的方法 查看网络信息 的一般方法 浏览方式 查询方式 分类体系浏览 随意浏览

  7. 第一节 搜索引擎的使用 搜索引擎是查询网络信息最重要的工具。

  8. 1、搜索引擎概述 • 1994年4月。斯坦福大学的两名博士生,美籍华人杨致远和美国人David Filo共同创办了超级目录索引雅虎(Yahoo),并成功地使搜索引擎的概念深入人心。 • 1998年, Google创始人谢尔盖·布林和拉里·佩奇,两位斯坦福大学计算机系的学生在宿舍里创建了互联网搜索引擎Google。 • 1999年底,怀抱“科技改变人们的生活”的梦想,李彦宏回国创办百度。

  9. ①什么是搜索引擎? • 搜索引擎(search engine),是指根据一定的策略,运用特定的计算机程序搜集互联网上的信息,并将组织和处理后的结果信息显示给用户,为用户提供检索服务的系统。 • 搜索引擎一般由搜索器、索引器、用户检索界面组成。

  10. ②搜索引擎的工作原理 • 如:查找字“囧” • 利用拼音jiǒng,在音节表中找到jiong在字典的375页; • 利用部首□,在检字表找到囧在字典376页。 • 前提都是先找到该字所属页码。

  11. ②搜索引擎的工作原理 • 第一步,抓取网页。 • 第二步,处理网页,建立索引数据库。 • 第三步,提供检索。

  12. ③搜索引擎的分类 搜索引擎的类型 按检索机制不同 全文搜索引擎 目录搜索引擎 元搜索引擎 Google、百度 Yahoo 搜魅

  13. ③搜索引擎的分类 • 按检索内容不同: • 综合搜索引擎:搜索的内容是综合型的,能满足用户不同层次、不同层面的需求。 • 垂直搜索引擎:搜索的内容是某一专门领域和特定主题的,用户是某些特定的人群,特点是专、精、深。

  14. 2、搜索引擎的使用技巧 ①在类别中搜索

  15. ②利用双引号进行词组检索 • 运算符:“” • 含义:输入的检索词在检索结果中以完整词组的形式出现。

  16. ③按文件类型查找 • 运算符:filetype • 使用方法:关键词 filetype:文档类型 • 含义:查询特定类型的文档

  17. ④使用字段检索——intitle • 运算符:intitle • 使用方法:intitle:关键词 • 含义:查询结果的网页标题中必须含有关键词 • 如:查找市场消费需求方面的调查报告

  18. ④使用字段检索——site • 运算符:site • 使用方法:关键词 site:域名 • 含义:把检索范围限定在某个网站 • 如:查找广东白云学院网上关于课堂教学质量的文章

  19. ④使用减号限定查找——减号 • 运算符:- • 使用方法:关键词1 –关键词2 • 含义:去掉含有不需要的关键词的网页 • 如:神雕侠侣-电视剧

  20. 3、元搜索引擎 元搜索引擎就是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。

  21. 元搜索引擎工作原理

  22. 第二节 OA资源 开放获取(open access)是指某文献在Internet公共领域里可以免费获取,允许任何用户阅读、下载、复制、传递、打印、检索、超级链接该文献,并位置建立索引,用作软件的输入数据或其他任何合法用途。

  23. OA资源 中国预印本服务系统 中国科技论文在线 OA图书馆 Socolar DOAJ

  24. OA图书馆

  25. OA图书馆介绍: OA图书馆主要分为两个部分,第一是OA资源和OA新闻,第二是OA内容搜索: OA资源部分主要是介绍一些OA资源,包括预印本资源、OA期刊库、OA电子课件、OA机构存储库,OA期刊等。OA新闻主要是介绍Open Access的一些基本知识和国内外最新的Open Access新闻。 OA内容搜索,整合了所有的OA资源,使用者可以很方便检索所需要的材料。

  26. OA期刊——DOAJ • DOAJ(Directory of Open Access Journals)是个很好的专门OA期刊文献检索系统,但不包括预印本资源。该系统收录期刊的文章都是经过同行评议或严格评审的,质量高,与期刊发行同步,且都能免费下载全文,是做研究的好帮手。 • DOAJ由瑞典Lund大学图书馆创建和维护。 • DOAJ的优势在于收录的期刊的有着严格的质量控制,包括很多SCI收录的期刊。DOAJ收录的OA期刊数量非常多,属于目前最好的的OA期刊目录网站。

  27. DOAJ——检索界面

  28. DOAJ——浏览界面

  29. 检索结果界面

More Related