1 / 35

网络信息检索

网络信息检索. 袁颖( Email:lhgyy425@163.com ) 北华大学 2011 年 12 月 18 日. 版权声明. 本课件尊重知识产权,遵守学术规范。 课件版权归制作人及其所在图书馆(北华大学)所有, CALIS 管理中心享有编辑、复制、借鉴、推广使用和宣传等权利。. 培训目标. 使学生了解 Internet 提供的信息服务、掌握用搜索引擎在网上查找信息的方法、掌握网上各种文献信息类型检索方法。 本课件适用各专业的本科生了解网络信息检索的基本知识。. 本课的主要内容. Internet 的基本概念 Internet 提供的信息服务

donald
Download Presentation

网络信息检索

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 网络信息检索 袁颖(Email:lhgyy425@163.com) 北华大学 2011年12月18日

  2. 版权声明 • 本课件尊重知识产权,遵守学术规范。 • 课件版权归制作人及其所在图书馆(北华大学)所有,CALIS管理中心享有编辑、复制、借鉴、推广使用和宣传等权利。 信息素养-培训课件

  3. 培训目标 • 使学生了解Internet提供的信息服务、掌握用搜索引擎在网上查找信息的方法、掌握网上各种文献信息类型检索方法。 • 本课件适用各专业的本科生了解网络信息检索的基本知识。

  4. 本课的主要内容 • Internet的基本概念 • Internet提供的信息服务 • 在因特网上可以做些什么 • 网络资源检索方法 • 因特网资源检索方法 • 搜索引擎简介 • 网上各类型文献信息资源查询

  5. Internet的基本概念

  6. Internet的基本概念-1 • TCP/IP协议 • TCP/IP是由美国国防部高级计划局资助的Internet技术和方法,也称为传输控制/网间协议,是一个标准协议集合,专门适用于广域网(WAN)。 • WWW • WWW的含义是“环球网”,是超文本方式的信息查询工具。WWW基于HTTP协议,用HTML语言将多媒体信息组织成超文本,并通过这种方式将全世界Internet上的不同地点的相关信息有机结合起来。 信息素养-培训课件

  7. Internet的基本概念-2 • HTTP(超文本传输协议) • HTTP是基于TCP/IP之上的协议,是用于分布式协作超媒体信息系统的快速实用协议。 • 它不仅需要保证正确传送超文本文档,还必须能够确定传送文档中的某一部分,以及哪部分内容首先显示。 • HTML(超文本标识语言) • 在HTML中,可以嵌入图像、声音等,可通过超链接无缝引用其他WWW网址资源。用HTML组织起来的信息文档称为页面,由浏览器进行解释、执行和显示输出。 • HOMEPAGE:又称为主页,是WWW服务的起始信息页。 • Browser:又称为浏览器,是用来阅读HTML文件的专用软件系统,可通过FTP、NNTP、Gopher等许多方式来获取信息。 信息素养-培训课件

  8. Internet的基本概念-3 • URL(统一资源定位器) • URL可以将世界上所有的联机信息资源组织成有序结构。它的格式有三部分组成: • 第一部分是协议(或称服务方式),大部分Internet文档用http,其他常用的协议有fp、news、gopher、telnet等 • 第二部分是存有该资源的主机IP地址 • 第三部分是主机资源的具体地址。 信息素养-培训课件 8 2011-2012年

  9. Internet的基本概念-4 • IP地址 • Internet上的众多计算机和信息资源必须通过名字和地址来进行识别。 • 接入Internet的计算机或节点被赋予一个惟一的数字作为地址,称为IP地址,用小数点隔开的四组数字组成。 • IP地址通常由Internet 服务机构从Internet网络信息中心注册申请。 • IP是网络中的重要资源,有多少个IP地址就意味着有多少台计算机能够连入Internet。 信息素养-培训课件 9 2011-2012年

  10. Internet的基本概念-5 • 域名 • 由于IP地址由四组数字构成,不易记忆,所以Internet采用域名系统(DNS),作为表示Internet上特定主机的助记名称。 • Internet中每台计算机的域名结构为:主机名、机构名、网络名、最高层域名。 • 域名是由有规律的英文单词组成的,非常便于记忆,而且还可以根据域名组成的规律,猜测某一个站点的域名。 • 常见的标准域名结构为:主机名、机构名、网络名、最高层域名。 信息素养-培训课件 10 2011-2012年

  11. Internet的基本概念-6 • 在Internet的域名系统中最高层域名有三种: • 第一类为国别域名,由两个英文字母组成,如:“.CN(中国)”、“.JP(日本)”、“.US(美国)”、“.UK(英国)”、“.CA(加拿大)”。 • 第二类为国际域名,现只有一个“.INT”代表国际组织。 • 第三类为通用域名,目前用到的有13个: .net——网络服务机构 .edu——教育部门 .web——web服务机构 .arts——文化娱乐部门 .info——信息部门 .rec——娱乐机构 .org——非赢利机构 .Store——销售部门 .Firm——公司企业 .gov——政府部门 .com.——商业机构 .mil——军事部门 .nom——个人 信息素养-培训课件 11 2011-2012年

  12. Internet可提供的信息服务

  13. Internet可提供的信息服务 • E-mail电子邮件 • Telnet远程登录 • FTP文件传输协议 • Usenet新闻组、Listserv讨论组、Mailing List用户组 • WAIS文档检索 • BBS电子公告牌 • IRC网络聊天 信息素养-培训课件 13 2011-2012年

  14. 在因特网上可以做些什么? -1 • 访问虚拟图书馆和虚拟博物馆 • 检索图书馆联机目录 • 获取电子出版物 • 获取科研、学习资料(访问各种数据库) • 咨询各方面专家 信息素养-培训课件 14 2011-2012年

  15. 在因特网上可以做些什么? -2 • 接受远程教育 • 获取全球最新政治、财经、商业、教育、科技消息 • 购书、预订机票和车票 • 查找旅游、度假等资料 • 上网聊天、玩网络游戏、发电子邮件及贺卡等 信息素养-培训课件 15 2011-2012年

  16. 网络资源检索方法

  17. 网络资源检索方法-1 • 利用URL(统一定位器)直接访问 • URL是各种专门的计算机和文献资源在因特网上的“地址”。 • 一般格式为: 〈通讯协议〉://〈主机IP地址或域名〉/ 路径/ 文件名。其中,以“http://”开头表示超文本传输协议。 • WWW的全称为“World Wide Web”。其含义是“环球网”,也叫“万维网、全球网”,是超文本方式的信息查询工具。 信息素养-培训课件 17 2011-2012年

  18. 网络资源检索方法-2 • 利用搜索工具 • 与普通网站不同,搜索引擎网站的主要资源是索引数据库。 • 它的工作原理是通过搜索引擎数据库的采集、调用来实现它的导航功能。 • 利用已知站点的引导与链接 信息素养-培训课件 18 2011-2012年

  19. 搜索引擎简介

  20. 搜索引擎简介-1 • 搜索引擎是采用信息自动跟踪标引等技术、建立在因特网上专门提供网络信息资源导航服务检索工具。 • 搜索引擎的检索系统由以下几部分组成: • 搜索器 • 分析器 • 索引器 • 检索器 • 用户接口 信息素养-培训课件 20 2011-2012年

  21. 搜索引擎简介-2 • 同检索数据库一样,利用搜索工具检索,也需要用户能够将自己的检索需求编制成合适的检索策略,并且需要一定的检索技巧 • 搜索引擎采用的检索词和信息标识词匹配运算的主要方法有:布尔逻辑检索、截词检索、限制检索、加权检索、词位置检索和全文检索等。 信息素养-培训课件 21 2011-2012年

  22. 搜索引擎简介-3 • 搜索引擎分类 • 检索型搜索引擎 • 目录型搜索引擎 • 混合型搜索引擎 • 多元搜索引擎 信息素养-培训课件 22 2011-2012年

  23. 搜索引擎简介-4 • 国 外 综 合 型 检 索 工 具 • 目前有记录可查的国外的搜索引擎数量已达到2500个,如:Yahoo!、AltaVista、Excite等。 • 访问AltaVista(http://www.altavista.com) 的次数超过1亿次。 • HotBot( http://www.hotbot.com )是美国享有盛誉的综合型、混合型搜索引擎。 信息素养-培训课件 23 2011-2012年

  24. 搜索引擎简介-5 • 综 合 型 中 文 搜 索 引 擎 • 目前形成规模的综合型中文搜索引擎有:搜狐、网易、新浪、天网、北极星、搜索客、悠游、FM365搜索引擎、263在线搜索引擎、21cn搜索引擎、TOM中文搜索、常春藤、焦点搜索引擎、看中国、中国导航、视讯、华好网景、司南等。 • 新浪搜索(http://search.sina.com.cn):采用具有世界先进水平的百度搜索技术。提供“分类检索”和“关键词”查找两种查找方法。 信息素养-培训课件 24 2011-2012年

  25. 搜索引擎简介-6 • 搜狐搜索(http://dir.sohu.com):采用先进的Google检索技术,提供多语言检索。 • 天网搜索(http://e.pku.edu.cn):支持中英文搜索,只提供关键词查询方式。 信息素养-培训课件 25 2011-2012年

  26. 搜索引擎简介-7 • 专 题 型 搜 索 引 擎 • 搜狐搜索(http://dir.sohu.com):采用先进的Google检索技术,提供多语言检索。 • 塞迪网“IT罗盘”(http://itsearch.ccidnet.com):塞迪网是国内著名的面向IT行业提供全面信息服务的垂直门户站点。 • 因特网法律资源指南(Internet Legal Resource Guide ,简称ILRG。(http://www.ilrg.com):是1995年 美国推出的第一家系统、全面提供法律网络信息资源导航网站。它选择收集了来自238个国家、地区的4000多个与法律密切相关的网站,提供了较全面的法律信息检索。 信息素养-培训课件 26 2011-2012年

  27. 搜索引擎简介-8 • 中文多元型搜索引 擎 • 多元搜索引擎又称为集合式搜索引擎。它是将多个搜索引擎集成在一起,通过一个统一的检索界面方便、快速、全面获取网络信息的检索工具。 • 万维搜索引擎(http://www.widewaysearch.com):是上海万维信息技术有限公司2000年推出的多元搜索引擎。 • 网络灯塔(http://www.haiyan.com/steelk/navigator/gbindex.htm):集成了50多个中文搜索引擎,分别提供简繁体中文网站、网页和新闻的多元信息搜索服务。 信息素养-培训课件 27 2011-2012年

  28. 搜索引擎简介-9 • 英文多元型搜索引擎 • Dogpile(http://www.dogpile.com):是因特网上最早出现也是影响最大的多元搜索引擎。 Dogpile集成了21个不同类型的搜索引擎,按照检索对象可以将这些检索工具分成6种类型:Web页、图像、FTP文件、新闻组、多媒体。系统支持的运算功能与运算符主要有4种:AND,+;OR;NOT,-;词组短语(用双引号)。 • MetaCrawler(http://www.metacrawler.com) :是因特网上最有影响的多元搜索引擎之一,也是最典型的综合型集成搜索引擎。 信息素养-培训课件 28 2011-2012年

  29. 网上各类型信息资源查询

  30. 网上各类型信息资源查询-1 • 数字图书馆 • 中国数字图书馆 • 书生之家数字图书馆 • 超星数字图书馆 • 北大方正的Apabi系统 • 报刊资料 • 中国学术期刊网 • 中文科技期刊数据库 • 万方数据资源系统。 信息素养-培训课件 30 2011-2012年

  31. 网上各类型信息资源查询-2 • 会议文献 • 中国科学院学术会公告 • 学界动态 • IEEE学术会议数据库 • 万方学术会议文献数据库 • 中国重要会议论文集全文数据库 • 国内专业会议资料数据库 • OCLC的会议文献数据库 • 美国科学信息研究所( ISI )会议数据库。 信息素养-培训课件 31 2011-2012年

  32. 网上各类型信息资源查询-3 • 学位论文 • 中国学术期刊网 • 万方数据资源系统的学位论文数据库 • 高校学位论文数据库 • PQDD数据库(美国) • 专利文献 • 中国专利信息网 • 国家知识产权局 • DILAOG系统 • 世界知识产权组织专利数据库 • 美国专利商标局专利检索数据库 信息素养-培训课件 32 2011-2012年

  33. 网上各类型信息资源查询-4 • 标准类 • 中国标准咨询网 • 万方数据资源系统标准数据库 • 国际标准化组织 • 美国国家标准委员会 信息素养-培训课件 33 2011-2012年

  34. 参考文献 [1] 彭志宏,王家驹主编.现代图书馆信息检索与利用.郑州:郑州大学出版社,2008 . [2]汤林芬主编.文献检索.长春:吉林大学出版社,2008 . [3]张海政等编.信息检索.合肥:安徽科学技术出版社,2007 . [4]袁学松,宋雯菲主编.现代信息检索.北京:中国水利水电出版社,2007 . 信息素养-培训课件 34 2011-2012年

  35. 欢迎交流与咨询 Email:lhgyy425@163.com

More Related