360 likes | 537 Views
网络信息检索. 袁颖( Email:lhgyy425@163.com ) 北华大学 2011 年 12 月 18 日. 版权声明. 本课件尊重知识产权,遵守学术规范。 课件版权归制作人及其所在图书馆(北华大学)所有, CALIS 管理中心享有编辑、复制、借鉴、推广使用和宣传等权利。. 培训目标. 使学生了解 Internet 提供的信息服务、掌握用搜索引擎在网上查找信息的方法、掌握网上各种文献信息类型检索方法。 本课件适用各专业的本科生了解网络信息检索的基本知识。. 本课的主要内容. Internet 的基本概念 Internet 提供的信息服务
E N D
网络信息检索 袁颖(Email:lhgyy425@163.com) 北华大学 2011年12月18日
版权声明 • 本课件尊重知识产权,遵守学术规范。 • 课件版权归制作人及其所在图书馆(北华大学)所有,CALIS管理中心享有编辑、复制、借鉴、推广使用和宣传等权利。 信息素养-培训课件
培训目标 • 使学生了解Internet提供的信息服务、掌握用搜索引擎在网上查找信息的方法、掌握网上各种文献信息类型检索方法。 • 本课件适用各专业的本科生了解网络信息检索的基本知识。
本课的主要内容 • Internet的基本概念 • Internet提供的信息服务 • 在因特网上可以做些什么 • 网络资源检索方法 • 因特网资源检索方法 • 搜索引擎简介 • 网上各类型文献信息资源查询
Internet的基本概念-1 • TCP/IP协议 • TCP/IP是由美国国防部高级计划局资助的Internet技术和方法,也称为传输控制/网间协议,是一个标准协议集合,专门适用于广域网(WAN)。 • WWW • WWW的含义是“环球网”,是超文本方式的信息查询工具。WWW基于HTTP协议,用HTML语言将多媒体信息组织成超文本,并通过这种方式将全世界Internet上的不同地点的相关信息有机结合起来。 信息素养-培训课件
Internet的基本概念-2 • HTTP(超文本传输协议) • HTTP是基于TCP/IP之上的协议,是用于分布式协作超媒体信息系统的快速实用协议。 • 它不仅需要保证正确传送超文本文档,还必须能够确定传送文档中的某一部分,以及哪部分内容首先显示。 • HTML(超文本标识语言) • 在HTML中,可以嵌入图像、声音等,可通过超链接无缝引用其他WWW网址资源。用HTML组织起来的信息文档称为页面,由浏览器进行解释、执行和显示输出。 • HOMEPAGE:又称为主页,是WWW服务的起始信息页。 • Browser:又称为浏览器,是用来阅读HTML文件的专用软件系统,可通过FTP、NNTP、Gopher等许多方式来获取信息。 信息素养-培训课件
Internet的基本概念-3 • URL(统一资源定位器) • URL可以将世界上所有的联机信息资源组织成有序结构。它的格式有三部分组成: • 第一部分是协议(或称服务方式),大部分Internet文档用http,其他常用的协议有fp、news、gopher、telnet等 • 第二部分是存有该资源的主机IP地址 • 第三部分是主机资源的具体地址。 信息素养-培训课件 8 2011-2012年
Internet的基本概念-4 • IP地址 • Internet上的众多计算机和信息资源必须通过名字和地址来进行识别。 • 接入Internet的计算机或节点被赋予一个惟一的数字作为地址,称为IP地址,用小数点隔开的四组数字组成。 • IP地址通常由Internet 服务机构从Internet网络信息中心注册申请。 • IP是网络中的重要资源,有多少个IP地址就意味着有多少台计算机能够连入Internet。 信息素养-培训课件 9 2011-2012年
Internet的基本概念-5 • 域名 • 由于IP地址由四组数字构成,不易记忆,所以Internet采用域名系统(DNS),作为表示Internet上特定主机的助记名称。 • Internet中每台计算机的域名结构为:主机名、机构名、网络名、最高层域名。 • 域名是由有规律的英文单词组成的,非常便于记忆,而且还可以根据域名组成的规律,猜测某一个站点的域名。 • 常见的标准域名结构为:主机名、机构名、网络名、最高层域名。 信息素养-培训课件 10 2011-2012年
Internet的基本概念-6 • 在Internet的域名系统中最高层域名有三种: • 第一类为国别域名,由两个英文字母组成,如:“.CN(中国)”、“.JP(日本)”、“.US(美国)”、“.UK(英国)”、“.CA(加拿大)”。 • 第二类为国际域名,现只有一个“.INT”代表国际组织。 • 第三类为通用域名,目前用到的有13个: .net——网络服务机构 .edu——教育部门 .web——web服务机构 .arts——文化娱乐部门 .info——信息部门 .rec——娱乐机构 .org——非赢利机构 .Store——销售部门 .Firm——公司企业 .gov——政府部门 .com.——商业机构 .mil——军事部门 .nom——个人 信息素养-培训课件 11 2011-2012年
Internet可提供的信息服务 • E-mail电子邮件 • Telnet远程登录 • FTP文件传输协议 • Usenet新闻组、Listserv讨论组、Mailing List用户组 • WAIS文档检索 • BBS电子公告牌 • IRC网络聊天 信息素养-培训课件 13 2011-2012年
在因特网上可以做些什么? -1 • 访问虚拟图书馆和虚拟博物馆 • 检索图书馆联机目录 • 获取电子出版物 • 获取科研、学习资料(访问各种数据库) • 咨询各方面专家 信息素养-培训课件 14 2011-2012年
在因特网上可以做些什么? -2 • 接受远程教育 • 获取全球最新政治、财经、商业、教育、科技消息 • 购书、预订机票和车票 • 查找旅游、度假等资料 • 上网聊天、玩网络游戏、发电子邮件及贺卡等 信息素养-培训课件 15 2011-2012年
网络资源检索方法-1 • 利用URL(统一定位器)直接访问 • URL是各种专门的计算机和文献资源在因特网上的“地址”。 • 一般格式为: 〈通讯协议〉://〈主机IP地址或域名〉/ 路径/ 文件名。其中,以“http://”开头表示超文本传输协议。 • WWW的全称为“World Wide Web”。其含义是“环球网”,也叫“万维网、全球网”,是超文本方式的信息查询工具。 信息素养-培训课件 17 2011-2012年
网络资源检索方法-2 • 利用搜索工具 • 与普通网站不同,搜索引擎网站的主要资源是索引数据库。 • 它的工作原理是通过搜索引擎数据库的采集、调用来实现它的导航功能。 • 利用已知站点的引导与链接 信息素养-培训课件 18 2011-2012年
搜索引擎简介-1 • 搜索引擎是采用信息自动跟踪标引等技术、建立在因特网上专门提供网络信息资源导航服务检索工具。 • 搜索引擎的检索系统由以下几部分组成: • 搜索器 • 分析器 • 索引器 • 检索器 • 用户接口 信息素养-培训课件 20 2011-2012年
搜索引擎简介-2 • 同检索数据库一样,利用搜索工具检索,也需要用户能够将自己的检索需求编制成合适的检索策略,并且需要一定的检索技巧 • 搜索引擎采用的检索词和信息标识词匹配运算的主要方法有:布尔逻辑检索、截词检索、限制检索、加权检索、词位置检索和全文检索等。 信息素养-培训课件 21 2011-2012年
搜索引擎简介-3 • 搜索引擎分类 • 检索型搜索引擎 • 目录型搜索引擎 • 混合型搜索引擎 • 多元搜索引擎 信息素养-培训课件 22 2011-2012年
搜索引擎简介-4 • 国 外 综 合 型 检 索 工 具 • 目前有记录可查的国外的搜索引擎数量已达到2500个,如:Yahoo!、AltaVista、Excite等。 • 访问AltaVista(http://www.altavista.com) 的次数超过1亿次。 • HotBot( http://www.hotbot.com )是美国享有盛誉的综合型、混合型搜索引擎。 信息素养-培训课件 23 2011-2012年
搜索引擎简介-5 • 综 合 型 中 文 搜 索 引 擎 • 目前形成规模的综合型中文搜索引擎有:搜狐、网易、新浪、天网、北极星、搜索客、悠游、FM365搜索引擎、263在线搜索引擎、21cn搜索引擎、TOM中文搜索、常春藤、焦点搜索引擎、看中国、中国导航、视讯、华好网景、司南等。 • 新浪搜索(http://search.sina.com.cn):采用具有世界先进水平的百度搜索技术。提供“分类检索”和“关键词”查找两种查找方法。 信息素养-培训课件 24 2011-2012年
搜索引擎简介-6 • 搜狐搜索(http://dir.sohu.com):采用先进的Google检索技术,提供多语言检索。 • 天网搜索(http://e.pku.edu.cn):支持中英文搜索,只提供关键词查询方式。 信息素养-培训课件 25 2011-2012年
搜索引擎简介-7 • 专 题 型 搜 索 引 擎 • 搜狐搜索(http://dir.sohu.com):采用先进的Google检索技术,提供多语言检索。 • 塞迪网“IT罗盘”(http://itsearch.ccidnet.com):塞迪网是国内著名的面向IT行业提供全面信息服务的垂直门户站点。 • 因特网法律资源指南(Internet Legal Resource Guide ,简称ILRG。(http://www.ilrg.com):是1995年 美国推出的第一家系统、全面提供法律网络信息资源导航网站。它选择收集了来自238个国家、地区的4000多个与法律密切相关的网站,提供了较全面的法律信息检索。 信息素养-培训课件 26 2011-2012年
搜索引擎简介-8 • 中文多元型搜索引 擎 • 多元搜索引擎又称为集合式搜索引擎。它是将多个搜索引擎集成在一起,通过一个统一的检索界面方便、快速、全面获取网络信息的检索工具。 • 万维搜索引擎(http://www.widewaysearch.com):是上海万维信息技术有限公司2000年推出的多元搜索引擎。 • 网络灯塔(http://www.haiyan.com/steelk/navigator/gbindex.htm):集成了50多个中文搜索引擎,分别提供简繁体中文网站、网页和新闻的多元信息搜索服务。 信息素养-培训课件 27 2011-2012年
搜索引擎简介-9 • 英文多元型搜索引擎 • Dogpile(http://www.dogpile.com):是因特网上最早出现也是影响最大的多元搜索引擎。 Dogpile集成了21个不同类型的搜索引擎,按照检索对象可以将这些检索工具分成6种类型:Web页、图像、FTP文件、新闻组、多媒体。系统支持的运算功能与运算符主要有4种:AND,+;OR;NOT,-;词组短语(用双引号)。 • MetaCrawler(http://www.metacrawler.com) :是因特网上最有影响的多元搜索引擎之一,也是最典型的综合型集成搜索引擎。 信息素养-培训课件 28 2011-2012年
网上各类型信息资源查询-1 • 数字图书馆 • 中国数字图书馆 • 书生之家数字图书馆 • 超星数字图书馆 • 北大方正的Apabi系统 • 报刊资料 • 中国学术期刊网 • 中文科技期刊数据库 • 万方数据资源系统。 信息素养-培训课件 30 2011-2012年
网上各类型信息资源查询-2 • 会议文献 • 中国科学院学术会公告 • 学界动态 • IEEE学术会议数据库 • 万方学术会议文献数据库 • 中国重要会议论文集全文数据库 • 国内专业会议资料数据库 • OCLC的会议文献数据库 • 美国科学信息研究所( ISI )会议数据库。 信息素养-培训课件 31 2011-2012年
网上各类型信息资源查询-3 • 学位论文 • 中国学术期刊网 • 万方数据资源系统的学位论文数据库 • 高校学位论文数据库 • PQDD数据库(美国) • 专利文献 • 中国专利信息网 • 国家知识产权局 • DILAOG系统 • 世界知识产权组织专利数据库 • 美国专利商标局专利检索数据库 信息素养-培训课件 32 2011-2012年
网上各类型信息资源查询-4 • 标准类 • 中国标准咨询网 • 万方数据资源系统标准数据库 • 国际标准化组织 • 美国国家标准委员会 信息素养-培训课件 33 2011-2012年
参考文献 [1] 彭志宏,王家驹主编.现代图书馆信息检索与利用.郑州:郑州大学出版社,2008 . [2]汤林芬主编.文献检索.长春:吉林大学出版社,2008 . [3]张海政等编.信息检索.合肥:安徽科学技术出版社,2007 . [4]袁学松,宋雯菲主编.现代信息检索.北京:中国水利水电出版社,2007 . 信息素养-培训课件 34 2011-2012年
欢迎交流与咨询 Email:lhgyy425@163.com