1 / 48

第 2 章 网络信息资源检索概论

第 2 章 网络信息资源检索概论. 目 录. Internet 概述. 1. 网络信息资源概述. 2. 网络信息资源检索. 3. 2.1 Internet 概述. 2.1.1 Internet 的起源与发展 2.1.2 Internet 基础概念. 2.1.1 Internet 的起源与发展. 1. Internet 的起源

farren
Download Presentation

第 2 章 网络信息资源检索概论

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第 2章 网络信息资源检索概论

  2. 目 录 Internet概述 1 网络信息资源概述 2 网络信息资源检索 3 网络信息资源检索概论

  3. 2.1 Internet概述 • 2.1.1 Internet的起源与发展 • 2.1.2 Internet基础概念 网络信息资源检索概论

  4. 2.1.1 Internet的起源与发展 • 1. Internet的起源 Internet是世界上规模最大、覆盖面最广、信息资源最为丰富的计算机信息资源网络。它是将遍布全球各个国家和地区的计算机系统连接而成的一个计算机互联网络。从技术角度看,Internet是一个以TCP/IP作为通信协议连接各国、各地区、各机构计算机网络的数据通信网络;从资源角度来看,它是一个集各部门、各领域的各种信息资源为一体的供网络用户共享的信息资源网络。 网络信息资源检索概论

  5. 2.1.1 Internet的起源与发展 • 1. Internet的起源 商业化全盛时期 ARPAnet NSFnet 1969年 1985年 1995年 网络信息资源检索概论

  6. 2.1.1 Internet的起源与发展 • 2. Internet在中国的发展 1987至1993年 1994年4月 2005年6月 是Internet在中国的起步阶段。在此期间,以中国科学院高能物理研究所为首的一批科研院所与国外机构合作开展一些与Internet联网的科研课题 。 中关村地区教育科研示范网NCFCnet,以专线形式连入Internet, 标志着我国正式加入Internet行列。 中国网民数和宽带上网人数仅次于美国,位居世界第二。 网络信息资源检索概论

  7. 2.1.1 Internet的起源与发展 • 3. Internet特点 • (1)Internet是一个虚拟的计算机网络 Internet是一个结构松散、分布式控制的网络,包含了无数个相互协作的网络,他们通过彼此协调和相互制约来保证彼此连接和资源共享的实现,网络运行不受任何政府或组织的管理和控制。网络上的用户既是网络资源的提供者,又是网络资源的索取者。 • (2)Internet采用TCP/IP技术 TCP/IP协议是目前最成功的网络体系结构和协议规范,该协议实现了各种机型和各种类型网络的互连,实现了网络间的通信及数据的交换。 网络信息资源检索概论

  8. 2.1.1 Internet的起源与发展 • 3. Internet特点 • (3)Internet具有丰富的网络信息资源 Internet是一个巨大的信息资源库,它不仅提供了各类丰富的信息资源,还提供了一批强有力的信息资源检索工具,人们可以利用这些工具方便地检索到所需要的信息资源。 网络信息资源检索概论

  9. 2.1.2 Internet基础概念 • 1. WWW 万维网(World Wide Web,WWW)也称为全球信息网或Web,是一种基于HTTP协议的网络信息资源,是建立在超文本、超媒体技术基础上,集文字、图形、图像、声音为一体,以直观的图形界面展现和提供信息的网络信息资源。由于其使用简单、功能强大,目前是Internet上发展最快、规模最大、资源最丰富的一种网络信息资源形式,是Internet信息资源的主流。 网络信息资源检索概论

  10. 2.1.2 Internet基础概念 • 2. TCP/IP Internet是由众多运行不同操作系统的不同类型计算机连接而成的计算机互联网络,为使这些计算机之间能协同工作,共享彼此的资源,就必须使Internet上有一套用来规范网络的通信语言,即网络协议。TCP和IP就是这套协议中最基本、最重要的2个协议。 TCP是传输控制协议(Transfer Control Protocol,TCP)的缩写,IP是网际协议(Internet Protocol,IP)的缩写,TCP/IP协议是Internet得以存在的技术基础。TCP/IP协议使信息以数据报文的形式在网络上传输。 网络信息资源检索概论

  11. 2.1.2 Internet基础概念 • 2. TCP/IP 当网络用户将信息发往其他计算机时,TCP协议负责将完整的信息分成若干个数据包,并在数据包的前面加入收发节点的信息,然后由IP协议负责将不同的数据包送往接收端,不同的包可能经过的路径不同,在接收端再由TCP协议将数据从包中取出,还原成初始的信息。 TCP/IP协议是一组协议集合的名称,因为在这个协议集合中最重要的是TCP和IP协议,故该协议集合被命名为TCP/IP协议。协议集合中还包括许多其它的协议,如支持E-mail功能的简单邮件传输协议(Simple Mail Transfer Protocol,SMTP),邮局协议(Post Office Protocol,POP),支持FTP功能的文件传输协议(File Transfer Protocol,FTP等等。 网络信息资源检索概论

  12. 2.1.2 Internet基础概念 • 3. IP地址 Internet是基于TCP/IP协议的网络,网络中的每个结点(服务器、工作站、路由器)必须有一个唯一的地址,用来保证通信时准确无误。它是网络位置的唯一标识,称为IP地址。 每个IP地址由32位二进制位组成,8位为一组,共分4个字节段,每个字节段用圆点“.”分隔。由于二进制数不便于理解,所以IP地址一般用十进制数字表示,如202.199.165.1。每个IP地址包括两个部分:网络标识和主机标识。同一个物理网络上的所有主机用一个网络标识,网络中的每一个主机(服务器、工作站、路由器)各有一个唯一的主机标识与之对应。 网络信息资源检索概论

  13. 2.1.2 Internet基础概念 • 4. 域名地址 由于IP地址是以数字来表示主机地址,较难记忆。为了使用和记忆的方便,就产生了更为高级的字符型主机地址,即域名地址。Internet在1984年采用了域名管理系统(Domain Name System,DNS),入网的每台主机都具有与下列结构类似的域名: 主机名.机构名.网络名.最高层域名 域名地址由2-5段英文字符组成,中间用圆点“.”分隔,例如东北财经大学的域名地址为www.dufe.edu.cn,其含义是:主机名.东北财经大学.教育网.中国。域名地址是分级管理的,可分为顶级域、二级域、三级域和三级以下域,其中的顶级域是最高层域名,可由3种类型构成: 网络信息资源检索概论

  14. 2.1.2 Internet基础概念 • 4. 域名地址 第1类是由两个字母组成的国别域名,如表2-1所示。 表2-1 国别域名列表 第2类是国际顶级域,即用“int”代表国际组织的域名。如世界知识产权组织的域名为“wipo.int”。 网络信息资源检索概论

  15. 2.1.2 Internet基础概念 • 4. 域名地址 第3类是通用域名,通用的顶级域涵盖了社会生活的各个领域,常用的通用域名如表2-2所示。 表2-2 通用域名列表 网络信息资源检索概论

  16. 2.1.2 Internet基础概念 • 4. 域名地址 二级域名是仅次于顶级域的第二层域,我国的二级域分别是:com.cn(商业、企业、新闻机构、金融机构等)、net.cn(网络服务机构)、org.cn(非营利机构)、edu.cn(教育机构)、gov.cn(政府机构)、ac.cn(科研机构)。三级域及三级以下域是由用户自己注册的。 域名地址和IP地址之间一般存在一一对应关系,但也有两个域名地址对应一个IP地址或域名地址不变而IP地址改变的情况。Internet上通过域名服务器将域名地址转换为与其对应的IP地址。 网络信息资源检索概论

  17. 2.1.2 Internet基础概念 • 5. 统一资源定位器(URL) 统一资源定位器(Uniform Resource Locator,URL)采用一种统一标准的格式指明Internet上信息资源的位置,Internet通过URL将世界上的联机信息资源组织成有序的结构。URL不仅用于HTTP协议,还可用于FTP、Gopher、Telnet等协议。URL的地址格式如下: 应用协议类型://服务器的主机名(域名或IP地址)/路径名/……/文件名 例如,ftp://ftp.pku.edu.cn/pub/dos/readme.txt表示通过FTP协议,从中国教育与科研网中的北京大学FTP服务器上获取pub/dos路径下的readme.txt文件。 网络信息资源检索概论

  18. 2.1.2 Internet基础概念 • 6. 超文本标记语言(HTML) 超文本标记语言(Hyper Text Markup Language,HTML)是一种专门的编程语言,具体规定和描述了文件显示的格式。它是Web的描述语言,用于编制通过WWW方式显示的超文本文件。它是WWW文件所采用的简单标记语言。 • 7. 浏览器(Browser) 浏览器是提供WWW服务的客户端浏览程序,可向WWW服务器发送服务请求,建立与服务器的联接,并对服务器发来的由HTML语言定义的超文本信息和各种媒体数据格式进行解释、显示和播放。目前WWW环境中使用最多的主流浏览器有Microsoft公司的Internet Explorer(IE)和Netscape公司的Navigator 2种,其它的还有Opera等。 网络信息资源检索概论

  19. 2.2 网络信息资源概述 • 2.2.2 网络信息资源的类型 • 2.2.1 网络信息资源的概念及特点 网络信息资源检索概论

  20. 2.2.1 网络信息资源的概念及特点 • 1. 网络信息资源的定义 网络信息资源(Network Information Resources)是指通过计算机网络可以利用的各种信息资源的总和,即以数字化形式记录的,以多媒体形式表达的,分布式存储在网络计算机的存储介质以及各类通信介质上,并通过计算机网络通信方式进行传递的信息内容的集合。 网络信息资源是通过网络生产和传播的一类电子型信息资源,在Internet这个信息媒体和交流渠道的支持下,网络信息资源日益成为人们获取信息的首选。 网络信息资源检索概论

  21. 2.2.1 网络信息资源的概念及特点 • 2. 网络信息资源的特点 • (1)信息量大、传播广泛 • (2)信息类型多样、内容丰富 • (3)信息时效性强、动态和不稳定 • (4)信息分散无序、但关联程度高 • (5)信息价值差异大、难于管理 网络信息资源检索概论

  22. 2.2.2 网络信息资源的类型 • 1. 按照采用的网络传输协议划分 • (1)WWW或Web信息资源 WWW或Web信息资源是一种典型的基于超文本传输协议(HTTP)的网络信息资源。它是建立在超文本、超媒体技术基础上,集文字、图形、图像、声音等为一体,以网页的形式存在,以直观的图形用户界面展现和提供信息,采用HTTP协议进行传输的一类信息资源形式。WWW或Web信息资源是Internet信息资源的最主要、最常见的形式。这类信息资源一般通过搜索引擎进行检索。 网络信息资源检索概论

  23. 2.2.2 网络信息资源的类型 • 1. 按照采用的网络传输协议划分 • (2)FTP信息资源 FTP信息资源是指借助于FTP (File Transfer Protocol,FTP)访问Internet上各种FTP服务器,以文件方式在联网计算机之间传输的信息资源。FTP服务器有“注册用户”登录和“匿名”登录2种服务方式。 获取FTP资源的一般操作步骤是: ① 登录FTP服务器。 ② 浏览并保存资源。 网络信息资源检索概论

  24. 2.2.2 网络信息资源的类型 • 1. 按照采用的网络传输协议划分 • (3)Telnet信息资源 Telnet信息资源是指在远程登录协议(Telecommunication Network Protocol,Telnet)的支持下,用户计算机经由Internet连接并登录远程计算机,使自己的本地计算机暂时成为远程计算机的一个终端,进而可以实时访问,并在权限允许的范围内实时使用远程计算机系统中的各种硬件资源和软件资源。 使用Telnet信息资源的一般步骤是: ① 连接和登录。 ② 访问相关资源。 网络信息资源检索概论

  25. 2.2.2 网络信息资源的类型 • 1. 按照采用的网络传输协议划分 • (4)新闻组(Usenet Newsgroup)信息资源 Usenet Newsgroup是一种利用网络环境提供专题讨论服务的应用软件,是Internet服务体系的一部分。在此体系中,有众多的新闻组服务器,它们接收和存储有关主题的消息供用户查阅。它们实质上是由一组对某一特定主题有共同兴趣的网络用户组成的电子论坛,用户在自己的主机上运行新闻组阅读程序(Newsreader),申请加入某个自己感兴趣的新闻组,便可以从服务器中读取新闻组信息,同时也可以将自己的见解发送到新闻组中,供其他用户参考。新闻组信息资源是一种最丰富、自由、最具开放性的信息资源。目前网上已有上万个新闻组,并有一套命名规则来区分各自的主题范围。 网络信息资源检索概论

  26. 2.2.2 网络信息资源的类型 • 1. 按照采用的网络传输协议划分 • (5)电子邮件(E-mail)信息资源 电子邮件(Electronic Mail,E-mail)指借助网络彼此传递信息的快速、高效、廉价的现代化通信方式。用户只要知道收件人的邮箱地址,利用计算机网络就可以将信件发送给对方,也可以接收来自世界各地的邮件。利用电子邮件可以发送或接收文字、图像、声音、动画等各种形式的信息。用户可以向提供电子邮件服务的机构提出申请,以免费或付费的方式拥有自己的电子邮箱,通过自己拥有的电子邮箱来利用该类信息资源。 网络信息资源检索概论

  27. 2.2.2 网络信息资源的类型 • 1. 按照采用的网络传输协议划分 • (6)Gopher信息资源 Gopher是一种基于菜单的网络服务程序,能为用户提供广泛、丰富的信息,并允许用户以一种简单、一致的方式快速找到并访问所需的网络资源。用户的全部操作是在各级菜单的指引下,逐层展开菜单,在菜单中选择项目和浏览相关内容,就完成了对因特网上远程联机计算机信息系统的访问,而无需知道信息的存放位置和掌握相关的操作命令。这反映了Gopher的另一优势,即它可以跨越多个计算机系统,运行本地计算机的Gopher客户程序就可以与世界各地任何一个Gopher服务器连接并共享信息。此外,Gopher还设有工具转换接口,可直接调用其他的信息资源检索工具或转入其他的服务器,如WWW、FTP、Telnet、WAIS、Archie服务器等。 网络信息资源检索概论

  28. 2.2.2 网络信息资源的类型 • 1. 按照采用的网络传输协议划分 • (7)WAIS信息资源 广域信息服务器(Wide Area Information Servers,WAIS)是一种双层客户机/服务器结构的网络全文信息资源和检索体系,允许用户在不同结构的远程数据库之间进行信息传输,检索其数据库中的信息。网上有数百个免费的WAIS数据库可供检索,可通过访问匿名服务器ftp://ftp.wais.com/pub.directory-of-servers,了解所需信息存放的WAIS服务器后,再通过相应的WAIS服务器查询所需的数据库。 网络信息资源检索概论

  29. 2.2.2 网络信息资源的类型 • 2. 按照网络信息资源的组织形式划分 • (1)文件 以文件方式组织网络信息资源比较简单方便,除文本信息外,还适合存储图形、图像、音频、视频等非结构化信息。在Web中,网页就属于超文本文件,FTP类检索工具就是用来帮助用户利用那些以文件形式组织和保存的信息资源。但是文件方式对结构化信息的管理则显得力不从心,文件系统只能涉及信息的简单逻辑结构,信息结构较为复杂时,就难以实现有效的控制和管理。而且,随着网络信息量的不断增长和用户对网络信息资源利用的普及,以文件为单位进行信息资源共享和传输会使网络负载加大。所以,文件本身只能是海量信息资源管理的辅助形式,或作为信息单位成为其他信息组织方式的管理对象。 网络信息资源检索概论

  30. 2.2.2 网络信息资源的类型 • 2. 按照网络信息资源的组织形式划分 • (2)超文本/超媒体 超文本/超媒体方式是将网络信息按照相互关系非线性存储在许多的节点(Node)上,节点间以链路(Link)相连,形成一个可任意连接的、有层次的、复杂的网状结构。超文本方式以线性和静态的文本信息为处理对象,超媒体方式是超文本和多媒体技术的结合,将文字、图表、声音、图像、视频等多媒体信息以超文本方式组织。它体现了信息的层次关系,用户既可以根据链路的指向进行检索,也可根据自己的需要任意选择链路进行信息的检索。正是由于上述优点,超文本/超媒体方式已成为Internet上占主流地位的信息组织与检索方式。但对于一些大型的超文本/超媒体检索系统,由于涉及的节点和链路太多,需要设立导航工具以便用户到达想去的节点。 网络信息资源检索概论

  31. 2.2.2 网络信息资源的类型 • 2. 按照网络信息资源的组织形式划分 • (3)数据库 数据库是对大量的规范化数据进行管理的技术,它将要处理的数据经合理分类和规范化处理后,以记录形式存储于计算机中,用户通过关键词及其组配查询,就可以找到所需信息或其线索。利用数据库技术进行网络信息资源的组织可提高信息的有序性、完整性、可理解性和安全性,提高对大量的结构化数据的处理效率。此外,集Web技术和数据库技术于一体的Web数据库已成为Web信息资源的重要组成部分,所存储的都是经过人工严格收集、整理加工和组织的具有较高的学术价值、科研价值的信息。由于各个数据库后台的异构性和复杂性,及对其使用的限制,因此必须利用各个数据库的专用检索系统进行检索。 网络信息资源检索概论

  32. 2.2.2 网络信息资源的类型 • 2. 按照网络信息资源的组织形式划分 • (4)网站 网站(Web Site)是网络信息资源的重要组成部分,既是信息资源开发活动中的要素,又是网络中的实体。从网络的组织结构可以看出,信息资源主要分布在网站上,网站作为网络信息资源与网络用户之间的中介,集网络信息提供、网络信息组织和网络信息服务于一体,其最终目的是将网络信息序化、整合,向用户提供优质的信息服务。网站由一个主页和若干个从属网页构成,它将有关的信息集合组织在一起。网站一般综合采用了文件方式、超文本/超媒体方式和数据库方式来组织信息和提供信息的检索。Yahoo!、Open Directory Project之类的网络资源指南是获取网站信息的检索工具。 网络信息资源检索概论

  33. 2.3 网络信息资源检索 • 2.3.1 网络信息资源检索的特点 • 2.3.2 网络信息资源检索的方法和途径 • 2.3.3 网络信息资源检索工具 网络信息资源检索概论

  34. 2.3.1 网络信息资源检索的特点 • 1. 检索范围大 • 2. 用户界面友好 • 3. 交互式作业方式 • 4. 传统检索技术和网络检索技术相融合 • 5. 信息检索效率高 • 6. 信息冗余大 网络信息资源检索概论

  35. 2.3.2 网络信息资源检索的方法和途径 • 1. 浏览 浏览一般是指超文本文件结构的信息浏览,即用户在阅读超文本文档时,利用文档中的超链接从一个网页转到另一个相关网页。浏览是在Internet上发现、检索信息的原始方法。这种检索方法的特点是不依靠任何检索工具,检索的目的性不强,检索结果具有不可预见性。 网络信息资源检索概论

  36. 2.3.2 网络信息资源检索的方法和途径 • 2. 利用目录型网络资源检索工具 目录型网络资源检索工具是专业人员基于对网络信息资源的产生、传递与利用机制的广泛了解,和对网络信息资源分布状况的熟悉,以及对网络信息资源进行采集、评价、组织、过滤和控制等手段的全面把握,而开发出的可供用户浏览和检索的多级主题分类体系。用户通过浏览其分类目录索引数据库,通常称为目录(Catalog),在目录体系上下位类的从属、并列等关系导引下层层递进,不断深入,随着目录类范围的缩小,查询的专指度逐步提高,最终使用户发现、检索到自己所需要的相关信息。目录型资源检索工具所采用的分类法主要有主题分类法、学科分类法和图书分类法。 网络信息资源检索概论

  37. 2.3.2 网络信息资源检索的方法和途径 • 2. 利用目录型网络资源检索工具 使用分类目录进行检索的基本步骤是: (1)在Web浏览器中,根据URL地址,打开搜索工具的主页; (2)在计算机屏幕上根据分类目录的结构从顶层逐步向下查询子目录; (3)选择需要的类目,单击进入选定目录的下一级子目录或者进入一组站点列表; (4)选择需要的站点,单击站点名称,实现链接; (5)检索结果的显示与选择。 网络信息资源检索概论

  38. 2.3.2 网络信息资源检索的方法和途径 • 2. 利用目录型网络资源检索工具 目录型网络资源检索工具主要适用于以下2种类型的检索: ① 当用户进行较为笼统的主题浏览和检索时,它允许用户从等级目录中任意选择检索范围,对这些不同深度的主题类目进行浏览和检索。 ② 当用户对某一类型的信息资源的描述不确定或尚未形成精确的检索概念时,通过浏览目录型网络资源检索工具的分类体系,就可获取较为全面、系统的相关信息。 目录型网络资源检索工具由于人工的干预提高了检索结果的相关性,但其数据库规模较小,检索到的信息资源数量有限,且其更新、维护的速度和周期受系统人员工作效率的制约。 网络信息资源检索概论

  39. 2.3.2 网络信息资源检索的方法和途径 • 3. 利用索引型网络资源检索工具 利用索引型网络资源检索工具是最为常规、普遍的网络信息资源检索方式。索引型网络资源检索工具中的自动跟踪索引软件自动在网络上漫游,收集各种网络信息并形成索引数据库,而索引型网络检索工具中的检索代理软件则根据用户提出的检索要求,代替用户在数据库中进行检索,并将检索结果提供给用户。它支持布尔检索、词组检索、截词检索等功能,可以方便、快速获取广泛、及时的信息。 索引型网络资源检索工具是提供给用户进行关键词、短语或自然语言检索的工具,适用于主题较为专指、狭窄的查询。 网络信息资源检索概论

  40. 2.3.2 网络信息资源检索的方法和途径 • 3. 利用索引型网络资源检索工具 利用索引型网络资源检索工具进行检索的主要步骤是: (1)根据URL地址,调用该查询工具的主页; (2)在计算机屏幕上的信息检索输入框中,键入关键词或查询短语; (3)查询提交后, 搜索索引立即进行实时交互式的信息查询; (4)显示搜索结果。结果页面通常包括一系列资源标题和相应的资源描述,以及指向这些资源的链接。通过资源标题和URL地址,可以进一步搜索希望得到的信息。 网络信息资源检索概论

  41. 2.3.3 网络信息资源检索工具 • 1. 网络信息检索工具构成 • (1)信息采集子系统 网络信息检索工具的信息采集包括人工采集和自动采集2种方式。人工采集由专门信息人员跟踪和选择有价值的网络信息资源,并按一定的方式进行分类、组织、标引并组建成索引数据库。自动采集是通过采用一种被称为Robot(也被称为Spider、Crawler等)的网络自动跟踪索引程序来完成信息采集,由Robot在网络上检索文件并自动跟踪该文件的超文本结构,并循环检索被参照的所有文件。它穿行于网络信息空间,访问网络中公共区域的各个站点和网页,记录其网址,标引其内容,并组织建立索引文档,形成供检索的数据库。同时还继续跟踪该网页内链接的其他网页,确认链接的合法性。 网络信息资源检索概论

  42. 2.3.3 网络信息资源检索工具 • 1. 网络信息检索工具构成 • (2)数据库 信息采集子系统采集和标引的信息,通过数据库管理系统软件的组织,形成数据库,作为网络信息检索工具提供检索服务的基础。不同网络信息检索工具的数据库收录范围不一样,数据库收录网络信息资源的数量有很大差异,数据库中记录的网络信息资源内容也不相同。一般数据库中提供的网络资源内容有网站名称、关键词、网页URL、网页摘要、相关的超文本链接点等。由于数据库的规模和质量直接影响检索的效果,因此,需要对数据库数据进行及时的更新和处理,以保证数据库能准确地反映网络信息资源的当前状况。 网络信息资源检索概论

  43. 2.3.3 网络信息资源检索工具 • 1. 网络信息检索工具构成 • (3)检索代理软件 当用户提出检索要求时,由检索软件负责代理用户在数据库中进行检索,并对检索结果进行计算、评估、比较,按检索结果与检索要求的相关程度排序后提供给用户。不同的网络检索工具所采用的检索机制、算法有所不同,布尔逻辑检索是较普遍采用的一种检索机制。 网络信息资源检索概论

  44. 通过数据采集子系统广泛收集网络信息资源数据,并对数据进行一系列的判断、选择、标引、加工、分类、组织等处理 。 2.3.3 网络信息资源检索工具 • 2. 网络信息检索工具的工作原理 用户根据自己的检索要求, 构造并通过检索页面输入检索提问;检索软件对用户的检索提问进行识别和判断都代理用户在数据库中检索,并将结果提交给用户。 利用数据库管理系统来组织并形成供检索使用的数据库,创建目录索引 ,并以Web页面的形式向用户提供有关的资源导航、目录索引及检索界面。 网络信息资源检索概论

  45. 2.3.3 网络信息资源检索工具 • 3. 网络信息资源检索工具的类型 • (1)按检索内容分类 ① 综合型。如Yahoo!、AltaVista、Excite等就属于此类工具。 ② 专科型。如SOSIG、CSTR、Healthcare、Medical World Search等。 ③ 特殊型。如检索电话号码的555-1212,查询地图的MapBlast、查询图形图像的Yahoo!Gallery、WebSEEK等。 网络信息资源检索概论

  46. 2.3.3 网络信息资源检索工具 • 3. 网络信息资源检索工具的类型 • (2)按检索的信息资源类型分类 ① 非Web资源检索工具。非Web检索工具主要以非Web资源,如FTP信息资源、Gopher信息资源、Telnet信息资源和Usenet信息资源等特殊类型的信息资源为检索对象的检索工具。 ② Web资源检索工具。Web资源检索工具是以超文本技术在Internet上建立的一种提供网上信息资源导航、检索服务的专门的Web服务器或Web网站。搜索引擎(Search Engines)是Web资源检索工具的总称,泛指网络上提供信息检索服务的工具和系统。 网络信息资源检索概论

  47. 2.3.3 网络信息资源检索工具 • 4. 网络信息资源检索工具的评价 • (1)收录范围 • (2)检索功能 检索功能的评价主要从以下几方面进行: ① 检索方式; ② 检索技术; ③ 检索限定。 • (3)检索效率 目前衡量检索工具检索效率的指标以查全率和查准率为主,此外,还有响应时间、联机容易程度等因素。 • (4)检索结果处理 • (5)用户界面设计 网络信息资源检索概论

  48. 习 题 2 2.1 思考题 • 1. 简述Internet在我国的发展。 • 2. 简述TCP、IP、TCP/IP三者的含义。 • 3. 什么是网络信息资源?按照传输协议来划分,网络信息资源可以分为哪几种主要的类型? • 4. 作为网络信息资源的组织形式之一,“网站”具有什么特点? • 5. 简述网络信息资源检索的主要方法和途径。 • 6. 简述网络信息资源检索工具的主要工作原理。 • 7. 按照检索的信息资源类型来划分,网络信息资源检索工具可以分为哪几种主要类型?他们有什么样的发展特点? • 8. 试说明如何评鉴网络信息资源检索工具。 网络信息资源检索概论

More Related