710 likes | 870 Views
信息检索(二) 有效利用因特网. Internet 的基本概念. TCP/IP 协议 该协议既是一种网络体系结构,又是一种通信协议标准, 网上计算机使用的一种公用语言的规范。 IP 地址和域名系统 为了在网络环境下实现计算机之间的通信,网络中的任何一 台计算机必须有一个不允许重复的地址,这个唯一的地址将保证数据传输准确无误。 Internet 用两种方法来标识网络上的计算机,即 Internet 地址( IP 地址)和域名系统。
E N D
Internet的基本概念 • TCP/IP协议 该协议既是一种网络体系结构,又是一种通信协议标准, 网上计算机使用的一种公用语言的规范。 • IP地址和域名系统 为了在网络环境下实现计算机之间的通信,网络中的任何一 台计算机必须有一个不允许重复的地址,这个唯一的地址将保证数据传输准确无误。 Internet用两种方法来标识网络上的计算机,即Internet地址(IP地址)和域名系统。 • IP地址是一组数字,它描述了一台计算机与Internet上的网络之间的物理连接。IP地址由网络管理机构分配给入网主机。 IP地址是一个32位二进制数字,通常表示成4组十进制数字, 每个数字可取值0一255,其间用“.”号分开,如同济医学院的IP地址是202.114.128.4。 • 域名的一般结构如下:计算机主机名.机构名.网络名.最高层域名,每个层次为域,各个层次之间用“.”号分隔,从左向右域层逐级上 升。如华中科技大学图书馆域名为:lib.hust.edu.cn。Internet实际使用的是IP地址,一个IP地址可以对应多个域名或不对应域名,但一个域名必须对应一个IP地址。
Internet的基本概念 • 统一资源定位器(Uniform Resource Locator,URL) 为了确定具体信息资源在网络中的位置,Internet使用URL来描述具体资源和位置。 URL的组成结构为:应用协议、主机地址以及文件名。其中主机地址可以是域名,也可是IP地址。 如: http://www.yahoo.com, http://202.115.40.7/index.htm。 • Internet的接入方式: 拨号接入方式 专线接入方式 • WWW体系结构WWW采用分布式客户机/服务器体系,客户机运行浏览器软件(Internet Explorer 或Netscape),通过浏览器阅读HTML语言编写的超文本,通过HTTP协议和TCP/IP协议向URL对应的服务器发送调用特定 资源的请求。服务器则运行服务器软件和存储各种信息资源,而且这些资源多用了HTML语言编制的超文本文件,也即网页。服务器在接受客户机请求后调出指定文件,通过HTTP协议和TCP/IP协议向客户机返回指定资源。客户机上的浏览器根据资源的文件格式进行相应的显示。
网络信息资源 • 网络信息资源(Network Information Resources)是通过计算机网络可以利用的各种信息资源的总和。 • 按照信息加工层次可分为网络资源指南搜索引擎、联机馆藏目录、网络数据库、电子期刊、电子图书、电子报纸、参考工具书和其他动态信息 。
网络信息资源特点 • 1.以网络为传播媒体信息的存储和查询更加方便,而且存储信息密度高、容量大,可以无损耗地被重复利用。 • 2.以多媒体为内容特征Internet上的信息资源的存储和处理采用文本、超文本、多媒体和超媒体形式。超文本形式的信息资源是按知识单元及其关系建立的知识结构网络。它通过网上各节点的链接把相关信息(文字信息、图片、地图和其他直观信息)有机地编织在一个网状结构内,检索用户能够从任何一个节点开始,从不同角度检索到感兴趣的信息。超文本信息资源是人机交互式的,可随时调用、检索和存储信息。 • 3.以现代信息技术为记录手段 网络信息以数字形式存在,可以借助网络进行远距离传播,从而使全球信息资源的共享成为可能。
网络信息资源特点 • 4.数据结构具通用性、开放姓和标准化 数据结构的通用性、开放性和标准化使得信息资源易于扩充,各个系统之间易实现互联和互操作。 • 5.具高度的整合性、便于多种媒体一体化 易于实现各种网络资源的相互转化和二次开发,在新的平台上形成新的综合性信息产品,便于检索,增加了信息资源的利用价值。 • 6.交互性能增强 传播方式的多样性、交互性, 具有潜在活力,也最具表现力。 从多方面贴近人们的生活 。
(一)网络资源指南和搜索引擎 • 各种各样的Intemet网络信息检索工具有数干个,根据提供检索与否,有资源指南和搜索引擎之分。 • 资源指南是按主题的等级排列的主题类目索引,类别目录按 一定的主题分类体系组织,排列方法有字母顺序法、时序法、地序法、主题法等或是各种方法综合使用。用户通过逐层浏览类别目录、逐步细化的方式来寻找合适的类别直至具体资源。资源指南是人工编制和维护的,在信息的收集、编排、HTML编码以及信息注解上要花大量的人力物力。 • 搜索引擎则强调的是它的检索功能,能提供布尔逻辑检索、短语或邻近检索、模糊检索、自然语言检索等方式查询信息。搜索引擎的数据库主要是由机器人自动建立的,不需人工干预。常见的搜索引擎有Yahoo!、Google等。
综合搜索引擎Yahoo(http://www.yahoo.com) • Yahoo最具特色的是它的分类类目覆盖广泛、层次丰富、分类仔细,它提供14个宽泛的类目 ,各大类下面又细分为若干小类。 • 主题查询方式 通过简单关键词或关键词高级检索方式进行信息查询。
Yahoo分类浏览 • 共分14个大类,其下再根据应用习惯再做多层进一步的细分。可按需逐层浏览。
Yahoo网页搜索 • 可进行多种限制以获得更优结果,本例欲查姚明在NBA的有关情况。
Yahoo网页搜索结果 • 执行一次检索,返回多种类型的结果。
直达与检索词最相关的网页 综合搜索引擎Google(http://www.google.com) • 简单易用
禽流感 Google-手气不错
Google高级检索 • 可作多种限制使检索结果跟贴近需求。
综合搜索引擎天网(http://e.pku.edu.cn) • 天网中英文理索引擎由北京大学计算机系网络与分布式系统研究室研制开发,因是教育网内的搜索引擎,对校园网的用户来说,比用其他搜索引擎速度要快。
专用搜索引擎Medical Matrix(http://www.medmatrix.org) • 需注册后方可使用其全部资源
(二)联机馆藏目录 • 网络上有许多机构提供的馆藏书目信息、中外文期刊联合目录信息。其中包括各图书馆和信息机构提供的公共联机检索(OPAC)馆藏书目、地区或行业的图书馆的联合目录等。 • 中国国家图书馆在网上提供图书目录在线检索,有题名、责任者、出版者、关键词、标准书刊 号、分类号、出版地、出版国等10个检索途径。 • 全国高等教育文献保障体系(CALIS) (http://www.calis.edu.cn)提供61所高校的馆藏期刊、书目和学位论文联合查询。
国家图书馆 • 国家图书馆联机公共目录查询系统
国家图书馆 • 选著者字段用“魏和”做检索词检索
(三)网络数据库 • 网络数据库包括综合性和专业性期刊数据库、专利数据库等信息资源。这类信息资源可分为商业性和非商业性的数据库。这些数据库由专门的信息机构或公司专业制作和维护,信息质量高,是专业领域内常用数据库。 • 非商业性数据库因为免费使用,用户以较低的成本可获得所需的信息,所以也有很高的吸引力。如:IBM公司的免费专利文献数据库,提供美国专利的免费检索,用户可检索到1971 年以来的美国专利说明书的内容,包括专利书目信息和专利项, 浏览1974年以来的专利文献中的附图。
中国期刊网(同济医学院镜像http://192.168.132.8:1080/)中国期刊网(同济医学院镜像http://192.168.132.8:1080/) • 提供分类浏览和检索两种途径
有关生命质量的文章有206篇 每页显示10篇 中国期刊网-检索途径 • 中文摘要中含有“生命质量”
中国期刊网-结果保存 • 可选择在当前位置打开或保存到硬盘。 • 本数据库中的全文是.caj 或.kdh格式的,需要在本机上安装caj浏览器后才能浏览全文。
翻页按钮 文本识别 中国期刊网-全文显示
中国期刊网(华中科技大学镜像http://www.wh.cnki.net)中国期刊网(华中科技大学镜像http://www.wh.cnki.net) cnkikw • 主校区镜像可查医学及农业外其他所有学科的全文
万方数据库(http://192.168.132.6:85/) • 医药期刊、医药专利和学位论文可查全文。
维普中文科技期刊数据库(http://202.114.9.8:1012/)维普中文科技期刊数据库(http://202.114.9.8:1012/)
Pubmed-外文最全(http://www.ncbi.nlm.nih.gov/pubmed)Pubmed-外文最全(http://www.ncbi.nlm.nih.gov/pubmed)