1 / 74

第五章 互联网信息综合查询 第一节 互联网基础知识

第五章 互联网信息综合查询 第一节 互联网基础知识. 一、互联网技术举要 二、互联网信息的特点 三、互联网信息的的评价与鉴别. 一、互联网技术举要. (一) IP 地址及域名 (二)万维网 (World Wide Web, WWW, Web) (三) Web 2.0 (四) 局域网代理服务器设置. (一) IP 地址及域名. IP 地址 互联网标识上网主机地址的编号 IPv4 协议规定的 IP 地址长度为 32 位,由四组小于 256 的十进制构成 例: 202.38.185.67 该 IP 是北京邮电大学图书馆技术部的一台主机.

Download Presentation

第五章 互联网信息综合查询 第一节 互联网基础知识

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第五章 互联网信息综合查询第一节 互联网基础知识

  2. 一、互联网技术举要 二、互联网信息的特点 三、互联网信息的的评价与鉴别

  3. 一、互联网技术举要 (一)IP地址及域名 (二)万维网 (World Wide Web, WWW, Web) (三)Web 2.0 (四)局域网代理服务器设置

  4. (一)IP地址及域名 • IP地址 • 互联网标识上网主机地址的编号 • IPv4协议规定的IP地址长度为32位,由四组小于256的十进制构成 例: 202.38.185.67 该IP是北京邮电大学图书馆技术部的一台主机

  5. (一)IP地址及域名 • 域名(Domain) • 为了便于记忆而产生的与数字IP地址对应的字符型IP地址。(需申请注册) • 典型的域名由4个部分组成 例:www.fudan.edu.cn 从左至右四段依次为:主机名、三级域名、二级域名和顶级域名,其顶级域名为国别顶级域名。 • 有的域名只有3个部分 例:www.nih.gov 此类域名的顶级域名是网络类别代码。

  6. 常用网络类型代码 com 商业机构 org 非营利组织 edu 教育机构 gov 政府部门 net 网管组织 int 国际组织 mil 军事部门 info 信息机构 其他:.museum .coop .aero .pro……

  7. (二)万维网(World Wide Web, WWW, Web) • 万维网:基于超文本传输协议(http协议),通过含有超级链接的超文本(Hypertext)方式来进行网上信息浏览的工具。 • 统一资源定位器(URL):即网址 • 网站与网页 • 网页:万维网的上网主机中提供访问的一个网页文件 • 网站:是网页的集成,一般来说,网站是机构或个人用于介绍自己或提供服务的站点,即一个网站一般代表一个机构(或个人)

  8. (三)Web 2.0 • 以Blog、TAG、SNS、RSS、Wiki百科等应用为核心,依据六度分隔、xml、ajax等新理论和技术实现的互联网新一代模式 • 可以读写的互联网, Web1.0我们网上冲浪,Web2.0我们是波浪制造者。 • 让互联网找回Internet的真正含义:平等、交互、去中心化。

  9. (四)局域网代理服务器设置 • IE浏览器的“工具”下拉菜单→选择“Internet 选项”→点击“连接”选项卡→单击对话框右下方的“局域网(LAN)设置”按钮。

  10. 二、互联网信息的特点 • 无序性:信息杂乱无序,网页的变化、更迭、新生、消亡等随时发生 • 多样性:文件格式多样,内容包罗万象 • 新颖性:网上实时播报、网络新媒体中信息在第一时间被披露 • 对话性:更多直接交流的机会,零次信息多 • 开放性:大量灰色文献、边缘文献反映了原始数据和第一手资料

  11. 三、互联网信息的评价与鉴别 • 范围:网页性质、主题领域、目标用户层次、信息深度、时间范围、类型等 • 准确性:有明确的来源出处、标注网页责任者、信息客观性等 • 权威性:主办者资质、核实信息的方式、版权保护 • 新颖性:信息是否动态更新

  12. 三、互联网信息的评价与鉴别 • 独特性:信息提供的优势、特别的服务功能等 • 稳定性:网站连接及检索的速度、链接清楚且维护良好 • 费用:上网连通费用、全文等信息及服务是否要付费

  13. 第二节 搜索引擎

  14. 一、搜索引擎概述 二、通用搜索引擎 三、学术资源搜索引擎 四、其他搜索引擎

  15. 一、搜索引擎概述 (一)搜索引擎的概念 检索因特网信息最常用的检索工具,它是提供万维网上信息资源检索和导航服务的专门站点或服务器。 (二)搜索引擎的种类 • 独立搜索引擎 • 元搜索引擎

  16. (二)搜索引擎的种类 • 独立搜索引擎 • 通过搜集万维网的网页信息,建立自己独立的网络信息数据库供用户检索。 如: Google、Yahoo!、AltaVista、搜狐等 • 元搜索引擎 • 又称集成搜索引擎,自身不采集信息,没有自建的数据库。它将用户搜索请求预处理后,提交给多个选定的独立搜索引擎同时检索,并对返回结果进行整合,以统一的格式输出。 如:Clusty、Ixquick、Mama、MetaCrawler等

  17. 二、通用搜索引擎 • Google(www.g.cn) • Yahoo! Search(http://search.yahoo.com) • 目录查询与网页检索途径比较

  18. (一)Google(www.g.cn)

  19. Google的搜索模块

  20. Google的检索规则 • Google简单检索规则: • 默认检索:必须检索,两词间空格默认and匹配 • 或者检索:OR必须大写 • 排除检索:-表示,减号之前须空格,其后不空格(不能用NOT) • 短语检索:双引号扩起词组或短语 • 对大小写不敏感 • 截词符:* • 自动拼写检查

  21. Google的检索规则 • Google简单检索规则: • 检索词出现位置限定: 标题:allintitle 网址:allinurl 内文:allintext 链接:allinanchor 例:allinurl:acm搜索网址内含单词acm的网页 • 文件类型限定:filetype:文件名后缀 支持13种非HTML文件搜索:pdf, doc, ppt, xls, swf, ps等 • 禁用词(Stop Words): 最常用的字符以及数字等高频词( of, is,的,为, http等),在检索时系统自动忽略不作检索。如果必须检索禁用词时可用+,或“ ”

  22. Google的检索规则 • Gooogle高级搜索 :

  23. Google的检索规则 • Gooogle高级搜索 : • 搜索结果区域 四个检索框内只能输入检索词,不能输入逻辑检索式 • 查询设置区域 可设置每页显示结果数,网页语言、更新日期,检索词出现位置、文件类型 “网域”限定等 • 搜索特定网页区域 可搜索“类似网页”和包含指定“链接”的网页

  24. Google搜索实例 • 例:利用网页搜索查找网页标题中出现chronic low back pain surgery的网页。

  25. Google搜索实例 • 例:利用网页高级搜索查找我国2005年艾滋病的发病率。

  26. Google搜索实例 • 例:利用学术搜索查找有关腰脊柱(lumbar spine)介入(interventional)的英文文献,要求检索词出现在标题中。

  27. Google网页检索结果显示 检出网页总数 检索式 网页标题 文件类型 网页摘录 网址

  28. (二)Yahoo!Search(http://search.yahoo.com)

  29. Yahoo!Search:Directory 网页目录检索 网站目录检索 高级网站目录检索 网站目录浏览

  30. 例:利用Directory的Advanced Search功能查找癌症临床试验的相关网站。 相关分类 检出相关网站数量 相关网站名称 网站简介 网址

  31. 例:利用Directory的目录浏览功能查找有关子宫内膜异位症的专业网站。

  32. (三)关键词检索、目录比较 • 关键词检索:适用于目标明确、主题较狭窄、知识点、事实数据、文献等网页查找。 • 目录检索:适用于目标模糊、主题较宽泛、或是查某专业重要网站。

  33. 三、学术资源搜索引擎 (一)Scirus – for scientific information only (www.scirus.com) (二)Oaister(www.oaister.org)

  34. (一)Scirus Elsevier公司推出的科学搜索引擎,可查询因特网信息、期刊文献、Beilstein文摘、美国专利、NASA技术报告、预印本数据库等。

  35. Scirus的检索规则 • 逻辑运算符:AND、OR、ANDNOT • 截词符:用于单词中的任意位置 • ? 代替一个字符 • * 代替零个或任意个字符 • 字段检索:au:smith(冒号前后不空格) • 可用字段缩写:au(作者),ti(标题), jo(刊名),ke(关键词),url(网址),dom(域名),af(作者单位) • 精确短语匹配:“ ”

  36. Scirus的检索方式 • Basic Search 基本检索 • 输入框:可输入单个或多个检索词,也可输入带运算符的检索式 • Advanced Search 高级检索 • 输入框:两个输入框,可输入检索词或检索式,选择逻辑关系。输入多个不带运算符的检索词时,可选择匹配方式 • 检索限定区域:在该区域可以限定Date(出版时间)、Information type(信息类型)、File formats(文件格式)、Content sources(期刊或网页的出处)、Subject areas(主题领域)

  37. Scirus:Advanced Search 高级检索

  38. Scirus的结果处理 筛选检索结果 按主题提炼检索结果

  39. 例:用Basic Search检索手指损伤手术的期刊文献,并从中筛选出截肢手术的文献。 共15个检索结果 点击浏览期刊文献

  40. (二)Oaister • 美国密执安大学数字图书馆制作服务部主办 • 提供全球900多家机构的开放存档资源 • 信息类型包括电子书、电子期刊、录音、图片及电影等数字化资料 • 可以按协作机构浏览资源,也可以对所有资源进行检索

  41. 四、其他搜索引擎 (一)通用搜索引擎 • Clusty(clusty.com) Vivisimo推出的元搜索引擎 • AlltheWeb(www.alltheweb.com) 独立搜索引擎 • AltaVista(www.altavista.com) 独立搜索引擎 • Open Directory Project(www.dmoz.org) 主题目录型搜索引擎,提供网站分类浏览和检索 • 百度(www.baidu.com) 独立搜索引擎

  42. 四、其他搜索引擎 (二)医学搜索引擎 • Medical Matrix(www.medmatrix.org) 目录型医学搜索引擎 • Healthlinks(www.healthlinks.net) 由专家人工编辑的医学网络资源目录 • BIOME(biome.ac.uk) 生物医学教育与研究网络资源目录 • DIRLINE(dirline.nlm.nih.gov) 美国国立医学图书馆建立的生物医学机构目录

  43. 第三节 免费学术资源的检索

  44. 一、开放获取学术文献检索 二、政府出版物检索 三、公共版权资源检索 四、其他免费学术资源检索

  45. 一、开放获取学术文献检索 (一)开放获取期刊检索 (二)电子印本检索 (三)开放获取机构库检索 (四)开放获取课件检索

  46. (一)开放获取期刊检索 • Directory of Open Access Journal (DOAJ,www.doaj.org) • 瑞典隆德大学(Lund Univ.)开发维护的开放获取期刊目录 • 截至2008年7月9日共提供各学科3487种OA期刊的简介和网站链接,其中生物学期刊317种,生命科学期刊55种,医学期刊978种 • 收录期刊全部有同行评审或编辑质量控制

  47. (一)开放获取期刊检索 • PubMed Central (简称PMC,www.pubmedcentral.nih.gov) • 美国卫生研究院(NIH)和美国国立医学图书馆联合建立的生命科学和生物医学期刊文献免费存档系统 • 凡由NIH资助的研究者发表的学术论文必须在该网站上保存一份数字拷贝,供永久开放存取 • 截至2008年2月14日共收录期刊约469种。

  48. (一)开放获取期刊检索 • BioMed Central (简称BMC,www.biomedcentral.com) • 非营利性学术出版机构,致力于提供生物医学文献的开放获取 • 共出版202种生物医学OA期刊,并在不断出版新的期刊,所有期刊都经同行评审 • 除期刊外,还提供生物医学类开放获取机构库(Open Repository)、著名学者个人开放存档(PeoplesArchive)、生物学图库(Biology Image Library)的查询

  49. (一)开放获取期刊检索 • PLoS Journal (www.plos.org) PLoS(The Public Library of Science) • 成立于2000年,致力于推动全球科技和医学领域文献的免费获取。2002年成立期刊编辑部,成为非营利性组织出版商 • 目前该组织共出版了7种期刊,所有期刊都是OA期刊,且均由同行专家严格评审,拒稿率达90%

  50. (二)电子印本检索 • E-print Network(www.osti.gov/eprints) • 由美国能源部科技信息局建立的电子印本搜索引擎 • 可检索存放在学术机构、政府研究实验室、私人研究组织以及研究人员个人网站上的电子印本资源

More Related