html5-img
1 / 92

网络资源检索

第 4 讲. 网络资源检索. 2013 年 9 月 18 日. 第 4 讲. 1. 2. 3. 第 4 讲. 网络资源概述. 网络资源概述. 第 4 讲. 网络资源概述. 1.Internet 的概念. Internet 因特网是将由 不同 类型的计算机、 不同 技术组成的 各种 计算机网络 ,按照一定的通讯协议相互连接在一起, 使网中的每一台计算机或终端在一个网络中工作,从而实现 网络资源和服务共享 。 Internet 是一个采用 TCP/IP 协议并且能够与网络中任何一台 主机进行通信的计算机网络。. 第 4 讲.

iolani
Download Presentation

网络资源检索

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第 4 讲 网络资源检索 2013年9月18日

  2. 第 4 讲 1 2 3

  3. 第 4 讲 网络资源概述 网络资源概述

  4. 第 4 讲 网络资源概述 1.Internet的概念 Internet因特网是将由不同类型的计算机、不同技术组成的 各种计算机网络,按照一定的通讯协议相互连接在一起, 使网中的每一台计算机或终端在一个网络中工作,从而实现 网络资源和服务共享。 Internet是一个采用TCP/IP协议并且能够与网络中任何一台 主机进行通信的计算机网络。

  5. 第 4 讲 网络资源概述 2.Internet的相关名词术语 1)WWW是world Wide Web的缩略语,万维网,是通过互联网获取信息的一种应用。 以超文本为基础形成的信息网,用户通过它可以查阅Internet上的信息资源。 2)URL是Uniform Resources Locator的缩略语,译为统一资源定位地址,即网址。 URL是在Internet的WWW服务程序上用于指定信息位置的表示方法,它指定了如 HTTP、FTP等Internet协议,是唯一能识别Internet上具体的计算机、目录或文件 位置的命名约定。

  6. 第 4 讲 网络资源概述 照片的Url

  7. 第 4 讲 网络资源概述 2.Internet的相关名词术语 3)FTP是File Transfer Protocol 的缩略语,译为文件传输协议。它是Internet上使用 广泛的一种通信协议,是计算机网络上主机之间传送文件的一种服务协议。 4)HTTP 是HyperText Transfer Protocol 的缩略语,译为超文本传输协议。HTTP定义 了信息如何被格式化、如何被传输,以及在各种命令下服务器和浏览器所采取的响 应。

  8. 第 4 讲 网络资源概述 2.Internet的相关名词术语 5)IP地址IP是Internet Protocol 的缩写,译为互联网协议。连入Internet的计算机或 节点被赋予一个数字地址,称为IP地址。IP地址由四节数字组成,每节数字的取值 范围从0~255,每节数字之间用“.”隔开。 6)TPC/IP是Internet使用的一组协议,TCP是Transmission Control Protocol的缩写,译为传输控制协议。IP负责信息的实际传送, TCP保证所传送的信息是正确的。

  9. 第 4 讲 网络资源概述 2.Internet的相关名词术语 7)局域网(LAN) 是Local Area Network的缩写,一般由一个部门或公司组建, 地理范围是机构内部。 8)区域网(MAN) 是Metropolitan Area Network,覆盖一个城市或地区,地理范围在 100KM一下,也称城域网。

  10. 第 4 讲 网络资源概述 3.网络信息资源 网络信息资源又称虚拟资源、数字资源、联机信息资源,是以数字化 形式记录的,利用计算机技术、通信技术及多媒体技术在网络上发布、 查询与获取利用的信息资源的总和。

  11. 第 4 讲 网络资源概述 3.网络信息资源的类型 • 按发布机构分为 • 企业网站信息资源,一般以.com为一级或二级域名注册; • 学校、科研院所站点信息资源,一般以.edu或.ac为一级或二级域名注册; • 信息服务机构站点信息资源,一般以.net、.com、.gov为一级或二级域名 • 注册; • 按网络传输协议分为 • Web网络信息资源、Telnet(远程登录协议)信息资源、FTP信息资源、 • 用户服务组资源(新闻组、电子邮件等); • 按使用形式分为联机检索信息资源和互联网信息资源。 • 按信息内容表现形式和内容分为 • 全文型、事实性(天气预报、航班等)、 • 数值型(统计数据)、数据库型、微内容(博客、微博、BBS等)、 • 其他类型(图形、广告等)

  12. 第 4 讲 网络资源检索与利用 搜索引擎的利用

  13. 第 4 讲 网络资源检索与利用 什么是搜索引擎? 概念: 搜索引擎(Search Engine)利用网络自动搜索技术,通过Internet 接收用户的查询指令,对因特网各种资源进行收集和标引,建立网 页数据库,并为检索者提供网络信息检索的工具。

  14. 第 4 讲 网络资源检索与利用 什么是搜索引擎? 工作原理: 搜索引擎是利用网络自动搜索技术对互联网上的各种资源 进行标引,并为检索者提供检索服务的系统。具体来说,搜 索引擎是指互联网上专门提供查询服务的网站。这些网站通 过复杂的网络搜索系统,将互联网上大量网站的页面收集到 一起,经过分类处理并却保存起来,从而能够对用户提出的 各种查询做出响应,提供给用户所需要的信息。 第一步:爬行 → 第二步:抓取存储 → 第三步:预处理 → 第四步:排序显示

  15. 目录索引搜索引擎 Search Index 全文搜索引擎 Full Text Search Engine 元搜索引擎 Meta Search Engine 第 4 讲 网络资源检索与利用 搜索引擎分类: Google; AltaVista; Teoma; 百度 Open Directory Project (DMOZ); 雅虎; 搜狐; 新浪; 网易 Infospace; Dogpile; Vivisimo

  16. 第 4 讲 网络资源检索与利用 全文搜索引擎(Full Text Search Engine) • 通过从互联网各个网站提取信息(以网页文字为主)而建立的数据库 • 中,检索用户查询条件匹配的相关记录,然后按照一定得排列顺序将 • 结果返回给用户,因此它们是真正的搜索引擎。 • 拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人 • (Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用。 特点: 优点——信息量大、更新及时; 缺点——返回信息量多,需用户筛选。

  17. 第 4 讲 网络资源检索与利用 常用的中文搜索引擎 1)百度(http://www.baidu.com) 百度公司2000年1月1日创建。全球最大的中文搜索引擎, 每天完成上亿次搜索。

  18. 第 4 讲 网络资源检索与利用

  19. 第 4 讲 网络资源检索与利用

  20. 第 4 讲 网络资源检索与利用 简单检索 输入多个不同检索词,词和词之间用空格隔开。 百度支持布尔逻辑检索语法:“空格”= “AND” “ - “ = “NOT” “ ∣ ”= “OR”

  21. 第 4 讲 网络资源检索与利用 高级检索 a) Intitle 网页标题 在intitle语法后加上要查询的关键词,可以限定只搜索网页标题中含有这些关键词 的网页。 国际会议与“intitle”之间可以有空格; “intitle”与后面关键词不需要空格。 搜索北京大学相关网站发布的国际会议信息

  22. 第 4 讲 网络资源检索与利用 高级检索 • Intitle • 网页标题举例检索

  23. 第 4 讲 网络资源检索与利用 高级检索 b) Site 地点域名 知道某个站点中有自己需要找的信息,在查询内容后面加上 “site: 站点域名”, 可以把搜索范围限定在这个站点中,提高查询效率。 “site”后面跟的域名不要带“http://” 搜索哈尔滨工程大学网站所含有关信息

  24. 第 4 讲 网络资源检索与利用 高级检索 b) Site 地点域名检索举例

  25. 第 4 讲 网络资源检索与利用 高级检索 c) Inurl 网页 网页url中的某些拼写信息,常常有某种价值的含义,能够提示出网页的内容或类别。 “inurl”前的词可以出现在网页的任何位置; “inurl”后面的词必须出现在网页url中 搜索有关photoshop使用技巧

  26. 第 4 讲 网络资源检索与利用 高级检索 c) Inurl 网页检索举例

  27. 第 4 讲 网络资源检索与利用 高级检索 d) 双引号、书名号 双引号保证输入的关键词(词组、句子)不被拆分检索 书名号会出现在结果中,适用于直接搜索书籍,电影等。

  28. 第 4 讲 网络资源检索与利用 百度文库

  29. 第 4 讲 网络资源检索与利用 百度百科

  30. 第 4 讲 网络资源检索与利用 百度地图

  31. 第 4 讲 网络资源检索与利用 常用的英文搜索引擎 2)谷歌(http://google.cn/) 1998年,Google创始人美国斯坦福大学Larry Page(拉里-佩奇), 和Sergey Brin(谢尔盖-布林)共同创立了全新的在线搜索引擎。

  32. 第 4 讲 网络资源检索与利用

  33. 第 4 讲 网络资源检索与利用 简单检索 • “空格”、“-”、“∣”表示逻辑运算“AND、NOT、OR”; • “+”在必须使用的某一常见字词前输入“+”号,从而将其包含在查询 • 结果中; • “ “ “ ”号将两个或多个字词括住执行词组搜索。

  34. 第 4 讲 网络资源检索与利用 高级检索 • Site • 或搜索结果局限于某个具体网站或者网站频道。

  35. 第 4 讲 网络资源检索与利用 高级检索 b ) Filetype 对指定文献类型搜索。 搜索有关搜索引擎知识和技巧方面的PDF文件

  36. 第 4 讲 网络资源检索与利用 高级检索 c ) Intitle

  37. 第 4 讲 网络资源检索与利用 高级检索 d) Link 对于搜索某个网站的所有链接。

  38. 第 4 讲 网络资源检索与利用 高级检索 e) related 语法用于查找与某个页面结构内容相似的页面 搜索与我校主页相似的页面

  39. 第 4 讲 网络资源检索与利用 新词和生僻词定义服务功能 搜索“信息”的定义 Define后按空格,之后想定义的词语。

  40. 第 4 讲 网络资源检索与利用 翻译

  41. 第 4 讲 网络资源检索与利用 图书搜索

  42. 第 4 讲 网络资源检索与利用 谷歌学术搜索

  43. 第 4 讲 网络资源检索与利用 谷歌学术搜索

  44. 第 4 讲 网络资源检索与利用 谷歌学术搜索 submarine control robust adaptive

  45. 第 4 讲 网络资源检索与利用 谷歌学术搜索

  46. 第 4 讲 网络资源检索与利用 特色功能1:手气不错按钮

  47. 第 4 讲 网络资源检索与利用 特色功能1:手气不错按钮 输入搜索字词后,点击“手气不错”,可以直接进入针对查询词相关性最高的页面。

  48. 第 4 讲 网络资源检索与利用 特色功能2:计算器

  49. 第 4 讲 网络资源检索与利用 特色功能2:换算器

  50. 第 4 讲 网络资源检索与利用 特色功能3:归属地查询

More Related