450 likes | 571 Views
第七章 网络信息资源检索. 第一节 计算机网络简介 第二节 Internet 基本知识 第三节 搜索引擎 第四节 Internet 信息检索技巧. 第一节 计算机网络简介. 一、 计算机网络的概念. 二、 计算机网络的主要功能. 三、 计算机网络的分类. 一、计算机网络的概念. 计算机网络: 就是将分布在不同地理区域的计算机用通信线路互连起来的复合系统。. 二、计算机网络的主要功能. 主要功能是数据通信和资源共享。 数据通信: 是指计算机网络中可以实现计算机与计算机或计算机与终端之间的数据传送。
E N D
第七章 网络信息资源检索 第一节 计算机网络简介 第二节 Internet基本知识 第三节 搜索引擎 第四节 Internet 信息检索技巧
第一节 计算机网络简介 一、计算机网络的概念 二、计算机网络的主要功能 三、计算机网络的分类
一、计算机网络的概念 计算机网络:就是将分布在不同地理区域的计算机用通信线路互连起来的复合系统。
二、计算机网络的主要功能 主要功能是数据通信和资源共享。 数据通信:是指计算机网络中可以实现计算机与计算机或计算机与终端之间的数据传送。 资源共享:包括硬件资源、软件共享和数据资源共享。
三、计算机网络的分类 1.局域网(LAN) 指在一个较小地理范围内的把各种计算机及网络设备互连在一起的通信网络;网络覆盖范围通常局限在几千米之内,如一幢办公楼、校园。
2.广域网(WAN) • 广域网可以把不同城市、不同的地区、甚至不同国家的计算机连接起来构成计算机网络,即“网中网” • Internet 网是广域网最典型的代表。 • 是庞大的信息和服务基地 • 面向公众的社会化组织
第二节 网络信息检索基础 一、主要名词术语解释 二、Internet的发展简介 三、Internet提供的信息服务 四、网络信息资源的特点 五、WEB2.0 六、网络信息检索工具的类型
一、主要名词术语解释 1.什么是Web? Web就是在 Internet 环境下实现分布式超文本检索的体系。它使文档之间的公用信息更易于访问,而且其物理位置完全独立。
2.主页、超文本、超媒体 访问Web服务器时激活的第一个超文本页面称为主页。 超文本是一种全局性的信息结构,它将文档中的不同部分通过关键字建立链接,使信息得以用交互方式搜索。 超媒体就是主页里包含了大量的多媒体信息或多媒体链接。
3.Web浏览器与URL Web浏览器又称为Web客户程序,是用于搜集、查找、查看和管理网络上的信息的一种带图形交互式界面的应用软件。如IE、Netscape Navigator URL:意思是统一资源定位器,用它来指向Web上的文档和其它信息资源的位置。 URL语法格式为:传输协议://DN或IP地址
4. TCP/IP协议(传输控制协议/网际协议) 作用:是Internet保证各种不同类型的计算机网络实 现相互通信一套规则或协议。 TCP协议的概念和用途:TCP是传输控制协议,规定传输信息怎样分层、分组和在线路上传输。 IP协议的概念和用途:是网际协议,定义Internet上计算机之间的路由选择,把不同网络的物理地址转换为Internet地址。
5. IP地址和域名 • (1) IP地址 • * 唯一性 • * 分为动态和固定两种 • 动态的:由Internet服务提供商(Internet • Service Provider,ISP)提供。 • 固定的:由网管中心提供。 • *形式:四组小于256的十进制表示。如: • 202.38.185.67表示北京邮电大学图书馆技术部的一台主机。
(2)域名 域名:1984年起采用字符型的IP地址,即域名(DN)域名的地址格式为: lib. sicau. edu. cn 主机名 机构名 网络类型 最高域名
6. 搜索引擎 广义:指一种基于Internet上的查询系统,包括信息存取、信息管理、信息检索。 狭义:指一种为搜索Internet上的网页而设计的检索软件。
二、INTERNET的发展简介 1. 国际因特网的起源和发展 *Internert源于美国国防部高级研究计划局(Advanced Research Projects Agency,简称ARPA)在20世纪末60年代末建立的ARPANET。 *1986年NSFNET(National Science Foundation Network);取代ARPANET *因特网II计划:新一代因特网计划(NGI计划) *VBNS计划:1995年4月,美国国家科学基金会(NSF)和MCI公司联合发布了“超高性能骨干网络服务”计划。
*Internet2计划:由美国120多所大学、协会、公司和政府机构共同努力建设的网络,它的目的是满足高等教育与科研的需要,开发下一代互联网高级网络应用项目。它并不是要取代现有的互联网,也不是为普通用户新建另一个网络。*Internet2计划:由美国120多所大学、协会、公司和政府机构共同努力建设的网络,它的目的是满足高等教育与科研的需要,开发下一代互联网高级网络应用项目。它并不是要取代现有的互联网,也不是为普通用户新建另一个网络。 *IPV6(下一代因特网协议)
2. 我国的因特网 *1986年—1993年小范围的E-Mail服务 *1994进入全功能服务阶段 *我国四大互联网: (1)中国科学技术网(CSTNET) (2)中国金桥信息网(CHINAGBNET) (3)中国公用计算机互联网(CHINANET) (4)中国教育和科研计算机网(CERNET)
中国互联网络信息中心(CNNIC) 1997年6月成立,主要职责是为我国的Internet用户提供域名注册、IP地址分配等注册服务;提供网络技术资料、政策与法规、入网方法、用户培训资料等信息服务;提供网络通信目录、主页目录与各种信息库等目录服务。
1.电子邮件(E-Mail) 2. 远程文件传输(FTP) 3. 新闻组( Usenet) 4. 远程登录(Telnet) 5. 电子公告牌、论坛(BBS) 6. 网络信息浏览
四、网络信息资源的特点 1.时效性强 2.信息容量大,增长迅速 3.形式多样 4.分布广泛,查询方便 5.交互功能强
五、WEB2.0 1.Web 1.0与web2.0 *Web1.0: 实质:人机对话 *Web2.0: 实质:人与人的对话,用户的地位正在悄悄发生变化,每个普通用户既是信息获得者,也是信息提供者。
2. Web2.0提供的服务 (1)Blog—博客/网志 (2)RSS—站点摘要 (3)WIKI—百科全书 (4)网摘 (5)SNS—社会网络 (6)P2P—对等联网
六、网络信息检索工具的类型 1.主题指南/目录 2.全文搜索引擎 3.元搜索引擎
中国搜索引擎市场调查报告 ☆ 百度和Google市场份额大大高于其他公司,二者合计在北京和上海占有超过80%的市场份额,在广州合计占有率也接近达到75%。在前半年中,百度的市场占有率上升很快,在北京、上海和广州都上升超过10个百分点。 ☆Google的用户数基本保持不变,但市场份额在下降。搜狐的新用户获得率排名第二,为34.7%,仅次于百度的34.8%。 ☆ 在搜索内容上,百度用户搜索音乐(Mp3)等娱乐内容的使用率相对较高;Google用户搜索网页(网页)、企业产品、商情、交通旅游等内容的使用率相对较高。
Google概况 ☆Google(http://www.google.com) ☆ 通用中英文网页搜索引擎 ☆ 斯坦福大学博士生Larry Page和Sergey Brin 1998年9月成立,美国时间2004年8月19日在纳斯达克上市。 ☆ “Googol”是数学名词,表示一个1 后面跟着100 个零,体现了公司整合网上海量信息的远大目标。
GOOGLE的特点: • GOOGLE支持多达132种语言,包括简体中文和繁体中文; • GOOGLE网站只提供搜索引擎功能; • GOOGLE速度极快,据说有10000多台服务器,200多条T3级宽带; • GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果;
GOOGLE的特点: • GOOGLE的搜索结果摘录查询网页的含有关键字的内容,而不仅仅是网站简介; • GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站; • GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。
Google 学术搜索 http://scholar.Google.com Google 学术搜索提供搜索学术文献的简便方法。您可以从一个位置搜索众多学科和资料来源:来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的经同行评论的文章、论文、图书、摘要和文章。Google 学术搜索可帮助您在整个学术领域中确定相关性最强的研究。
Google 学术搜索 http://scholar.Google.com
雅虎—Yahoo中文版 http://cn.yahoo.com
第四节 Internet 信息检索技巧 信息量大,无所不有,无奇不有;存储分散,难于查全;信息质量悬殊极大。 检索质量是一个无法说清楚的问题,与用户需求的知识点有极大关系。在因特网上查寻资料是一个充满刺激而又痛苦的过程。 在Internet 上您总能找到,甚至只能找到您不需要的东西
一、选择高质量的搜索引擎 1. 充分利用搜索引擎的特殊功能(分类、图片….) 2. 采用词组检索 3. 选择高级检索,进行合理的逻辑组配检索 二、观注本学科相关网站
国外著名生物学及农业网站 1. 美国国家生物技术中心 http://www.ncbi.nlm.nih.gov.
国外著名生物学及农业网站 2. 国际应用生物科学中心 http://www.cabi.org
国外著名生物学及农业网站 3.国际农业科学和技术信息中心 国际农业科学和技术信息中心(International Information System for the Agriculture science and technology 简称:AGRIS)网址:http://www.fao.org。 AGRIS,由联合国粮食及农业组织于1974年创建,其宗旨为促进涉及农业所有方面的信息交流和检索。
国外著名生物学及农业网站 4. 美国国家农业图书馆 美国国家农业图书馆(The National Agricultural Library 简称:NAL) 网址:http://www.nal.usda.gov
国外著名生物学及农业网站 5. 欧洲农业网(http://www.euroagri.net)
国外著名生物学及农业网站 6. 日本农业情报学会(http://www.jsai.or.jp)