1.17k likes | 1.35k Views
网络信息检索工具 —— 搜索引擎 主讲人:刘进军. 你的搜商够高吗?. 成功 = 智商 + 情商 + 搜商 ?. “ 搜商”,顾名思义,就是一种与智商、情商相并列的人类智力因素。 面对海量信息的重重包围,面对信息爆炸时代的降临,人类通过工具获取知识的能力快速升级。搜商理论的诞生,是对现有人类情商和智商的完美补充。陈沛提出了一个全新的搜商公式: SQ=K/T(C) (SQ =搜商,其中 K = knowledge 知识, T = time 时间, C =搜商指数(社会平均知识获取能力) ) 。
E N D
网络信息检索工具 ——搜索引擎 主讲人:刘进军
你的搜商够高吗? 成功=智商+情商+搜商 ?
“搜商”,顾名思义,就是一种与智商、情商相并列的人类智力因素。 面对海量信息的重重包围,面对信息爆炸时代的降临,人类通过工具获取知识的能力快速升级。搜商理论的诞生,是对现有人类情商和智商的完美补充。陈沛提出了一个全新的搜商公式: SQ=K/T(C) (SQ=搜商,其中K=knowledge知识,T=time时间,C=搜商指数(社会平均知识获取能力))。 可见,搜商理论更加注重时间和知识的比值,也就是说,搜商关心和解决的问题是智商和情商不能度量的问题———效率。
主要内容 第一节 搜索引擎概述 第二节 常用搜索引擎技巧分析 第三节 学术搜索引擎
盲目 网络信息资源 信息用户 更快、更准确 搜索引擎 一、搜索引擎的产生
二、搜索引擎的概念 搜索引擎是一种网络信息资源检索工具,是以各种网络信息资源为检索对象的查询系统。 它像一本书的目录,Internet各个站点的网址就像是页码,可以通过关键词或主题分类的方式来查找感兴趣的信息所在的WEB页面。
三、搜索引擎的工作原理 挖掘 用户界面
从互联网上采集信息 利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。
建立索引数据库 由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。
在索引数据库中搜索排序 当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。 最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。
四、搜索引擎的分类 根据信息覆盖范围及适用用户群分类 (1)综合性搜索引擎 如:Baidu、Google、Yahoo、AltaViasta、Infoseek (2)专用性搜索引擎 如:Scirus科学搜索引擎、Softseek提供软件查找,MapBlast查找地图信息。
五、搜索引擎的作用 1.生活 查新闻 例子:2009 诺贝尔奖 2.学习 如:查字 例子:炅(日字下面一个火怎么读) 如:查论文 3.娱乐 下载歌曲、电影 ……
第二节 常用搜索引擎技巧分析 想一想:你用过哪些搜索引擎?
一、百度(http://www.baidu.com) 百度,全球最大的中文搜索引擎、最大的中文网站。2000年1月创立于北京中关村。百度搜索引擎具有高准确性、高查全率、更新快以及服务稳定的特点。 (一)概况
百度公司创始人李彦宏 《人生可以走直线》:人生是可以走直线的,这条“直线”在自己心中。但我们的妥协、分心和屈从让我们往往偏离了原来的轨道,浪费了很多时间。信念是强大的,一定要做自己喜欢并且擅长做的事,不要跟风。
(二)检索方法与技巧 1、Baidu 的常用搜索技巧 (1)以空格表示逻辑“与” 在百度查询时不需要使用符号“AND”或“+”,百度会在多个以空格隔开的词语之间自动添加“+”。如:我想知道日本海啸的影响? 你怎么搜索呢?
日本海啸的影响:找到相关结果约12,100,000个 • 日本 海啸 影响:找到相关结果约12,100,000个 检索结果没有区别
(2)以“-”表示逻辑“非” 百度支持“-”功能,用于有目的地删除某些无关网页,但减号之前必须留一空格。 • 例如:图书馆 -公共图书馆
(3)以“|”表示逻辑“或” 使用“A|B”来搜索“或者包含词语A,或者包含词语B”的网页。 如:毛泽东|毛主席
尝试检索:维C 想一想:维C还有其他说法呢?
(4) intitle:在网页标题中搜索 在一个或几个关键词前加“intitle:”,可以限制只搜索网页标题中含有这些关键词的网页。 如:intitle:上海世博会 2010
利用intitle查找论文 直接找特定论文 除了找论文网站,我们也可以直接搜索某个专题的论文。看过论文的都知道,一般的论文,都有一定的格式,除了标题、正文、附录,还需要有论文关键词,论文摘要等。其中, “关键词”和“摘要”是论文的特征词汇。而论文主题,通常会出现在网页标题中。 我想查找关于“管理信息系统”的论文。
比较下面三个的检索结果: • 管理信息系统 22,100,000个 • 关键词 摘要 信息系统 18,200,000 • 关键词 摘要 intitle:信息系统 77,900个
(5) Inurl url是Uniform Resource Locator(统一资源定位符)的缩写,简单地说,就是地址栏里的东西。 格式:关键词A inurl:关键词B(关键词A与inurl之间要用空格隔开) 意思是在url中含有关键词B的网页中,寻找关于关键词A的信息。 这句话说的好,“网页url中的某些信息,常常有某种有价值的含义”。只要善于观察,多多使用,你就会发现inurl语法非常有用。
例1:找关于photoshop的使用技巧,可以这样查询:photoshop inurl:jiqiao 上面这个查询串中的“photoshop”,是可以出现在网页的任何位置,而“jiqiao”则必须出现在网页url中。 注意,inurl:语法和后面所跟的关键词,不要有空格。
问情 inurl:mp3搜索《戏说乾隆》的主题曲 • 第一章 inurl:lianchengjue查询小说《连城诀》
(6)site的用法 有时候,您如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。 注意,“site:”后面跟的站点域名,不要带“http://”;另外,site:和站点名之间,不要带空格。
在著名的软件下载站找软件 由于网站质量参差不齐,下载速度也快慢不一。如果我们积累了一些好用的下载站(如天空网,华军网,电脑之家等),就可以用site语法把搜索范围局限在这些网站内,以提高搜索效率。 例: 网际快车 site:skycn.com
cnkikw site:edu.cn在教育网内搜索cnkikw • 摄影 site:hao123.com在hao123中找摄影的网站 • 想不想搜索下你自己在湘大校园网上的信息情况呢?
(6) “开始连接”、“正在连接”搜索免费电影 • 网络上有很多热心人提供免费电影的下载地址。为了表明真实可靠,把下载过程也同时附上。现在最流行的下载工具是flashget和迅雷。 Flashget下载开始就是“正在连接”,迅雷则是“开始连接”。所以,可以用想找的电影名字,加上“开始连接”或者“正在连接”,来寻找免费电影。 • 检索式形式如:“电影名 开始连接”、电影名 正在连接”、“电影名 (开始连接 | 正在连接)” • 举几个例子: 哈利波特4 开始连接 阿育王 (正在连接 | 开始连接)
(7) 『』查找论坛版块 • 检索式形式如: 『论坛版块名称』 • 实例: 『知网免费帐号』
2.Baidu的特色搜索 (1)百度快照 百度搜索引擎已先预览各网站,拍下网页的快照,为用户贮存大量的应急网页。点击每条搜索结果后的“百度快照”,可查看该网页的快照内容。以搜索“甲型h1n1流感”为例。
(2)专业文档搜索(http://file.baidu.com) 百度支持对Office文档(包括Word、Excel、Powerpoint)、Adobe PDF文档、RTF文档进行了全文搜索。要搜索这类文档,在普通的查询词后面,加一个“filetype:” 。“Filetype:”后可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。其中,ALL表示搜索所有这些文件类型。
如: 查找关于网络技术的课件 格式: 网络技术 filetype:ppt 如:查找关于互联网的调查报告 互联网 调查报告 filetype:doc
(3) 精确匹配——双引号和书名号 如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的,给查询词加上双引号,就可以达到这种效果。例如,搜索京师范大学研究生院,加上双引号后,输入“北京师范大学研究生院”,获得的结果就全是符合要求的了。
我们来比较下: • “金融危机的影响” • 金融危机的影响
书名号是百度独有的一个特殊查询语法。加上书名号的查询词,有两层特殊功能:书名号是百度独有的一个特殊查询语法。加上书名号的查询词,有两层特殊功能: 一是书名号会出现在搜索结果中; 二是被书名号扩起来的内容,不会被拆分。 例如;查电影“手机”,如果不加书名号,很多情况下出来的是通讯工具——手机,而加上书名号后,《手机》结果就都是关于电影方面的了。 查找图书的时候推荐使用,如《说服力:让你的PPT会说话》