1 / 52

教学内容 : 网络信息检索技术 网络搜索引擎

教学内容 : 网络信息检索技术 网络搜索引擎. 4.1 网络信息检索技术. 4.1.1 布尔逻辑检索技术 布尔逻辑检索是建立最早的检索理论,也是检索系统中应用最广泛的检索技术。它通过对布尔逻辑运算符进行组配,形成检索式,用以表达用户的检索需求,并通过一定的算法和实手段进行检索。. 布尔逻辑运算符及其关系. 布尔逻辑运算符有三种:逻辑与( AND )、逻辑或( OR )、逻辑非( NOT ). A OR B A AND B A NOT B B NOT A. 4.1.2 截词检索技术

ramiro
Download Presentation

教学内容 : 网络信息检索技术 网络搜索引擎

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 教学内容: • 网络信息检索技术 • 网络搜索引擎

  2. 4.1网络信息检索技术 • 4.1.1布尔逻辑检索技术 布尔逻辑检索是建立最早的检索理论,也是检索系统中应用最广泛的检索技术。它通过对布尔逻辑运算符进行组配,形成检索式,用以表达用户的检索需求,并通过一定的算法和实手段进行检索。

  3. 布尔逻辑运算符及其关系 • 布尔逻辑运算符有三种:逻辑与(AND)、逻辑或(OR)、逻辑非(NOT) A OR B A AND B A NOT B B NOT A

  4. 4.1.2 截词检索技术 截词检索是指在检索式中利用专门的截词符号来表示检索词的某一部分有一定的词形变化。由检索词的不变部分和允许的任何变化形式共同构成的主题词均为合法检索词,且通过检索词具有逻辑与关系,截词符号有“*”“?”,分别表示无限截断和有限截断。

  5. 4.1.3邻接检索技术 邻接检索是指利用一定的专门符号来标识两个检索词在检索结果中出现的位置。避免了布尔逻辑检索中无法区分逻辑与联结起来的两个概念的关联程度。

  6. 邻接检索的形式 • 同字段邻接 • 同自然段邻接 • 同句邻接 • 有间断无序邻接 • 有间断有序邻接

  7. 4.1.4 限制检索技术 限制检索技术就是对检索词范围(时间、国别、语种、信息类型等)进行约束或压缩的方法,它大多通过检索系统的限制符号或限制命令来实现

  8. 4.1.5 全文检索技术 全文检索是以原始记录中词与词之间特定位置关系为检索对象的运算,它不依赖主题词表而直接使用原文中的自由词进行检索,它通过位置算符来确定词与词之间的特定的位置关系 。 常用的位置运算符有WITH,NEAR等。

  9. 4.1.6 构造检索式 1. 选择检索词 2. 组配检索词

  10. 4.2 网络搜索引擎 • 搜索引擎工作原理 (1)信息的收集处理 (2)信息的检索输出

  11. 2.搜索引擎的分类 (1)目录式搜索引擎 Yahoo!、网易、新浪、搜狐、Galaxy、Open Directory等 (2)机器人搜索引擎 Google、天网、百度、若比邻、Altavista、Hotbot、Excite等 (3)元搜索引擎 WebCrawler、InfoMarket等

  12. 常用的搜索引擎 • 目录型搜索引擎 • 中文Yahoo! http://www.yahoo.com.cn i)检索途径 分类途径 关键词途径

  13. ii)检索方法和技巧 中文Yahoo!支持布尔逻辑检索,用户可以通过使用布尔逻辑关系构造逻辑检索式来精确检索结果。但需要注意的是,雅虎只支持逻辑“与”(AND)和逻辑“非”(NOT)关系检索,不支持逻辑“或”(OR)的检索

  14. iii)检索结果

  15. 2. 搜狐 http://www.sohu.com i)检索途径 分类途径 关键词途径

  16. 搜狐分类搜索

  17. ii)检索方法和技巧 搜狐中文检索系统支持布尔逻辑检索,用户可以通过使用布尔逻辑关系构造逻辑检索式来精确检索结果。搜狐支持的运算符有-、&、/、()、空格

  18. iii)检索结果

  19. 机器人搜索引擎 • Google搜索引擎 http://www.google.com

  20. Google的高级检索

  21. Google的特色服务 • 网页快照 • 相似网页 • 查询电话号码 • 查找PDF文件 • 股票报价 • 查找字典释意 • 查找地图 • 网页翻译 • 单词纠错 • 繁简转换

  22. Google检索技术应用 • 1.布尔逻辑在google搜索引擎中的应用 Eg.(CAD+机械)-模具

  23. Google检索技术应用 • 使用布尔逻辑检索需注意: 操作符须为英文字符,且与关键词间不能有空格,若操作符“-”与关键词间有空格,则“-”被忽略,视为逻辑“与”

  24. Google检索技术应用 • 2.site 将搜索结果局限在某个具体网站或网站频道。Eg.搜索edu.cn上所有关于周济的网页

  25. Google检索技术应用 3.Filetype Eg.文献检索课 filetype:ppt 目前google只支持ppt、doc、xls、pdf、ps、rtf等六种格式的文件

  26. Google检索技术应用

  27. Google检索技术应用 4.Define:查找词汇、缩写等 Eg. Define:J2EE

  28. 2.百度——baidu http://www.baidu.com

  29. 百度的高级检索

  30. 百度MP3检索界面

  31. 百度的特殊功能 • 百度快照 • 自动纠错 • 百度搜霸

  32. 3)搜狗——sogou • 中国第三代搜索引擎的代表 • 智能化 • 人性化 • 简单化

  33. 搜狗的基本功能及用法 检索途径: • 关键词检索 • 分类检索 • 互动式搜索 • 直通车搜索 • 搜狗指数 • 新闻搜索 • 购物搜索

  34. 互动式搜索示意图: 搜索界面 输入关键词 得到检索结果 选择检索提示 检索到更准确结果 选择新的提示

  35. 搜狗互动式搜索 点击互动提示

  36. 搜狗互动式搜索

  37. 搜狗直通车搜索

  38. 搜狗指数

  39. MetaFisher中文元搜索引擎 http://www.hsfz.net

  40. 3. Alatavista搜索引擎 http://www.altavista.com

  41. Altavista的高级检索

  42. Altavista的检索结果显示

  43. Altavista的检索结果显示

  44. Altavista的其它功能 • Family Filter(网络过滤器) • Translate(翻译)

  45. 元搜索引擎 • Metacrawler搜索引擎 http://www.metacrawler.com Metacrawler能对Lycos、Infoseek、Webcrawler、Excite、Altavista、Thunderstone、The MiningCo、Looksmart、Yahoo!、FAST、Ask Jeeves、FindWhat等14个检索工具进行并行检索,并能分门别类地对许多专门检索工具进行并行检索。

More Related