900 likes | 1.07k Views
第七 讲 网络信息检索. 2010-05-25. 网络社会. 在现在的网络信息环境下,网络信息资源是我们学习、工作、生活中利用率最高的信息资源之一。 相对与本馆纸质文献信息资源和数字资源的检索利用,其 对人的影响更为深远 。. 一、域名与网络信息资源有什么关系?. .com 商业公司 .org 组织、协会等 .net 网络服务 .edu 教育机构 .gov 政府部门 .mil 军事领域 .ac 代表科研机构 对网络信息资源的获取与评价有参考作用. 二、网络信息检索工具. 当已经知道地址时直接通过地址访问。
E N D
第七讲 网络信息检索 2010-05-25
网络社会 • 在现在的网络信息环境下,网络信息资源是我们学习、工作、生活中利用率最高的信息资源之一。 • 相对与本馆纸质文献信息资源和数字资源的检索利用,其对人的影响更为深远。
一、域名与网络信息资源有什么关系? • .com 商业公司 • .org 组织、协会等 • .net 网络服务 • .edu 教育机构 • .gov 政府部门 • .mil 军事领域 • .ac 代表科研机构 对网络信息资源的获取与评价有参考作用
二、网络信息检索工具 • 当已经知道地址时直接通过地址访问。 • 当不知道地址的时候,需要借助检索工具。
(一) 搜索引擎 • 搜索引擎指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。
1、水平门户_综合搜索引擎 中文常用搜索引擎 • 百度中文搜索引擎:http://www.baidu.com/ • Google中文搜索引擎:http://www.google.cn/ • 搜狗搜索:http://www.sogou.com/ • 雅虎:http://cn.yahoo.com/ • 腾讯搜搜 http://www.soso.com/ • 中搜 http://www.zhongsou.com/ • MSN搜索 http://cn.msn.com/
新浪:http://cha.iask.com/ • 网易有道 :http://www.yodao.com/ • TOM搜索: http://i.tom.com/ • 北大天网搜索引擎:http://www.tianwang.com/ • 奇虎 http://www.qihoo.com/
国外英文常用搜索引擎 • Google — 以搜索精度高、速度快成为最受欢迎的搜索引擎,是目前搜索界的领军人物。 • Fast/AllTheWeb — 总部位于挪威的搜索引擎后起之秀,风头直逼google。 • AltaVista — 曾经的搜索引擎巨人,目前仍被认为是最好的搜索引擎之一。 • Overture — 最著名的搜索引擎广告商,竞价排名的始作俑者,也是全文搜索引擎。 • Lycos — 发源于西班牙的搜索引擎,网络遍布世界各地。 • HotBot — 隶属于Lycos Networks,搜索结果来自其他搜索引擎及目录索引。
2、谷歌/百度搜索语法实例 • “在这个星球的历史上,从来没有这么多的人——依靠自身——有能力去找到这么多的东西和这么多关于其他人的信息。 ” • 来自:thomas friedman :《世上的一切问题你去问Google》
网络搜索难点:是如何找到更少的搜索结果,而不是找到更多。网络搜索难点:是如何找到更少的搜索结果,而不是找到更多。 • 目标: • 花费最少的时间 • 找到最精确的信息。
(1)字母大小写不敏感 • BOOK和book的搜索结果一样;
(2)布尔逻辑检索 • 逻辑与:空格 • 检索实例: • 在google中搜索既含有”金融海啸”又含有”美国联储”的网页。
逻辑或:OR以及| • 检索实例: • 在google中搜索所有出现”飘”或者出现”乱世佳人”的网页?
逻辑非: -(减号前有空格) • 检索案例: • 在google中搜索除红旗汽车外的所有含汽车这个词的网页?
(3)精确检索:”” • 默认为模糊检索,并会自动拆分搜索的词组和句子。 • 检索案例: • 在google中搜索既含有”金融海啸”又含有”美国联储”并且精确匹配的网页。
(4)通配符 • “全词通配符”(full-word wildcard)是指代替一个单词而不是单词中的某个或几个字母的键盘字符。 • “词间通配符”(partial-word wildcard),在这里*、?、%只能代替单词中的一个或几个字母,而非整个单词。 • google的通配符是星号* ,包括全词和词间通配功能,一次检索可以使用若干个省略词和字母。如【comput*】 。在查找歌词、诗歌、短语等方面比较有用。
检索案例: • 比如想看看“天涯何处无芳草”的另类说法。
(5) allintitle:搜索范围限制在网页的标题 • 缩小搜索范围最好的选择 • 检索实例: • 在google中检索网页标题中出现processing trade的所有网页。
(6)inurl:搜索范围限制在URL • 检索实例: • 在组织协会或政府机构的网页中搜索既含“科技”又含有“统计”的网页。
只要略微了解普通网站的URL格式,就可以极具针对性地找到你所需要的资源--甚至隐藏内容。只要略微了解普通网站的URL格式,就可以极具针对性地找到你所需要的资源--甚至隐藏内容。 • 检索案例: • 搜索和图书馆有关读者培训的网页。
利用inurl搜图片--inurl:photo • 检索实例: • 刘翔 inurl:photo • 利用inurl搜音乐--inurl:mp3 • 检索实例: • "take me to your heart" inurl:mp3
利用inurl搜软件--inurl:download • 检索实例: • 搜索firefox下载页面。
(7)site:搜索范围限制在某网站或域名中。 • 检索实例: • 搜索国家统计局(www.stats.gov.cn)网站上所有包含化妆品的页面。
(8) filetype:根据文件后缀搜索特定文件类型 • 检索实例: • 在google中搜索“市场营销学”的ppt文件。
练习: • 1、你是一个就快毕业的学生,想知道广东的招聘网站信息都有哪些?你可以如何去找相关的信息? • 2、查找国际上能够提供助听器材商家相关信息的网站都有哪些?
(二)网络资源目录 • 由人工采集网上信息,然后按照一定分类标准,比如学科类型、主题等,建立网站分类目录,并将筛选后的信息分门别类放入各类目中供用户进行浏览。 • 优点:1 .信息组织的专题性较强,满足族性检索要求;2. 使用简单,只要选择相关类目,依照页面之间的超链接指引很快就能到达目的信息,适于检索不熟悉的领域或建议不熟悉网络的用户使用。
缺点:1.人工采集信息的收录范围小,更新慢;2.受主观因素影响,类目设置不够科学,缺少规范。缺点:1.人工采集信息的收录范围小,更新慢;2.受主观因素影响,类目设置不够科学,缺少规范。
搜索引擎的网站目录(导航): • Yahoo分类目录 • http://search.yahoo.com/dir • 新浪分类目录 • http://dir.iask.com • Galaxy • http://www.galaxy.com • 中国艺术开放目录 • http://www.aod.org.cn/
练习: • 1、你是法律专业的学生,你想知道法律方面的网站资源都有哪些? • 2、你是物流专业的学生,你想多了解本专业的方方面面知识有所了解,你都可以利用哪些网站资源?
(三)信息门户 • 学科信息门户 • CALIS重点学科网络资源导航门户 • http://202.117.24.168/cm/main.jsp • 国家科技图书文献中心热点门户 • http://www.nstl.gov.cn/index.html
行业信息门户 • 如,中国物流与采购网 • http://www.chinawuliu.com.cn/ • 导航库 • 如,北大法律信息网法律导航 • http://chinalawinfo.com/fldh/
二、学术与教学信息资源的开放获取 • 学术信息的开放存取 • 开放存取期刊 • 预印本文献 • 开放存取仓储 • 学位论文/研究报告 • 学术会议信息 • 数字图书 • 专利/标准
教学信息资源的开放存取 • 国外开放课程 • 国内开放课程 • 学习资料
一、学术信息的开放存取 开放存取概念 • 开放存取( Open Access ,OA) :把同行评议过的科学论文或学术文献放到互联网上。使用户可以免费获得,而不需考虑版权或注册的限制。开放获取运动旨在打破学术研究的人为壁垒。 • 此外:付费出版,免费使用
信息资源开放获取的四个途径 • 开放获取仓储(Open Access Repository) a)对于有版权,但是出版社允许进行自存储(self-archiving)的作品,作者可以放到信息开放存取仓库中,例如论文、专著等; b)对于没有版权的作品,作者可以直接放到信息开放存取仓储中,例如讲义、PPT等。 • 开放获取期刊(Open Access Journals) a)出版提供信息开放获取的杂志,或者将原有杂志改造为信息开放获取的杂志;b)期刊运行经费来源:一种是主办者全部筹集资金,杂志对作者和读者都是免费的。
个人网页 a)对于有版权,但是出版社允许进行自存储的作品,作者可以放到个人网页上;b)对于没有版权的作品,作者可以直接放到个人网页上 • 公共信息开放使用(如专栏/标准等)
(一)OA搜索引擎 • 1、Socolar • http://www.socolar.com/ • 中国教育图书进出口公司自主研发的搜索开放存取资源的平台。 • 可按分类浏览开放存取期刊。(中图法)如:图书情报学(76)Access online——2009-7-1。但无仓储的分类。 • 逻辑检索(与、或、非) • 通配符*
2、OAISter • http://www.oaister.org • 由美国密执安大学数字图书馆制作。标引对象包括国会图书馆美国记忆计划、各类预印本及电子本文献服务器、电子学位论文。结果含资源描述和资源链接。 • 布尔逻辑:and or not • 通配符:*
3、Scirus • http://www.scirus.com/srsapp/ • 是目前互联网上最全面、综合性最强的科技文献门户网站之一。 • ?有限截词、*无限截词 • 精确检索” ”。 • Author au:;Title ti:;Journal jo:;Keywords ke:;
4、DRIVER http://search.driver.research-infrastructures.eu/
(二)开放存取期刊 • 开放存取期刊(Open Access Journals)是一种论文经过同行评审的、网络化的免费期刊,全世界的所有读者从此类期刊上获取学术信息将没有价格及权限的限制,编辑评审、出版及资源维护的费用不是由用户,而是由作者本人或其他机构承担。
1、 Directory of Open Access Journals • http://www.doaj.org/ • 是由然瑞典兰德大学图书馆整理的一份开放期刊目录。该项服务涵盖了免费的、可获取全文的、高质量的科学和学术期刊(This service covers free, full text, quality controlled scientific and scholarly journals)。他们的目标是涵盖所有学科和语言的开放期刊,目前一共有2900种开放期刊被收录到了该目录中。
2、 HighWire Press • http://www.highwire.org/lists/freeart.dtl • HighWire Press是全球最大的提供免费全文的学术文献出版商,于1995年由美国斯坦福大学图书馆创立。 • HighWire Press收录的期刊覆盖以下学科:生命科学、医学、物理学、社会科学。 • 部分全文可免费访问,并不是全部。
3、 Open J-Gate 开放获取期刊门户 • http://www.openj-gate.com/ • 提供基于开放获取的近 4000 种期刊的免费检索和全文链接,包含学校、研究机构和行业期刊,其中超过 1500 种学术期刊经过同行评议( Peer-Reviewed )。
4、浙大图书馆SSOA • http://libweb.zju.edu.cn/JavaLab/ • SSOA,即人文社科类开放获取(Social Science Open Access),致力于收集人文社科类的开放访问期刊(SSOAJ)和知识库(SSOAR)的内容。
5、economics-ejournal • http://www.economics-ejournal.org/ • 专门收录经济学方面的开放获取期刊论文。