1 / 41

国家科学数字图书馆 “ CrossSearch 跨库集成检索系统” 报告

国家科学数字图书馆 “ CrossSearch 跨库集成检索系统” 报告. 主要内容. 什么是跨库集成检索系统 跨库集成检索产生的背景和意义 国外的一些相关研究情况 国家科学数字图书馆 “ CrossSearch 跨库集成检索系统 ” 项目的建设情况 CrossSearch 的主体框架 CrossSearch 的特点. 1什么是跨库集成检索系统. 跨库集成检索是国内外都很关注的研究课题,有着不同的称谓: Broadcast search( 广播检索) Parallel search( 并发检索) Cross-database search( 跨库检索)

neron
Download Presentation

国家科学数字图书馆 “ CrossSearch 跨库集成检索系统” 报告

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 国家科学数字图书馆“CrossSearch跨库集成检索系统” 报告

  2. 主要内容 • 什么是跨库集成检索系统 • 跨库集成检索产生的背景和意义 • 国外的一些相关研究情况 • 国家科学数字图书馆“CrossSearch跨库集成检索系统”项目的建设情况 • CrossSearch的主体框架 • CrossSearch的特点

  3. 1什么是跨库集成检索系统 • 跨库集成检索是国内外都很关注的研究课题,有着不同的称谓: • Broadcast search(广播检索) • Parallel search(并发检索) • Cross-database search(跨库检索) • Metasearch(元检索) • Federated search(联邦检索)

  4. 1什么是跨库集成检索系统 • 定义 • One simultaneous search/access to multiple databases or information sources irrespective of search engine protocol, platform, product or vendor. (by Lillian Woon Gassie, Senior Systems Librarian, Naval Postgraduate School Monterey, Ca) • 用户只需“一次就能同时对多个数据库或信息源进行检索,而不必考虑这些检索引擎的协议、平台、产品或生产商”

  5. 1什么是跨库集成检索系统 • 我们认为: • 跨库集成检索系统是以多个分布式异构数据源为对象的检索系统。它通过统一的检索界面,可以一次并发地对多个网络数据库同时进行检索,并将各个网络数据库的检索结果归并,一次提交给用户,在实体资源分散的情况下实现了“虚拟的资源整合”。

  6. 2跨库集成检索产生的背景和意义 • 跨库集成检索产生与网络化数字化环境的渐渐成熟密切相关。 • 图书馆资源的不断增加,形式多样化,在迅速查询、及时取得信息等服务的同时,也给用户和图书馆员都带来了一些问题: • Springer-Link • Ei Compendex • Web工程索引 • CSA 剑桥科学文摘数据 • 中国期刊全文数据库 • 中国科学文献数据库 • 学位论文数据库 • 全国期刊联合目录数据库 • …… • ASTP • PQDD-B 数据库(UMI博士硕士论文) • Elsevier • Science Online • Catchword • IOP • SCI科学引文索引 • ……

  7. 2跨库集成检索产生的背景和意义 • 从用户的角度来 • 尽管目前有许网络数据库可以使用,但使用者往往不知自己所要查找的信息在哪一个数据库中: • 每一个数据库的供货商或出版商不同; • 有着不同的检索界面; • 不同的使用方式; • 不同的身分认证; • 不同的呈现的格式; • 使用者无法一次获取各数据库的信息; • 导致:频繁登录和退出

  8. 2跨库集成检索产生的背景和意义 • 从图书馆的角度来看,更多的资源意味着: • 更多的培训服务; • 更多的咨询服务; • 难以利用和共享; • 更多的用户压力……

  9. 2跨库集成检索产生的背景和意义 • 跨库集成检索应运而生:它向用户提供统一的检索接口,将用户的检索要求转化为不同数据源的检索表达式,并发地检索本地的和广域网上的多个分布式异构数据源,并对检索结果加以整合,在经过去重和排序等操作后,以统一的格式将结果呈现给用户。

  10. 2跨库集成检索产生的背景和意义 • 跨库检索的这种基本原理,决定了它有以下优点: • 统一的检索入口。能够减轻用户学习检索不同数据源的负担,频繁登录和退出; • 并发检索。能节省用户总的检索时间; • 结果整合。呈现给用户的最终看结果不仅格式统一,而且按统一标准排序,大大方便了用户的浏览和选择。

  11. 3国外的一些相关研究情况 • 国外的集成检索系统的研究项目 • FlashPoint。美国新墨西哥州洛斯阿拉莫斯国家实验室研究图书馆(Los Alamos National Laboratory Research Library,LANL RL) • SearchLight。California Digital Library (CDL) • NLM Gateway。美国国立医学图书馆(NLM) • SiteSearch。OCLC • Hermes。国立墨西哥大学 • SUMSearch。美国得克萨斯保健科学中心大学

  12. 3国外的一些相关研究情况 • 图书馆自动化系统产商产品 • EnCompass (Endeavor, MuseSearch) • Horizon Consolidated Searching (Dynix, WebFeat) • MetaFind (Innovative, MuseSearch) • MetaLib (ExLibris) • One Search (Follett, WebFeat) • SingleSearch (Sirsi, MuseSearch)

  13. 3国外的一些相关研究情况 • 国外研究及系统的主要特点 • 跨库检索系统一般都支持通过HTTP协议检索数据源和获取检索结果,这一点与一般的元搜索机制大体相似,但跨库检索更注意检索协议,如Z39.50等协议的应用; • 检索仅仅是信息服务的起点,跨库检索需要将资源和服务实现链接,如链接到电子期刊,链接到原文传递等; • 为了方便用户的使用,跨库检索系统一般提供定制功能和收藏夹功能,使用户能够重复使用其检索到的数据; • 在有些跨库检索系统中,提供了检索词前期规范,如NLM Gateway和SiteSearch都提供了通过词表进行检索词规范的功能。

  14. 4 CrossSearch系统建设情况 • “CrossSearch跨库集成检索系统”是中国科学院文献情报中心承担的国家科学数字图书馆建设项目“基于元搜索的网络数据库集成检索系统”项目的研究成果

  15. 4 CrossSearch系统建设情况 • “基于元搜索的网络数据库集成检索系统”项目的研究目标 • 调研、综述有关国内外集成检索系统的现状及趋势研究报告; • 提出国家科学数字图书馆集成检索系统采用的技术标准、系统设计方案; • 研制国家科学数字图书馆集成检索系统,并及时提供集成检索服务; • 发表本课题调研和研究等有关学术论文。 • “基于元搜索的网络数据库集成检索系统”项目从2002年下半年启动

  16. 4 CrossSearch系统建设情况 • “CrossSearch跨库集成检索系统” 在2003年初开始提供服务,最初发布的版本只支持8个数据库的检索。

  17. 4 CrossSearch系统建设情况

  18. 4CSDL“CrossSearch跨库集成检索系统”项目的建设情况4CSDL“CrossSearch跨库集成检索系统”项目的建设情况 • 经过不到一年的努力, CrossSearch跨库集成检索系统经过3次改版。 • 目前集成了丰富的资源,可以分为6类近百种不同来源、不同结构的数据资源。 • 集成的数据源主要包括CSDL购买的全文数据数据库、文摘索引数据库、电子图书资源、网络免费资源、联合目录资源和国内外重要的OPAC资源。

  19. 4 CrossSearch系统建设情况

  20. 5 CrossSearch的主体框架 • CrossSearch的6个核心组件 • 统一检索入口 • 检索请求处理模块 • 各协议连接器引擎 • 特定资源的各协议连接器(HTTP连接器,Z39.50连接器,OAI连接器) • 检索结果处理模块 • 结果呈现模块

  21. 总控管理 用户界面 检索参数定制 资源定制 检索结果保存 用户管理 Session管理 认证管理 日志管理 统一检索入口 统一格式结果反馈 针对特定资源的元数据 结果格式转换配置文件 检索请求处理API 连接器引擎 API 检索结果处理API 检索请求处理模块 各协议连接器引擎 检索结果处理模块 HTTP连接器 Z39.50连接器 JDBC连接器 OAI连接器 Internet数据源 Z39.50服务器 本地数据库 OAI服务器

  22. 5 CrossSearch的主体要特点 • 1一站式的信息检索 • 用户只需通过一个统一的检索界面,就可以同时对多个数据源(网络数据库)进行检索,简化了多数据源检索的过程,节省了用户查找信息的时间。

  23. 5 CrossSearch的主体要特点 • 2多数据源的检索集成 • 目前,系统已集成了6类、近百种不同来源、不同结构的数据源,基本上覆盖CSDL购买的网络资源。 • 集成的数据源主要包括全文数据数据库、文摘索引数据库、电子图书资源、网络免费资源、联合目录资源和国内外重要的OPAC资源。

  24. 5 CrossSearch的主体要特点 • 2多数据源的检索集成 • 全文数据库 • 系统目前提供16种网络全文数据库的检索集成,分别是维普科技期刊全文数据库、Springer-Link电子期刊、Science Online、ProQuest博士论文全文数据库、Nature、Johnwiley、IOP(Institute of Physics)、IEL(IEEE/IEE)、HighWire、Elsevier ScienceDirect、DOAJ(Directory of Open Access Journals)、CellPress、APS(American Physical Society)、AIP(American Institute of Physics)、ACS(American Chemical Society)、ACM(Association for Computing Machinery)

  25. 5 CrossSearch的主体要特点 • 2多数据源的检索集成 • 文摘索引数据库 • 系统提供11种文摘/索引数据库的检索集成,分别是中科院学位论文库、馆藏西文会议论文库、SCI、RSC(Royal Society of Chemistry)、ISTP、INSPEC、Ingenta、EI Village、Cambridge University、BP(BIOSIS Previews)、ASME(American Society of Mechanical Engineers)

  26. 5 CrossSearch的主体要特点 • 2多数据源的检索集成 • 电子图书资源 • 集成了方正电子图书、Springer电子丛书、Springer LB电子工具书、Knovel网络版电子工具书,共4种数据库。 • 网络免费资源 • 系统目前提供对Google和Yahoo!的集成检索服务。

  27. 5 CrossSearch的主体要特点 • 2多数据源的检索集成 • 联合目录资源 • 包括中科院联机联合目录数据库、全国中日俄西文期刊联合目录库、广东省文献编目中心、地方版文献联合采编协作网,共4种数据库。

  28. 5 CrossSearch的主体要特点 • 2多数据源的检索集成 • OPAC库资源。 • 系统目前提供对国内外54种OPAC数据库的集成检索,如中科院图书馆、国家图书馆、北京大学图书馆、清华大学图书馆、中国人民大学图书馆、美国国会图书馆、加拿大国家图书馆、 Ohio LINK、苏格兰国家图书馆、牛津大学图书馆、丹麦阿伯格大学图书馆、丹麦阿伯丁大学图书馆、丹麦Arhus科技书目、丹麦Arhus公共图书馆书目、澳大利亚 Defence Force Academy Library、Michigan State University Library、Australian National University Library等。

  29. 5 CrossSearch的主要特点 • 3检索结果的统一呈现 • 系统自动合并不同数据源的检索结果,并支持二次检索,实现了真正意义上的信息整合与检索结果统一呈现。 • 多种预设功能。可以对检索字段、去重标准、排序标准、显示记录条数等进行预先设定。 • 多种结果显示。简单、详细 • 多种排序方式。题名、数据库、作者 • 多种查重手段。三种查重方式。 • 支持二次检索。系统支持用户在原有检索结果的基础上进行二次检索。

  30. 5 CrossSearch的主要特点 • 4个性化的资源定制 • 系统支持个性化定制,用户登录到跨库集成检索系统后,可以定制自己常用的数据库资源,构成多个资源组。下次检索时,系统默认在用户定制的资源中进行检索。

  31. 5 CrossSearch的主要特点 • 5检索和服务的集成 • 跨库集成检索系统与原文传递服务无缝连接,支持原文传递功能。不具有全文使用权限的用户可以通过该系统获取所需资源的全文。

  32. 5 CrossSearch的主要特点 • 6 动态的数据源扩展 • 系统采用动态的资源管理机制,管理员只需填写工作表单,就可动态地集成新的数据源,整体架构具有良好的可扩展性。

  33. 5 CrossSearch的主要特点 • 7 便利的应用情况统计 • 系统提供多种应用统计,例如数据库使用统计、原文请求统计、原文请求处理统计等,方便管理员了解各种网络数据库的应用情况,明确用户的使用需求。

  34. 欢迎访问我们的系统 • 项目情况介绍完毕 • 在报告完成之后我们留下了点时间,各位嘉宾可以到演示区试用本系统 • http://cross.csdl.ac.cn/

  35. 谢谢 • 问题?

More Related