400 likes | 515 Views
融合技术、整合资源、创新服务. —— 国家数字图书馆建设实务. 国家图书馆 王乐春. 1. 3. 2. TRS. 目录. TRS. TRSs. 一、 Technology Resource Service. 数字图书馆发展规划. 服务(目的). 资源(基础). 技术(支撑). 首先必须考虑规划方案的最终成果能否形成新的满足数字图书馆用户需求的服务。. 必须考虑在规划方案实施与执行中的资源保障能力,即提供服务所需要的资源是否可获取。. 必须认真考虑建设方案的技术支撑条件,即所涉及的技术成熟度、发展速度及其在数字图书馆应用的可能性。. 4.
E N D
融合技术、整合资源、创新服务 ——国家数字图书馆建设实务 国家图书馆 王乐春
1 3 2 TRS 目录 • TRS • TRSs
数字图书馆发展规划 服务(目的) 资源(基础) 技术(支撑) • 首先必须考虑规划方案的最终成果能否形成新的满足数字图书馆用户需求的服务。 必须考虑在规划方案实施与执行中的资源保障能力,即提供服务所需要的资源是否可获取。 • 必须认真考虑建设方案的技术支撑条件,即所涉及的技术成熟度、发展速度及其在数字图书馆应用的可能性。 4
数字图书馆三要素 • 04:可以根据实际情况进行取舍,需要承担一定的风险和投入一定的成本。 • 03:可以根据实际情况进行取舍,需要承担一定的风险和投入一定的成本。 服务 4 3 1 资源 技术 2 • 02:内部基础部分,关系到长期发展和内部战略部署。 • 01:应该优先建设的部分,建设成本最低。 5
1 2 3 • 1. 发展专有技术,推动技术圈升级 首先是通用技术的支持,如计算机等建设数字图书馆基础设施和应用系统所依赖的技术。 其次是专业技术的支持,如知识组织等贯穿数字资源生命周期全过程的相关技术。 最终要在前两者的基础上,结合数字图书馆用户需求,研究发展数字图书馆的特有技术,为用户提供高效便捷的工具。 6
2. 分层规划,促进资源圈调整 需想办法解决获取渠道的资源,是拓展数字图书馆服务的有效途径,资源价值高,需求旺盛,应制定计划下力气发展。 • 数字图书馆建设必不可少的资源,资源获取有保证,技术有支撑,服务有需求,需要重点保障。 为数字图书馆未来发展提前储备的前瞻性资源,需要敏锐的发展眼光,可在适当的范围内进行建设与研究。 “基础层” “紧缺层” “投入层” 7
3. 以用户需求为中心,加快服务圈扩展 • 数字图书馆的服务建设一方面要满足最广泛用户的基本信息需求; • 另一方面更要深度开发,为用户提供个性化、专业化、精品化的服务。 8
二、Target Requirement Support
建设世界上最大的中文数字信息保存基地与服务基地建设世界上最大的中文数字信息保存基地与服务基地 为全国乃至全球提供数字信息服务 目标 “国家数字图书馆工程” 2005年开始建设 2005 第一个国家级数字图书馆项目 “国家数字图书馆工程”批准立项 2001 中国国家图书馆开始率先跟踪国际数字图书馆进展 1996
利用先进的技术和传播手段,通过国家骨干通讯网,向全国和全球提供高质量的以中文数字信息为主的服务;利用先进的技术和传播手段,通过国家骨干通讯网,向全国和全球提供高质量的以中文数字信息为主的服务; 有重点地采集、建设和保存中文数字资源,建设世界上最大的中文数字信息保存基地;构建支持数字资源采集、加工、保存、服务的技术支撑平台; • “数字图书馆推广工程”目标是构建覆盖全国、互联互通、共建共享的超大型数字图书馆 1、国家数字图书馆发展目标 • 构建以国家图书馆为服务中心,以国内各大图书馆为服务节点的数字资源传递和服务体系,为其它行业性、地区性数字图书馆系统提供服务支撑;
信息用户群体的扩张促使服务方式多样 2、服务需求新挑战 • 数字图书馆推广工程的实施,使得数字图书馆的用户遍布全国各地乃至全世界。 • 随着网民数量的增长,信息用户群体不断扩大,农村地区、初中及以下的低学历人群和40岁以上的中老年人信息用户增长迅速。 12
信 息 用 户 群 体 的 扩 张 促 使 服 务 方 式 多 样 信 息 获 取 渠 道 的 改 变 促 使 服 务 渠 道 调 整 2、服务需求新挑战 • 截止2012年6月,手机网民数在半年时间增长了约3270万人,网民中用手机接入互联网的用户占比提升至72.12%,首次超过了电脑网民数量。 • 移动智能终端的普及,促成了普通手机用户向上网手机用户的转化,移动互联网的时代已经到来。 72.2% 70.63% 72.12% 13
信息获取方式的改变促使服务模式创新 信息用户群体的扩张促使服务方式多样 信息获取渠道的改变促使服务渠道调整 2、服务需求新挑战 • 除搜索引擎和网络新闻外,即时通信、微博、博客、社交网络、网络视频等及其在手机上的应用都成为了用户获取信息的方式,这些全新的信息获取方式对数字图书馆传统的信息组织、检索和服务模式提出了极大的挑战。 14
数 字 出 版 发 展 迅 速 3、资源环境新挑战 2011年我国数字出版总产值超过1300亿元,已占新闻出版行业总营业收入的9.5%。 截止2010年底,我国电子书总量已达115万种,年新增18万种;单独出版的数字报纸已达700份以上,电子期刊近万种。 2012年3月13日,已有244年历史的纸质版《大不列颠百科全书》停印,今后将只提供电子版。 15
数字图书馆成为资源产业链的重要一环 数 字 出 版 发 展 迅 速 3、资源环境新挑战 • 受免费浏览互联网资源的观念影响,数字图书馆成为当前数字出版的主要用户。 • 在经费有限的情况下,建立更为完备的资源体系,合理购买商用资源,提高资源利用率,降低资源使用成本,成为一种必然和必须。 16
数 字 出 版 发 展 迅 速 数字图书馆成为资源产业链的重要一环 数字图书馆用户的资源使用习惯和需求改变 3、资源环境新挑战 • 中文电子图书全文数据库使用量持续保持增长,部分数据库在2012年第三季度使用量的环比增幅达到了三位数。 • 由于利用VPN技术开通了远程访问部分外文期刊全文数据库,在2012年上半年的使用量已远超过2011年全年的使用量。 网络访问读者人次(亿) 17
4、系统支持 • 04:掌上国图 • 统一用户 • 03:发布与服务 • 版权系统 服务 4 3 1 资源 技术 2 • 02:互联网信息采集 • RFID升级 • 01:文津搜索 18
2012年9月29日,国家数字图书馆工程完成了一次蜕变,实现了从资源组织管理向资源揭示的飞跃2012年9月29日,国家数字图书馆工程完成了一次蜕变,实现了从资源组织管理向资源揭示的飞跃
文津搜索系统 一、建设背景 元数据 集中检索系统 OPAC检索系统 联邦检索系统 联邦检索 随着信息资源不断增加应运而生 也得到普遍使用, 但是效率较低、 体验较差。 元数据集中检索系统 开始出现, 有逐步取代OPAC和联邦检索系统的趋势, 成为图书馆检索系统的主流发展方向。 一直是图书馆 最主要的 书目信息检索系统, 目前还在广为 使用。
文津搜索系统 一、建设背景 国外早一步开始了图书信息检索方面的革命,实现资源的一站式发现与获取。用户只需使用单一检索框,即可访问图书馆的图书、期刊、报纸、论文等各种数字资源。 如果采用商业化检索系统,会存在一些问题: • 商业化系统面向一般应用,定制性不够,无法满足个性化定制需求。 • 商业化系统大多采用开源检索软件,无法满足高可靠性,高性能的要求。 • 通过推广工程部署和复用到全国公共图书馆,采用商业化软件无法解决复用的问题。 Summon 商业化 图书信息 检索系统 Primo OCLC
文津搜索系统建设目标 文津搜索系统 二、建设目标 结合基于互连网的 信息收集和数据分析挖掘技术, 向用户提供的一个统一、实时高效、精准权威的 数字图书馆数字资源元数据搜索服务平台。 整合国家数字图书馆自建或其它方式获取的数字资源 建立和维护 高性能分布式索引
文津搜索系统 三、系统指标 要求性能满足 要求性能满足 平均每分钟十万次检索请求 峰值每秒一万次检索请求 系统架构具有扩展能力 满足未来5亿条结构元数据 的检索能力
文津搜索系统 1、数据方面 数据 元数据主要来源: • 所有的自建、外购和征集的数据, • 收割图书馆联盟网站相关元数据和其它互联网相关元数据作为补充。 文津搜索系统的重要基础 系统对所有元数据进行统一的规范化、去重、加工和组织,使其符合检索的要求。
文津搜索系统 1、数据方面 文津搜索系统目前已整合 101个资源库,近2亿条元数据 自建资源数据库 41个 • 外文外购数据库 • 16个 • 中文外购数据库 • 44个 收集到的资源类型涵盖:图书、年鉴、期刊、论文、民国文献、地方志、古籍文献、图片、多媒体、网络信息资源等……
文津搜索系统 2、 技术方面 关键技术 Investor relations • 分布式索引 • 关联分析模型 Crisis management • 搜索引擎 • 高速数据存储及调度 • 互联网信息采集 • 检索质量控制 • 集群管理 • 数据挖掘与分析 • 可视化
文津搜索系统 3、服务 前端功能 检索服务 附加功能 索引建立和管理 监控运维 系统管理 文津搜索主要功能包括: 接口服务 检索质量保障 网络资源采集 数据分析和挖掘 数字图书馆数据整合 和文津系统的复用 资源获取服务
文津搜索系统 四、特色功能 1、海量资源的整合容纳 文津搜索系统没有数据容量的限制,利用分布式存储架构,可根据需要不断扩展数据容量。 文津搜索系统 接收 数图推广工程征集 各地方馆资源 容纳 其它文化行业机构 的各类资源 涵盖 国图所有的 自建和外购资源
文津搜索系统 四、特色功能 2、高效智能的检索揭示 • 文津搜索利用先进的分布式索引,制定高效的数据和索引更新机制,在满足检索结果时效性的同时,保证大并发压力下的响应能力。 • 系统架构具有扩展能力,当数据量增加和并发数增大时,可以通过自动增加服务器的方式来保证性能。 基于国家图书馆规范库数据的充分运用,可以保证资源的查全率和查准率; 基于资源引用和热度统计等因子的检索结果排序策略,可以保证读者得到高质量的检索结果; 基于用户行为分析的资源关联揭示和书目推荐,可以进一步提高检索服务质量。
文津搜索系统 湖北省图书馆 资源《红楼梦》 广东省图书馆 资源 《红楼梦》 四、特色功能 新疆自治区图书馆 资源《红楼梦》 吉林省图书馆 资源 《红楼梦》 3、联合编目数据的应用整合 国家图书馆资源 《红楼梦》 红 楼 梦 浙江省 图书馆 资源 《红楼梦》 IP为国图用户IP 四川省图书馆 资源《红楼梦》
文津搜索系统 四、特色功能 4、数字资源的可视化展现 文津搜索系统在保证整体风格一致的前提下,提供可视化视图,例如建立标签云、主题词和中图分类法关系视图,努力实现传统文献标引在资源关系可视化揭示方面的应用。 • 标签云 • 主题词 • 关系视图 中图分类法 关系视图
文津搜索系统 五、特色功能 5、数据挖掘技术的应用 相似文献推荐 • 建立基于元数据的文献相似模型,挖掘元数据相似的文献。根据与此条元数据的相似程度,向用户推荐相似文献。 相关文献推荐 • 利用用户检索行为挖掘元数据之间的关联关系。当用户检索数据并选取某一条元数据进行浏览时,可以根据与此条元数据的关联关系程度,向用户推荐相关文献。 个性化文献推荐 • 利用用户个性化设置的基本信息,建立用户模型,挖掘用户兴趣度。用户登录后,提供基于用户兴趣度的个性化文献推荐,满足用户获取个人兴趣文献的需求。
文津搜索系统 四、特色功能 6、完善的服务系统整合 身份认证 单点登录 获取全文 发布与服务系统 统一用户管理系统 预约续借 获取架位信息 咨询馆员 图书馆OPAC检索系统 虚拟参考咨询系统 文津搜索 系统 馆际互借和文献传递系统 Metalib联邦检索系统 获取资源 联邦检索 其他系统 如手机应用系统 全国联合编目系统 获取 馆藏信息分布 接口调用 定制检索
文津搜索系统 四、特色功能 7、多样化的复用模式 • 分馆、联盟馆的元数据都纳入文津搜索系统中统一检索揭示。 提交 数据 提交 数据 用户 统一检索揭示 分馆数据 成员馆数据
文津搜索系统 四、特色功能 7、多样化的复用模式 • 系统提供了数据检索的后台接口服务,供分馆、联盟馆或其它应用系统调用,以获取文津搜索系统所提供的定制搜索服务,从而实现文津的LOCAL检索功能。 发送检索请求 调用后台服务接口 文津搜索 系统 提供 文津local检索 提供定制检索服务 分馆或联盟馆 本地读者 分馆或联盟馆
文津搜索系统 四、特色功能 7、多样化的复用模式 • 文津搜索系统还可以伸缩部署到某个独立的分馆或联盟馆中。 国家图书馆 文津搜索 系统 延伸部署 成员馆 文津搜索系统 成员馆 延伸部署 分馆 文津搜索 系统 分馆
文化津梁 资源尽享 • 有价值的搜索 • 为图书馆界提供统一、高效的元数据整合服务 • 为读者提供精准、权威的数字资源揭示服务
融合技术、整合资源、创新服务 创新服务 整合资源 融合技术 39