570 likes | 719 Views
数字图书馆 的 发展及展望. 孙承鉴 研究 员 国家数字图书馆工程建设 专家 组组长 国家图书馆二期工程暨国家数字图书馆工程顾问 全国文化信息资源共享工程专家咨询委员会主任委员 中国缩微摄影技术协会理事长. 目录. 一、 数字图书馆概述 二、 国际上数字图书馆的研发情况 三、 我国数字图书馆的研发情况 四、 我国数字图书馆的建设项目 五 、 数字图书馆建设中应注意的几个问题 六、 数字图书馆展望. 一、数字图书馆概述 (一)基本概念. 1、 DL 是复杂的知识系统。 2、 DL 的实现是一个过程。
E N D
数字图书馆的发展及展望 孙承鉴 研究员 国家数字图书馆工程建设专家组组长 国家图书馆二期工程暨国家数字图书馆工程顾问 全国文化信息资源共享工程专家咨询委员会主任委员 中国缩微摄影技术协会理事长
目录 • 一、数字图书馆概述 • 二、国际上数字图书馆的研发情况 • 三、我国数字图书馆的研发情况 • 四、我国数字图书馆的建设项目 • 五、数字图书馆建设中应注意的几个问题 • 六、数字图书馆展望.
一、数字图书馆概述(一)基本概念 1、DL是复杂的知识系统。 2、DL的实现是一个过程。 3、DL是超大规模的、便于使用的、没有时空限制的知识中心。
数字图书馆,是面向未来互联网发展的信息管理模式。以数字资源的制作、存储、管理、传输和服务为主要特征的数字图书馆技术,是21世纪国际科技文化竞争的焦点之一。数字图书馆,是面向未来互联网发展的信息管理模式。以数字资源的制作、存储、管理、传输和服务为主要特征的数字图书馆技术,是21世纪国际科技文化竞争的焦点之一。
数字图书馆涵盖多个分布式、超大规模、可互操作的异构多媒体资源库群,面向社会公众提供全方位的知识服务。可以说,数字图书馆将实现对人类知识的普遍存取,并最终消除人们在信息获取方面的不平等。它既是知识网络,又是知识中心,同时也是一套完整的知识定位系统。数字图书馆涵盖多个分布式、超大规模、可互操作的异构多媒体资源库群,面向社会公众提供全方位的知识服务。可以说,数字图书馆将实现对人类知识的普遍存取,并最终消除人们在信息获取方面的不平等。它既是知识网络,又是知识中心,同时也是一套完整的知识定位系统。
(二)数字图书馆的发展背景 NII(国家信息基础设施)建设急需大规 模有严密组织的信息资源库 因特网用户急需高效能信 息检索系统 走向知识经济的社会需要面向对象 的知识网络给以支持
(三)数字图书馆的主要特征 • 数字图书馆是信息基础设施。 • 数字图书馆是创新型信息资源的建设服务环境 。 • 数字图书馆建设的核心是网络知识内容的组织。 • 数字图书馆是实现跨库查询的知识中心。
二、国际上数字图书馆的 研发情况G8全球信息社会项目 美、法、日、英、加、德、意、俄等 国, 其内含各国文化历史精华等内容。
G8全球信息社会项目 “美国记忆”(美国国会图书馆) “数字图书馆规划”(英国国家图书馆) “德国图书馆”(德国国家图书馆) “Gallica”(法国国家图书馆) “加拿大数字化规划”(加拿大国家图书馆) “日本国会图书馆电子图书馆初步设计”(日本国会图书馆) “西班牙记忆”(西班牙国家图书馆) “世界记忆”(捷克共和国国家图书馆) “1997~2000政策计划”(荷兰王国国家图书馆) “人民之间的交流”(各国) →返回主目录
美国数字图书馆的发展美国数字图书馆始于1993年,后纳入国家信息基础设施(NII)计划中,由白宫总统信息基础设施特别工作组和竞争政务会主持。美国数字图书馆的发展美国数字图书馆始于1993年,后纳入国家信息基础设施(NII)计划中,由白宫总统信息基础设施特别工作组和竞争政务会主持。
数字图书馆 危机及应急管理 教育及终身学习 电子商务 能源管理 环境控制和废品最小化 保健 加工处理和产品 公众存取政府信息
(地域范围) Distribution (广域) Wide Area (内容规模) 应急管理 知识网络 Content Scale Crisis Management Knowledge Network (区域) Regional (本地) Local (生命周期) Lifetime Hours/Days Months/Years Decades/Centuries (数时/数天) (数月/数年) (数十年/数世纪) 美国NFS(国家科学基金会)关于知识联网的白皮书附图 综 合 数字图书馆 General Digital Library 全 球 决策网络 Global Design Decision Network 本 地 决策网络 Immense (巨型) Local Design Decision Network Moderate (中型) Tiny(小型)
1999年致总统的报告(信息技术研究:投资于我们的未来)中提出二十一世纪美国信息技术的研究与开发的四项重点,其中在“软件研究”及 “可扩展的信息基础设施” 中均专门提出建设数字图书馆。 2001年致总统的报告[数字图书馆:对人类知识进行普遍存取]中指出:数字图书馆提供的是创新型资源和服务。认为联邦政府应在创建和组织数字图书馆中包括支持相关的研究、建立大型数字图书馆试验平台、提供(政府具有的)必要的资源、以及在公正处理数字时代的知识产权起到领导作用。 PITAC
NSF/DARPA/NASA/ 联合发出 DLI-1倡议 D.L先导研究计划一期工程 (1994—1998)
D.L先导研究计划一期工程参加单位 DLI-1投资2400万美元 1.《信息媒体:综合声音、图象和语言理解 卡内基·梅隆大学 技术于数字式视听图书馆的创建和探索》 2. 《环境科学电子图书馆:一个可放大的、 智能化的、分布式电子图书馆原型》 加州大学伯克利分校 3 .《密歇根大学数字式图书馆研究 》 密歇根大学 4.《亚历山大工程:建立具有图象和 加州大学圣·巴巴拉分校 空间参照信息的综合性服务功能 的分布式数字式图书馆》 5.《斯坦福集成数字式图书馆项目》 斯坦福大学 6. 《构造互联空间:为大学的工程学科 建立数字图书馆基础设施》 伊利诺依大学
NSF/DARPA/NLM/LC/NASA/ NEH联合发出 DLI-2 倡议 D.L先导研究计划二期工程 (1999—2004) 投资6000万美元 目标:在发展下一代数字图书馆的研 究基础上居领导地位; 推进全球分布的网络信息资源的使用; 激励创新应用领域。
美国记忆(America Memory) 数字图书馆项目 美国国会图书馆等16个图书馆、档案馆参与,主要是将美国图书、手稿、音乐、照片、影像等历史资料,计500万件文献经过编辑转化为数字化格式。 1995年启动2000年完成,总投资6000万美元。 目前已有80个历史资源库上因特网服务,集中反映了美国200年来的历史文化遗产。
美国在研究方面提出 1.以人为中心的研究:软件工具、智能用户界面、经济和社会影响等。 2.以内容和藏品为基础的研究:数据、元数据、可互操作性、交互存取等。 3.以系统为中心的研究:体系结构、组件与集成技术、智能代理、评估等。
当前美国在数字图书馆 发展上的一些特点 1,数字资源永久保存的技术、标准、规范成为美国研究的主要方向与趋势之一。 2,OAIS(开放档案信息系统)将成为主要遵循的标准。 3,门户与多导引系统成为数字资源服务的关键之一。 4,数字挖掘技术将针对非结构化的文档。 5,开放源代码将成为二次开发的主要基础。 数字图书馆在美国已经从研究进入到了实施阶段,近几年来尤其是在图书馆的应用得到了很大的发展,并开始出现国家层面的大型数字图书馆应用项目(如NDIIPP“国家数字信息基础设施和长期保存计划” )。
中国试验型数字式图书馆项目 • 1997年立项,国家重点科技项目。由国图和六省市图书馆合作于2001年5月完成。 • 该项目设计开发了通用套装的数字图书馆系统以及数字资源加工系统, 建立了跨地域多馆合作的网络资源建设体系。 • 鉴定委员会认为该项目在我国创建了一个分布式、可扩展、可互操作的具有一定资源规模的试验型数字图书馆。达到国内领先国际同类技术水平。
数字图书馆分布式检索 叶剑英
知识网络——数字图书馆系统工程项目 • 1998年国家863项目。由国家图书馆与中科院计算机研究所合作完成。2001年3月,通过专家组验收。 • 该系统是在因特网环境下,其体系结构包含多个分布式数字资源库。系统集成代理技术,实现横跨多个资源库快速查询检索。数字资源库建设符合国际数字图书馆研究和实践的相关规范,为在广域网上建设我国数字图书馆群提供一种有效的实施方案。
中关村科技园区数字图书馆群软课题研究 • 1999年6月,国家图书馆牵头,与北大图书馆、清华图书馆、中科院文献情报中心、国防大学图书馆和首都图书馆等联合进行。 • 完成了中关村科技园区数字图书馆群的结构框架,制订出中关村科技园区数字图书馆群的实施方案,编篡了一册论文集。 • 该项目于2000年12月通过专家组验收。
数字图书馆标准规范研究 • 2002年由国家科技图书文献中心、科学院图书馆、国家图书馆、CALIS管理中心等十四家文献信息机构共同参与的科技部科技基础性工作专项资金重点项目《我国数字图书馆标准规范建设》(CDLS),在数字图书馆标准规范研究方面已经取得了阶段性结果。这些成果对于全国数字图书馆建设具有重要的指导意义。 • 共有10个子项目。 • 网址 http://cdls.nstl.gov.cn/cdls2/w3c/
数字图书馆发展研究 • 2002年7月由国家计委社会发展司牵头,组织国家图书馆、科学院图书馆、CALIS管理中心、社科院图书馆、中央党校图书馆、国防大学图书馆等单位联合。目标是研究数字图书馆发展的现状及其趋势,并制定发展规划的指导性原则,避免重复建设。 • 该项目于2004年已基本完成。
四、我国数字图书馆的建设项目(一)国家数字图书馆工程(中国数字图书馆工程)1998年7月,国家图书馆向文化部提出申请, 建议在国家立项实施“中国数字图书馆工程”。
文化部于2000年向国家计委提交了《国家图书馆二期工程暨中国数字图书馆工程项目》立项建议书。文化部于2000年向国家计委提交了《国家图书馆二期工程暨中国数字图书馆工程项目》立项建议书。 2001年10月31日,“国家图书馆二期工程暨国家数字图书馆基础工程”经国务院正式批准立项。
2002年12月25日“国家图书馆二期工程暨国家数字图书馆基础工程”可行性研究报告经国务院正式批准。2002年12月25日“国家图书馆二期工程暨国家数字图书馆基础工程”可行性研究报告经国务院正式批准。 工程总建筑面积 77,687平方米 ,其中:国家图书馆二期工程为64,766平方米,国家数字图书馆工程为12,921平方米。 工程总投资预计123,500万元。
2004年11月,国家图书馆二期工程初步设计经发改委批准,12月破土动工。 • 2005年3月,委托招标代理机构选聘了世源科技工程有限公司(中国电子工程设计院)承担国家数字图书馆工程的初步设计工作。 • 《国家数字图书馆工程初步设计》于2005年7月1日由国家项目评估中心召开专家论证会。2005年10月17日国家发改委批准实施。
(二)国家科学数字图书馆工程 该工程于2001年12月启动。 国家科学数字图书馆工程是中科院知识创新工程的重要组成部分和科技现代化的支撑体系,它以数字图书馆机制有效地支持科学研究和知识服务,将于2006年完成。 中国科学院投资1.4亿元人民币。
(三)中国高等教育文献保障体系( CALIS) • CALIS是国务院批准的211工程总体建设规划中的两个公共服务体系之一。在九五期间,建成了以CERNET为依托的网上信息资源共享系统,有61所大学参与。 • 在十五期间,它的目标是建立中国高等教育数字图书馆。有100多所大学参与。 • 国家投资1.5亿元人民币。
(四)中共中央党校数字图书馆工程 . • 已酝酿多年,计划用5年时间完成。 • 其结构为: • 面向社会的中心网站和若干特色子网站; • 分为内部网和外部网; • 内网是党校的工作网,外网是对外联系、宣传的窗口。 • 项目结束时,建设中文数字资源库总容量10至15TB • 2004可行性研究论证经费约2.5亿人民币, 其中数字图书馆部分约1.5亿人民币。
五、数字图书馆建设中应注意的几个问题(一)统筹规划,分步实施五、数字图书馆建设中应注意的几个问题(一)统筹规划,分步实施 • 1、基础环境和设施必须具备:不能盲目上马; • 2、数字图书馆建设是长期任务:不能急于求 • 成; • 3、一定时期要有有限的实现目标:要有务实 • 精神。
(二)资源建设是核心 • 资源来源有多种渠道、多种介质、多种媒体;强调资源的重组和整合。 • 资源加工、组织应严格按数字图书馆的规范格式,以免造成不可共享。 • 资源是分布式的,强调边建设,边服务。
(三)采用先进、实用的技术支持 • 自动标引,自动文摘生成,自动篇名生成技术。 • 工业化的OCR技术。 • 压缩、解压缩技术。 • 分布式、网络环境下的高效调度系统。
音频、视频网络流式推送、传输、播放软件及其实用的加工生产系统。音频、视频网络流式推送、传输、播放软件及其实用的加工生产系统。 • 多语言技术。 • 以人工智能技术为基础的知识挖掘、基于内容的图像及视频检索技术。 • 支持SGML/XML的搜索引擎等。
(四)标准规范先行 • (五)重视解决知识产权问题 • (六)加强协调管理,避免重复浪费 →返回主目录
六、数字图书馆展望 近几年科学技术新的发展以及若干工程项目的启动,为数字图书馆实施创造了有利的条件。 以下仅举例说明。
(一)数字图书馆标准规范建设有了新的进展 《我国数字图书馆标准规范建设》(CDLS),2004年9月已完成并发布了89份研究报告。这些成果对于全国数字图书馆建设具有重要的指导意义。 OAIS(开放档案信息系统)成为主要遵循的标准。 数字资源永久保存的技术、标准、规范成为研究的主要方向与趋势之一。
(二)数字版权管理(DRM)技术在发展为介决知识产权提供了技术手段(二)数字版权管理(DRM)技术在发展为介决知识产权提供了技术手段 • 数字版权管理(DRM)提供了关于版权保护和数字媒体内容的传输、管理和发行的一套解决方案,主要是保护数字媒体内容免受未经授权的播放和复制的方法。 • 数字水印、密钥技术等也有了很大的发展。 • 国内有不少单位在研制开发DRM系统。
(三)IPv6协议的应用,为IP地址的无限扩充开辟了道路(三)IPv6协议的应用,为IP地址的无限扩充开辟了道路 • 目前的Internet网络是基于IPv4技术。 • IPv4产生于1974年,最早用于科学研究和教育领域,方便技术人员之间实现文件共享和一些简单的通信功能,因而IPv4协议并没有考虑作为电信级网络支撑协议所必须具备的一些特性,存在着设计缺陷。 • 网上信息服务工作面临IP地址严重缺乏的问题。
IPv6继承了IPv4的端到端的基本思想和简单、高效、开放的特点,同时具有几乎无限的地址容量,支持规模更大的网络结构,改进了安全性和数据的完整性,具有自动配置、移动计算、数据组播和更有效的网络路由聚合等优点,是下一代网络的理想协议。IPv6继承了IPv4的端到端的基本思想和简单、高效、开放的特点,同时具有几乎无限的地址容量,支持规模更大的网络结构,改进了安全性和数据的完整性,具有自动配置、移动计算、数据组播和更有效的网络路由聚合等优点,是下一代网络的理想协议。 • 在各国厂商的共同努力下,从IPv4到IPv6的转换在技术上已不是难题。 • 因此采用下一代互联网IPv6技术具有很大的现实意义。
(四)网格技术的发展为资源共 享扩展了领域 • 信息资源服务系统中一个非常重要的理念就是信息资源的共建共享,而网格技术则利用高速因特网把分布于不同地理位置的计算机、数据库、存储器和软件等资源连成整体,就像一台超级计算机一样为用户提供一体化信息服务,其核心思想是“整个因特网就是一台计算机”,这与共建共享的理念不谋而合。
电力网格 • 称电力网为 Power Grid,指本地与远处许多发电厂组网,为许许多多的用户提供 pervasive (普及的、遍布的、扩大的)服务。 • Pervasive 服务,指用户通过任意一个通用的插头,就可以按需获取电力,而不用操心功率耒自哪一个发电厂。 • 电力网是一种 pervasive/grid型的并行共享结构。