1 / 42

我国高校数字资源长期保存的 挑战与策略

我国高校数字资源长期保存的 挑战与策略. 朱强 2008 年 11 月. 提纲. 引言 高校数字资源建设现状 高校数字资源保存现状 高校数字资源长期保存的策略 结语. 引 言. 我们面临一个全新的数字环境. 无所不在的网络和无所不在的计算 信息化成为国家建设五大战略任务之一 电子商务、电子政务、数字出版、无纸办公 … 数字地球、数字城市、数字社区、数字校园、数字图书馆 … 家电数字化和数字产品家电化(数字家庭). 信息技术促使学术交流体系发生变化. 出版从“分子书”走向“电子书”,使得电子出版、网络出版变得越来越普遍

Download Presentation

我国高校数字资源长期保存的 挑战与策略

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 我国高校数字资源长期保存的挑战与策略 朱强 2008年11月

  2. 提纲 • 引言 • 高校数字资源建设现状 • 高校数字资源保存现状 • 高校数字资源长期保存的策略 • 结语

  3. 引 言

  4. 我们面临一个全新的数字环境 • 无所不在的网络和无所不在的计算 • 信息化成为国家建设五大战略任务之一 • 电子商务、电子政务、数字出版、无纸办公… • 数字地球、数字城市、数字社区、数字校园、数字图书馆… • 家电数字化和数字产品家电化(数字家庭)

  5. 信息技术促使学术交流体系发生变化 • 出版从“分子书”走向“电子书”,使得电子出版、网络出版变得越来越普遍 • 刚刚落幕的法兰克福书展上,超过30%的展品是数字化产品 • 统计显示,我国现有电子图书50万种,互联网期刊9000种,数字报纸600多份。预计未来5年,将有30%的手机用户通过手机阅读电子书和数字报,由图书馆等机构用户采购的电子书、数字报的销售规模将达到10亿元,由网民和手机用户带动的电子书、数字报内容销售及广告收入将达到50亿元。 北京大学图书馆

  6. 学术交流的渠道增多、范围更广,开放获取运动和机构存储成为网络环境下学术界传播及出版学术信息的一种新的方式学术交流的渠道增多、范围更广,开放获取运动和机构存储成为网络环境下学术界传播及出版学术信息的一种新的方式 • 据西安交大图书馆的统计,国外开放获取期刊已超过12000种 北京大学图书馆

  7. 学习和研究的方式在变化,许多人习惯于用搜索引擎查找资料,对电子书刊的阅读日益增加学习和研究的方式在变化,许多人习惯于用搜索引擎查找资料,对电子书刊的阅读日益增加 • 中国出版科学研究所有关报告表明:我国国民传统介质阅读率持续6年下降的同时,网络阅读率6年来则上升了6.5倍。今年发布的第五次全国国民阅读调查报告也显示,互联网阅读已达44.9%,比2005年提高了17.1%,已经接近了48.8%的图书阅读率。 -- 《解放日报》2008年11月8日 北京大学图书馆

  8. 关于未来信息资源获取的预测

  9. 美国同行认为,到2025年,纸本书刊将会从图书馆消失美国同行认为,到2025年,纸本书刊将会从图书馆消失 数字资源越来越多,甚至占据主体地位,应该是趋势

  10. 文献(技术报告、会议论文、预印论文) 图书 学位论文 数据集 计算机程序 视觉、模拟模块 多媒体出版物 电子刊物 书目、目次、摘要 图像 视听资料 格式化数字收藏 电子教学资料 网页 管理资料 已有数字资源类型一览

  11. 图书馆借助于信息技术走向数字化 • 大量的纸质文献和其他文献被数字化,形成图书馆的特色资源 • 超过三分之一的经费被用于购买数字资源或购买数字资源访问权 • 互联网上的学术信息被加以组织,形成导航库;许多网站的信息被有计划地下载,与上述资源共同构成图书馆的数字资源

  12. 图书馆实体资源和虚拟资源的结合必然要求加强对数字资源的管理和保存图书馆实体资源和虚拟资源的结合必然要求加强对数字资源的管理和保存 • 数字资源的虚拟性 • 数字资源的多样性 • 数字资源的脆弱性 • 数字资源建设和使用的复杂性

  13. 高校数字资源建设现状

  14. 高校图书馆的数字资源包括 • 商业化的数字资源(多数为租用,少数为拥有) • 多馆共建的数字资源 • 单馆自建的数字资源

  15. 以北大图书馆为例 • 各种数字资源学科门类基本齐全,引进的SCI、中国期刊网、Jstor、新东方网络课程等国内外数据库已达近500个 • 网上全文电子期刊达45,000多种,各类电子图书和学位论文等近50万册 • 数字扫描加工的古文献、民国图书、学位论文、教学参考书和民国旧报刊等印刷型资源超过12TB • 拥有近16TB的本地数字资源,并且每年以7-8TB的速度增长

  16. CALIS数字资源类型

  17. CALIS 数字资源数量

  18. CALIS集团引进数据库 • 目前,CALIS集团共购买数据库283个,其中文摘索引数据库126个,电子期刊数据库80个,电子图书数据库21个,事实型数据库52个,其它数据库4个。

  19. 其中,全文电子期刊30,636种(去重后约24,000种)其中,全文电子期刊30,636种(去重后约24,000种) • 会议录8,557种 • 电子图书(包括学位论文)145,052种 • 平均回溯年限大约15年

  20. CALIS 自建特色数字资源(65) 中国科技史数字图书馆资料库 猪养殖特色数据库 铁路交通运输特色数据库 湖南人物数据库 长江资源库 中国年谱数据库 跨国公司研究专题数据库 上海百个著名作家学术研究资料数据库 机器人信息系统 河南地方文献数据库 华侨华人文献信息专题数据库 电子科学与技术重点学科特色库 东北亚研究数据库 潮汕文献数据库 汽车工程信息数据库 钱伟长特色网站数据库 高校古文献资源库 高校音乐教育资源数据库 朱子研究 特色农产品加工专题数据库 东南亚及闽台研究数据库 无人驾驶飞机专题文献数据库 红色江西特色数据库 《红楼梦》特色数据库 大珠三角地区研究文献数据库 经济学学科知识门户 粮油食品专题特色数据库 食品科学与工程专题数据库 书院文化数据库 猪养殖特色数据库 饲料添加剂专题特色库 民国时期文献资源库

  21. CALIS 自建特色数字资源(续) 巴蜀文化特色数据库 中国年谱数据库 民用航空专题数据库 摩托车信息特色资源数据库 中国水力发电工程 猪养殖特色数据库 《江南制造局》专题特色库数据库 CAD/CAM专题文献数据库 心血管疾病信息资源数据库 中国年谱数据库 民族相关文献特色库 小麦文献信息数据库 《北大讲座》视频点播资源库 河南地方文献数据库 陆相油气勘探开发专题数据库 汽车资源数据库 邮电通信专题文献数据库 潮汕文献数据库 西夏文化数据库系统 行为科学专题数据库 复合材料专题特色数据库 高校音乐教育资源数据库 中国民族音乐数据库系统 河洛文化文献专题数据库 中国农村问题研究文献数据库 无人驾驶飞机专题文献数据库 北大名师多媒体特藏数据库 中国邮政数据库 建筑艺术与技术资料库 经济学学科知识门户 中国建筑文化特色数据库 兽药文献信息数据库 中国航运信息资源库

  22. 单馆自建数字资源 以北大图书馆为例 • 祕籍琳琅—北京大学图书馆古文献资源库 • 北京历史地理数据库 • 北京大学学位论文数据库 • 北大名师数据库 • 视频点播多媒体数据库 • 热点话题数据库 • 新书导读数据库 • 网上咨询台—常见问题数据库 • 一小时讲座—课件数据库 自建数据库数据量已超过12TB,品种和数量将继续增加

  23. 高校数字资源保存现状

  24. 目前的模式 • 引进数字资源的存档 • 镜像模式 • 裸数据模式 • 自建数字资源的存档 • 备份模式 • 镜像模式

  25. 问题与挑战 • 总体上缺乏完整的数字资源长期保存政策和战略规划 • 引进资源方面,缺乏强制性的有效的措施和手段 • 自建资源方面,缺乏政策指导、规划协调和监督检查 • 技术上,缺乏系统的研究和完善的方案 • 最根本的,缺乏资金投入

  26. 高校数字资源长期保存的策略

  27. 关于数字资源长期保存 • 美国研究图书馆组织(RLG)对“可信赖的数字仓储”(trusted\reliable digital repository)作了如下定义:“一个可信赖的数字仓储,是以提供对受控数字资源长期存取为使命的仓储;其职责是为了存储者以及当前和将来用户的利益对数字资源进行长期维护;按照普遍接受的惯例和标准设计系统以保证实时管理、存取和存储其中的资料的安全;建立系统评估方法以满足用户对于文档真实性的需求;可以被可靠地用来公开和明确地履行对存储者和用户的长期职责;其政策、运行和表现可以被稽核和测量。”

  28. 数字资源保存的目标 • 数字资源在存储媒体上的可读性 • 数字字符串可以被人或电脑阅读和处理 • 格式化内容可以被它的使用者理解 • 数字资源与它所代表的原体相同(或记载不同之处)

  29. Rosenthal等人提出了系统的保存策略: • 复制(replication),提供对数字资源的备份; • 迁移(migration),将数字资源迁移到新的系统或平台; • 透明(transparency),公开数字资源的编码,以利于解读和迁移; • 多样(diversity),多种格式并存,以便某些格式过时时,其他格式仍可替代; • 稽核(audit),不断对数字资源的状态进行检查,确保其完好; • 经济(economy),确定保存项目的轻重缓急,首先确保最重要的部分; • 怠速(sloth),有意降低系统运行速度,以便在数据崩溃时增加修复的可能性

  30. 保护数字资源的几种做法 • 载体更新(Refreshing) • Tape->harddisc->CD->DVD, copy without change • 原始形态保存(Static Preservation) • Preserve the bits • 旧新迁移(Migration) • Periodic transfer of materials from one hardware/software configuration to another • 模仿环境(Emulation) • Provide software tools to emulate or mimic essential viewing applications and operating environments

  31. 不同类型数字资源的保存策略 • 重要商业资源的存档:商业资源的服务一般是有保障的,对这类资源CALIS将和其他共享组织联合起来分工协作保存,并做战略性存档,防止突发的事件和突然的灾害 • 高校自建资源的存档:这类资源是有组织建设的,目的性强,应在组织大家建设的同时,集中存档。但是这类资源的后续服务中的问题,如版权等,是需要加以考虑和解决的 • 网上免费资源的存档:选择对重点学科建设有用的资源,整体规划,分工协作 • 教学科研过程中产生的资源:加强各校的论文、报告、课件等资源的收集、整理和加工

  32. 原则性考虑 • 联合其他系统,共同建立安全存储数据的网络,对缺少和没有后继服务的有价值资源进行存档,防止和减少资源的丢失 • 集中和分布结合,同类资源能集中到一起的,集中保存,并进行异地备份;不适合集中到一起的,分散保存。能提供集中服务的,集中服务;否则,分散服务 • 鼓励地方增加存档经费,减轻中央投资的压力 • 为全国和地区中心配备存档设备,由CALIS核心馆承担存储任务 • 引进的商业资源保留1个备份,自建资源保留2个或2个以上备份

  33. 数字资源建设应当采取以下策略: 在项目之初就重视有关保存政策的制订; 采用国际标准与通行做法,如OAIS (Open Archival Information System); 尽量采用无产权(non-proprietary)系统,以减少来自软件所有者的限制; 建立永久性文档管理措施; 合作建立可靠的数字仓储。

  34. 建立统一的长期保存技术平台 • 建立Open Access平台 • 建立统一规划下的机构仓储平台 • 为其他开放资源提供存取平台 • 建立数据储存与灾备系统 • 建立数字资源保存中心

  35. 关于数字资源保存的国家战略(建议) • 立法保障商业化数字资源的长期可获得性 • 使用权 • 存档权 • 重视原生数字资源的采集和保存 • 必要性 • 战略与规划 • 分工与合作 • 机构仓储 • 主题仓储

  36. 统一规划建立国家级数字资源中心 • 体制问题: • 谁来牵头或协调 • 资源是集中还是分布 • 政策问题 • 国家统一投入还是部门分担 • 无偿使用还是有偿使用

  37. 方案设计考虑因素: • 成本和效率 • 便利性 • 安全性

  38. 结 语

  39. 数字时代,必须十分重视信息的长期保存 • 保存是选择性的,需要对信息加以过滤 • 图书馆作为保存人类精神产品的社会机构,尤其要重视数字资源的长期保存 • 我国数字资源的长期保存目前还缺乏系统性的研究和完整、可靠的解决方案 • 各方面应该重视和研究数字资源的长期保存,高校将积极参与、主动配合

  40. 谢 谢!

More Related