280 likes | 433 Views
èµ„æºæ•°å—化ä¸å¿ƒçš„建设与实践. éƒ‘æ™“æƒ æ¸…åŽå¤§å¦å›¾ä¹¦é¦†. ç›®æ ‡. 为了满足用户对文献数å—åŒ–çš„è¦æ±‚, 2003 å¹´ , 清åŽå¤§å¦å›¾ä¹¦é¦†å†³å®šå»ºç«‹èµ„æºæ•°å—化ä¸å¿ƒã€‚ 该ä¸å¿ƒçš„å»ºè®¾ç›®æ ‡æ˜¯ç”Ÿäº§å’Œç®¡ç†é«˜è´¨é‡çš„æ•°å—化对象包括文本ã€å›¾åƒã€å£°é¢‘ã€è§†é¢‘ä¿¡æ¯ï¼Œä»¥æ”¯æŒå„个数å—化项目的建设。. 两ç§é€‰æ‹©. 第一ç§ï¼šå›¾ä¹¦é¦†æä¾›è®¾å¤‡ä¸Žåœºåœ° , 业务外包给公å¸ï¼Œè¿™ç§æ¨¡å¼çš„优点是图书馆ä¸éœ€å¤ªå¤šäººå‘˜æŠ•入,缺点是对整体æµç¨‹ä¸ç†Ÿæ‚‰ï¼Œè€Œä¸”图书馆ä¸èƒ½æ”¯é…æ•°å—化æµç¨‹ï¼Œä¸èƒ½éšæ„å¢žåŠ é¢å¤–的任务。. 两ç§é€‰æ‹©.
E N D
资源数字化中心的建设与实践 郑晓惠 清华大学图书馆
目标 为了满足用户对文献数字化的要求,2003年,清华大学图书馆决定建立资源数字化中心。 该中心的建设目标是生产和管理高质量的数字化对象包括文本、图像、声频、视频信息,以支持各个数字化项目的建设。
两种选择 • 第一种:图书馆提供设备与场地,业务外包给公司,这种模式的优点是图书馆不需太多人员投入,缺点是对整体流程不熟悉,而且图书馆不能支配数字化流程,不能随意增加额外的任务。
两种选择 • 第二种:图书馆组织人员来进行加工,这种模式的缺点是图书馆管理大量临时人员的经验不足,容易效率低下。 优点一:可以了解整个流程。各项相关研发如元数据方案的制定、著录系统的开发、电子书展示模式、OCR技术的应用等等都是在资源数字化中心得到实践和检验,才可能得到优化和需求功能的完善。
两种选择 • 优点二:在数字化本馆特藏,特别是一些珍本、善本时,出于安全和易于加工两方面原因也需要本地有一套数字化流程。 • 优点三:为将来数字馆藏的发展提供在生产加工、技术研究、标准制定、成本分析等方面的经验。
资源数字化中心成立的考虑 • 2003年3月,从自己的实际情况出发,决定选择第二种模式,以“中美百万册书数字图书馆(CADAL)”项目为依托,自筹资金建立资源数字化中心,挂靠数图室。目前投入为30多万(存储与设备)。 建设思路:“采用技术手段提高工作效率”。
设备与人员 • 3台AVA3, 1台FB6000E, 1台PS7000, 1台高扫。 • 资源数字化中心雇佣加工人员12名, 6人为扫描加工人员,6人为后续处理及电子书制作人员。 图书馆技术人员1名,负责流程及机器管理 管理人员1名,负责中心的整体建设。 • 年扫描能力: 5,000,000 page/year
在建项目 • CADAL (中美百万册书数字图书馆) 2003年——2006年7月完成38000册电子书 ,目前完成34885册。 http://www.cadal.cn • CMDL (中文数学数字图书馆) 目前已完成电子图书145册,扫描页数为48447页。详细情况见:http://elib.lib.tsinghua.edu.cn:9080/mathdl/htm/index.jsp
在建项目 • CALIS电子教参书项目 目前完成488本电子教参书
预建项目 • 中国科技史数字图书馆 • 教育资源数字图书馆(学位论文、教参、相关网页导航) • 清华文库
资源中心整体框架 • 数字内容创建 • 内容管理 • 内容展示 • 数字资源存储
数字内容创建 数字化流程包括: • 资源整理 (选择,查重,唯一标识符的分配) • 扫描 • 图象处理 • 元数据著录和打包 • 质量控制 • 数据存储和备份
去污,居中 CADAL制作工具图像处理
选用相关软件 扫描:QuickScan… 图象处理: Bookshop, ACDSee, XnView, UltraEdit, Scanfix, DjVuerPro,… 元数据著录和打包: CADAL Cataloging Tool, OEBEditor, CMDL Cataloging Toolkit,… 数据传输: DResManages
提高效率的措施 • 图像自动处理功能 (去污,纠偏,居中,切割等预处理) • 人员定额制 • 流程工业化 • 集中存储与调用
LAN WAN 高扫1台 NAS 2T备份系统 DAS Dell 220S存储系统 平板扫描仪4台 网关 Gigabit Ethernet Switch PS 7000扫描仪 6台自动批处理机 12台人工处理机 网络拓扑和数据存储系统
内容管理与展示 内容管理系统的选择 比较软件:TRS, DIPS, MetaWorks, CDI CM等。 考虑到各方面综合因素,选择了CDI CM软件。 思路:比较国外系统如:Fedora,Dspace, Greenstone,Digitool,进行功能分析,完善国内内容管理系统的功能.
未来计划 无版权争议的馆藏资源逐步数字化 (三年计划,三个项目) AV资源的采集 加强内容管理、组织和展示 寻求更多数字化合作项目
思考 馆藏资源数字化的角色 成本分析