610 likes | 743 Views
国家图书馆 信息基础设施建设与服务. 一、国家图书馆信息基础硬件设施 建设与服务. 一、国家图书馆信息基础硬件设施建设与服务. 机房建设. 网络建设. 存储建设. 国家图书馆计算机机房总面积 2430 平米 ; 供电实现 双路供电不间断 ,保障了数字图书馆系统的安全稳定运行; 服务器从 2008 年的 200 余台增至 约 900 台 。. 建立万兆光纤骨干网络,实现主干万兆、桌面千兆的高速网络连接,拓展互联网带宽至 1.2G ,并实现多路冗余、流量自动分配; 数据传输能力提高了 上百倍 ; 总馆南区、总馆北区和文津街馆区 无线网全面覆盖 。.
E N D
国家图书馆 信息基础设施建设与服务
一、国家图书馆信息基础硬件设施 建设与服务
一、国家图书馆信息基础硬件设施建设与服务 机房建设 网络建设 存储建设 • 国家图书馆计算机机房总面积2430平米; • 供电实现双路供电不间断,保障了数字图书馆系统的安全稳定运行; • 服务器从2008年的200余台增至约 900台。 • 建立万兆光纤骨干网络,实现主干万兆、桌面千兆的高速网络连接,拓展互联网带宽至1.2G,并实现多路冗余、流量自动分配; • 数据传输能力提高了上百倍; • 总馆南区、总馆北区和文津街馆区无线网全面覆盖。 • 国家图书馆建有磁带库、磁盘阵列、光纤导向器组成的整体存储系统,总的存储量达到2270TB。 • 采用在线、近线、离线三级存储机制,解决了面向海量数字资源的调度、备份、服务、存储、保存等问题。
二、国家图书馆信息基础业务系统 建设与服务
2002 2008.3 2009.11 至今 二、国家图书馆信息基础业务系统建设与服务 1、基础业务相关 —— Aleph系统应用情况 500 • 作为极其重要的核心业务系统引进并启用 • 14版升级到16版 • 16版升级到20版 • 成为国内首家启用AIX版Aleph20版的用户 • 目前,国图馆藏近700万册中文文献,386万册外文文献,拥有70多个阅览室和外借库、160万读者和2500万本单册,每年的外借量都高达几百万次。
二、国家图书馆信息基础业务系统建设与服务 1、基础业务相关 —— Aleph系统应用情况 Aleph系统承担着国家图书馆馆藏资源采编检流的业务流程,是我馆基础业务和读者服务的关键平台。 为工作人员提供采访、管理、规范、编目、流通、馆际互借等基础服务。为互联网读者提供信息检索服务、内外数据资源访问、书目流通等服务。 系统中存储的信息包括:书目数据、用户数据等相关数据,与定制系统连接的接口数据,互联网及系统管理数据等。 服务范围除面向内部员工外,更是为全世界范围的读者用户服务。 Aleph500系统在我馆的应用极其全面、广泛:启用中文和外文的名称、主题规范控制,多方式、 通过X-service 接口有近26个系统与Aleph500系统进行连接: 多渠道地研究不同类型外部的数据,统一通过自动化集成系统进行发布,可以通过多种方式进行批量数据处理、提取;开通十多个Z39.50服务,启用联合编目功能。 如门禁系统、预约到达通知系统、馆际互借和文献传递系统、智能架位导航系统、自助办证充值和自助借还系统等,提供更加自动化、人性化、多样化的服务。
二、国家图书馆信息基础业务系统建设与服务 1、基础业务相关 —— Aleph系统应用情况 • X-server接口定制开发 • update-bor-nlc(修改读者信息)、 • update-item-nlc(修改单册信息)、 • hold-req-nlc(根据国家图书馆实际需求开发的预约请求服务)、 • item-data-nlc(增加了单册是否被预约请求的判断)、 • loan-history(查看借阅历史)、 • update-cash(增加金融功能)、 • bor-info-nlc(显示更全面的读者信息)、 • ssonlc-auth-item(单点登录接口) 办证辅助功能、化办证流程的定制程序 多项方便业务部门使用的统计功能 定制开发 采访拟订购系统 国图风格的OPAC, 进行OPAC2.0的改版和少儿OPAC的建设
二、国家图书馆信息基础业务系统建设与服务 1、基础业务相关 —— Aleph系统应用情况 Standby Network Service Network 馆网 实 IP Service IP Service IP 二 期 机 房 1号机 2号机 3号机 心跳线tty ORACLE PC-SERVER NCIP 服 务 器 架 构 WWW 主库 HDS SAN Service Network 馆网 实 IP 一期 机 房 4号机 5号机 测试机 DATA GUARD 物理备库 WWW备机
二、国家图书馆信息基础业务系统建设与服务 1、基础业务相关 —— 联合编目系统 1997年国家图书馆成立了全国图书馆联合编目中心,在全国范围内组织和管理图书馆联机联合编目工作,共享书目资源。 目前,共有成员馆1224家,共有书目信息9643217条,馆藏信息26868138条。 联合编目系统UCS(Union Cataloging System) 系统根据全国图书馆联合编目中心的需求,在ALEPH500系统的基础上定制开发而成。与我馆ALEPH500的编目模块紧密结合,形成一个全国性的图书联合目录,从而实现全国范围内图书馆间、跨系统甚至跨行业的书目数据资源的共建共享。 系统构成 主要功能 • 客户端 • WebOPAC • UCSWeb 提供一个系统平台,编目中心的各成员馆能上传各自的书目记录和馆藏,并下载所需的书目信息。
二、国家图书馆信息基础业务系统建设与服务 • 2、读者服务相关 ——预约到达通知条屏系统 预约显示通知系统于2011年11月7日在我馆七个闭架阅览室正式运行,此系统不仅能通过电视屏幕为读者显示预约文献的到书信息,还能及时提醒工作人员超时未被处理的预约请求。
二、国家图书馆信息基础业务系统建设与服务 • 2、读者服务相关 —— 自助借还系统 标签转换 读者自助借还(自动分拣) 24小时自助还书 机 手持点检 (架位管理) 自助借还系统 安全门禁 自助借还机 馆员工作站
二、国家图书馆信息基础业务系统建设与服务 2、读者服务相关 ——自助办证充值系统 2009年9月9日百年馆庆时正式推出,年满16周岁读者可凭二代身份证在自助办证充值机上完成普通读者卡办理增加外借功能、修改借阅密码、验证和充值等操作。
二、国家图书馆信息基础业务系统建设与服务 2、读者服务相关 —— 智能架位导航系统 智能架位导航系统嵌入联机公共目录查询系统(OPAC)中,读者查询到自己感兴趣的文献资料,点击“架位导航”超级链接,即可得到目标图书架位三维分布图,明确提示目标架位所在位置,并给出最佳路线导引,以方便读者获取目标文献。
二、国家图书馆信息基础业务系统建设与服务 2、读者服务相关 —— RFID扩展项目 RFID扩展系统融合了最新的RFID技术,不仅为读者带来更优质的阅读体验,也为员工的工作带来极大的便利,对于细化服务,促进传统业务与数图业务的融合起到积极的促进作用。 针对使用部门根据业务和服务对系统提出的需求,承建商为国家图书馆设计定制了新设备 RFID扩展项目不仅仅在设备上有创新,在RFID系统上也增加了很多新的功能 • 新书架位分配、 • 下架流程优化、 • WEB端统计系统等 • 手持采集器 • 智能归书桌
三、近两年以ALEPH系统为基础的创新应用 1、外文文献目次项目 项目背景和意义 外文文献是我馆馆藏资源重要组成部分,数量在国内首屈一指。图书的目次信息能够全面详实地反映文献的核心内容,对于满足读者的深层次信息获取需求具有重要的意义。为了加强外文文献的揭示力度,进一步发掘外文文献的利用价值,更好为国内外读者提供高质量的西文文献检索、报道和传递服务,我馆启动外文文献目次库建设。 • 系统采用分开式建库的模式单独管理对目次信息。 • 降低对目次信息处理时对书目信息造成影响的风险; • 另外,分开式的信息容量更大,能更全面更深入揭示目次信息。
三、近两年以ALEPH系统为基础的创新应用 1、外文文献目次项目 项目背景和意义 外文文献是我馆馆藏资源重要组成部分,数量在国内首屈一指。图书的目次信息能够全面详实地反映文献的核心内容,对于满足读者的深层次信息获取需求具有重要的意义。为了加强外文文献的揭示力度,进一步发掘外文文献的利用价值,更好为国内外读者提供高质量的西文文献检索、报道和传递服务,我馆启动外文文献目次库建设。 • 具体实现时,利用ALEPH系统已有的功能将目次信息保存为独立的文件并上传到服务器指定位置,通过一系列的设置即可在OPAC系统中展示目次信息。 • 这种方式不需要对书目数据做任何修改,避免误操作对书目库造成不良影响; • 并且我馆中文文献已经按照这种方式实现了目次信息的揭示,有成功的案例可以借鉴,确保了此方案的可行性; • 此外,该方案可以实现书目与目次信息通过页签双向切换的展示效果,更加方便直观。但这种方式需要一定的程序开发量。
三、近两年以ALEPH系统为基础的创新应用 1、外文文献目次项目 功能实现 ——目次数据处理 外文目次数据处理 ALEPH500系统 外文目次数据 (ISO2709) 数据处理 • 上传/复制 浏览器 目次文件 • 互联网 外文目次 • 导入/更新 数据库表 数据库表
三、近两年以ALEPH系统为基础的创新应用 1、外文文献目次项目 功能实现 —— 在OPAC上显示目次数据 可以在OPAC系统中显示目次信息。当用户检索到一条创建了目次信息的外文文献时,在书目详细信息显示页面,会增加一个“网摘目次”页签,点击这个页签会展示该文献的摘要、目次信息、作者简介等内容。
三、近两年以ALEPH系统为基础的创新应用 1、外文文献目次项目 功能实现 —— 目次数据的修改和更新 国家图书馆外文目次数据管理系统 数据库 目次文件 JSP/JavaBean 登录 登录 普通 工作人员 系统 管理员
三、近两年以ALEPH系统为基础的创新应用 1、外文文献目次项目 功能实现 ——目次数据处理相关数据库表 本项目涉及到ALEPH系统中3个数据库表:
三、近两年以ALEPH系统为基础的创新应用 1、外文文献目次项目 目次数据处理——外文目次管理系统 1)目次数据按记录切分
三、近两年以ALEPH系统为基础的创新应用 1、外文文献目次项目 目次数据处理——外文目次管理系统 2)目次数据按字段切分形成 ALEPH顺序文件格式
三、近两年以ALEPH系统为基础的创新应用 1、外文文献目次项目 目次数据处理——外文目次管理系统 3)目次数据中ISBN的提取
三、近两年以ALEPH系统为基础的创新应用 1、外文文献目次项目 目次数据处理——外文目次管理系统 4)目次数据的元数据信息的导入
三、近两年以ALEPH系统为基础的创新应用 1、外文文献目次项目 目次数据处理——外文目次管理系统 5)提取目次数据中的目录/摘要等信息
三、近两年以ALEPH系统为基础的创新应用 1、外文文献目次项目 目次数据处理——外文目次管理系统 6)上传目次数据中的目录/摘要等信息
三、近两年以ALEPH系统为基础的创新应用 1、外文文献目次项目 目次数据处理——外文目次管理系统 7)上传和下载文件
三、近两年以ALEPH系统为基础的创新应用 2、规范控制更新模式调整项目 背景介绍 规范控制(authority control):采用规范文档对每条书目记录中的检索点(标目)进行规范化校验的工作。其目的是完善目录的汇集功能和查询功能,保证目录体系中标目一致性和唯一性。同时引导使用者根据文献上出现的标目检索到书目记录所使用的规范化标目,进而完整地检索到所需要的文献。 书目规范控制:包括名称规范、主题规范。名称规范又包括个人/家族名称、机关团体/会议名称、具有行政管辖权的地理名称以及统一题名。主题规范记录是指为主题标目所做的规范记录,为检索系统提供的检索点。 主题规范控制:主要指书目主题概括描述的规范化,也就是书目主题揭示的完整性、一致性和相关性的控制。 规范控制 规范控制 规范控制 书目规范控制 书目规范控制 书目规范控制 主题规范控制 主题规范控制 主题规范控制
三、近两年以ALEPH系统为基础的创新应用 2、规范控制更新模式调整项目 背景介绍 “国家图书馆中文书目主题规范数据库”是中文采编部根据国家书目主题范围,从《中国分类主题词表》的“中文主题规范数据库”中抽取的。主题规范也包括个人名称、机构名称、会议名称、地理名称、题名主题、学科主题等。 国图的规范控制采用相互独立的方式,也就是指在系统内,书目数据库与规范数据库各自独立,彼此在计算机程序管理上没有依附与控制关系。在编目过程中,编目员可以象查阅电子版参考工具书一样去查阅规范库,并根据检索显示的结果自主决定书目记录中的标目形式。
三、近两年以ALEPH系统为基础的创新应用 2、规范控制更新模式调整项目 项目目标 该项目主要完成ALEPH系统书目的主题标引词和规范库的主题词实时同步更新等功能的定制开发,主题词批转换、重复数据删除等相关数据处理工作。 • 从规范控制功能上,实现同一主题各资源数据的聚合浏览及检索、相关联主题的推荐。 • 从规范控制手段上,使书目库的主题标引词和规范库的主题词保持同步更新。
三、近两年以ALEPH系统为基础的创新应用 2、规范控制更新模式调整项目 要解决的问题 • 国家图书馆的主题标引模式是采用先组式标引模式,即选用规范库中的单个主题词形成主题词串的标目形式。而国家图书馆目前使用的ALEPH系统的规范控制模式是对整个主题标目(含$a子字段)进行控制,而不能对标目中的单个词进行控制。为了达到规范控制的目的,目前采用的方法是将先组主题词串中有检索意义的单个词再由人工重复进行著录($a),而没有单独著录的词并不能实现规范控制。 • 这样,随着规范库主题词数据的修改,就会造成书目库中同一个概念因为著录在不同位置上($a、$x、$y、$z、$j)而出现了不同的词形,不仅没有达到书目主题数据与主题规范数据的同步修改,而且会造成规范控制混乱。所以必须解决国家图书馆长期以来使用主题词规范控制与书目主题标目控制的不匹配控制模式,真正实现对主题数据的规范控制,进而实现书目主题数据和规范库数据的自动动态同步更新。
三、近两年以ALEPH系统为基础的创新应用 2、规范控制更新模式调整项目 解决思路 —— 实现功能 实现主题词与书目主题同步实时规范控制功能 具体是指ALEPH系统主题规范库NLC11库2XX字段(200、210、220、240、230、250、215)分别与中文书目库NLC01库6XX字段(600、601、602、604、605、606、607)所涉及到的相同主题词,应随着11库增删改而相应变化,无论主题词处在$a、$x、$y、$z、$j任何子字段位置,在不重复单独著录子字段$a的条件下,也能随之修改,即实现书目主题数据与主题规范数据的同步修改。 书目主题标引仍然采用组配标引模式,即主题词串的形式,Aleph系统需再开发增加单个词规范控制功能,实现对词串中各子字段($a、$x、$y、$z、$j)主题词的规范控制和自动更新。系统通过自动抽取词串中每个独立子字段的主题词建立索引,再通过和规范库主题词标目形式(2XX字段或COR字段)的匹配,进而实现对每个子字段主题词的同步控制和更新。
三、近两年以ALEPH系统为基础的创新应用 2、规范控制更新模式调整项目 解决思路 (1)根据书目库主题标引词串自动生成单个主题词索引 系统根据编目员著录的6XX字段的主题标引词串,自动抽取每个独立子字段(即$a、$x、$y、$z、$j)对应的主题词建立索引,例如自定义609字段,用来存放每个主题词索引,609字段可不在书目数据中存储。 定义609字段的前两位指示符分别为多主题分组和每组主题词组配位置排序的标记;定义子字段$a为规范库主题词;定义子字段$A为主题词类型(人名p、团体o、题名t、学科s、地名g等);定义子字段$2为主题规范库代码(统一定义为$2cct)。
三、近两年以ALEPH系统为基础的创新应用 表1主题词类型$A对应表
三、近两年以ALEPH系统为基础的创新应用 2、规范控制更新模式调整项目 解决思路 例如,以下主题词字段通过以上方案生成609索引: 600#0$a苏轼$f(1036-1101)$x古典诗歌$x文学研究$y中国$j文集 600#0$a苏轼$f(1036-1101) 6060#$a古典诗歌 …… 生成609索引字段: 60900$Ap$2cct$a苏轼$f(1036-1101) 60901$As$2cct$a古典诗歌 60902$As$2cct$a文学研究 60903$Ag$2cct$a中国 60904$As$2cct$a文集 60910$Ap$2cct$a苏轼$f(1036-1101) 60920$As$2cct$a古典诗歌 ……
三、近两年以ALEPH系统为基础的创新应用 2、规范控制更新模式调整项目 解决思路 (1)根据书目库主题标引词串自动生成单个主题词索引 规范库11库 确定 索引各子字段内容 匹配主题词目标形式 确定 该词是否是11库 中正式主题词 规范控制 更新模式调整系统 确认不是或有误 抽取 单独主题词 确认无误 书目库O1库 人工修改 至无误后 再添加 添加到 $a对应位置
三、近两年以ALEPH系统为基础的创新应用 2、规范控制更新模式调整项目 解决思路 对已有规范数据的批修改、批处理工作。 1 2 3 受控字段非控主题词及主题词串批转换:分人工修改和编程批修改两部分。 主题规范控制模式调整引起的数据处理工作:将NLC01库主题词字段中出现的重复或轮排问题的主题词进行删除操作。 主题规范库更新替换工作:完成NLC11库的数据替换。
三、近两年以ALEPH系统为基础的创新应用 2、规范控制更新模式调整项目 解决思路 (2)随着规范库主题词修改而自动修改索引并更新书目库主题标引词串。 随着规范库主题词记录的修改,通过和主题词标目形式(2XX字段,4XX字段或COR字段)匹配,修改主题词索引609字段,反馈到书目库主题标引词串中特定位置相同的主题词及其“前字段”或“前子字段”的同步更新。(备注:“前字段”或“前子字段”指该主题词前面的1个字段号或子字段代码) 对主题词的更新包括对主题词的词形、字段类型等修改,将主题词改为代项词,单纯新增或删除主题词等操作。
三、近两年以ALEPH系统为基础的创新应用 2、规范控制更新模式调整项目 解决思路 以修改主题词为例,具体处理步骤如下: 1 2 4 3 通过和主题词标目形式(2XX字段,4XX字段或COR字段)匹配,反馈到书目库609索引字段处。对要删除主题词先做停用处理,即在记录头标区将记录状态(第5位,从0开始)改为d(删除的记录),并将该词改为其他主题词的代项词。 根据609索引字段的修改,一对一更新主题标引词串中的主题词及其字段、子字段类型,见表1(根据“表1”中1、4对应列判断词串中的词及其字段是否类型匹配) 系统针对修改过的主题词,首先根据头标区记录状态确定是否是删除停用的主题词,如果不是,则只需修改609索引字段,重新确定主题词类型、词形即可(见“表1”中2、4列对应生成类型代码)。如果是删除停用的主题词,系统自动删除原609字段内容,再在规范库4XX字段找到该词,重新生成对应2XX字段主题词的609索引,主题词类型按新主题词确定。 书目主题标引词串更新后,做停用的主题词就可以删除。
三、近两年以ALEPH系统为基础的创新应用 3、民国时期文献数据处理项目 • 项目背景及目标 民国时期文献是记录1911年至1949年期间各种知识和信息的载体(包括图书、期刊、报纸、手稿等,以及非正式出版的日记、传单乃至商业契约和票据等)。民国时期文献数量众多、内容丰富,具有较高的历史价值、学术价值和重要的现实意义。 2011年,国家图书馆联合全国各省公共图书馆,策划了“民国时期文献保护计划”项目。2012年作为项目启动年,在各地图书馆积极参与下,在专家全力配合下,文献普查、海外文献征集、整理出版等方面都取得了阶段性成果。
三、近两年以ALEPH系统为基础的创新应用 3、民国时期文献数据处理项目 • 项目背景及目标 目前,民国时期文献数据很多来自地方馆,书目、馆藏数据格式不统一,而且很多信息已经遗失或不全;这部分数据必须按照统一格式进行处理,才能满足展示平台特定的数据要求。目前联合编目系统对民国数据处理功能有限,诸如批量上传书目馆藏数据的功能、联合编目系统中民国数据到展示平台的更新功能、联合编目系统对民国数据的统计功能等,已无法满足民国数据处理的要求。民国时期文献数据处理项目的建设,就是要解决这些问题。
三、近两年以ALEPH系统为基础的创新应用 民国时期文献展示平台 3、民国时期文献数据处理项目 系统流程图 上传 • 项目功能介绍 联合编目系统 装载 离线装载 项目建设中,首先解决民国文献标识问题。文献数据在编目中没有特殊标识,项目中选定399字段作为民国书目和馆藏的筛选条件。下载书目中399字段的a子字段为“民国时期文献”。 (查重、统计) 数据处理更新系统 上传 国家图书馆 地方成员馆
三、近两年以ALEPH系统为基础的创新应用 3、民国时期文献数据处理项目 • 项目功能介绍 民国时期文献保护计划数据处理更新系统 上传 、查重 、装载 离线装载 统计报表 系统功能模块: 提交数据 预查重 全匹配查重 装载 装库前预处理 装载书目 、 馆藏 书目统计 馆藏统计
三、近两年以ALEPH系统为基础的创新应用 3、民国时期文献数据处理项目 • 项目功能介绍 • 上传、查重、 • 装载 • 模块 • 民国时期 • 文献保护计划 • 数据处理更新 • 系统 • 统计报表 • 模块 • 离线装载 • 模块
三、近两年以ALEPH系统为基础的创新应用 • 项目功能介绍 3、民国时期文献数据处理项目 (1)上传、查重、装载模块 —— 提交数据
三、近两年以ALEPH系统为基础的创新应用 • 项目功能介绍 3、民国时期文献数据处理项目 • (1)上传、查重、装载模块 —— 预查重
三、近两年以ALEPH系统为基础的创新应用 • 项目功能介绍 3、民国时期文献数据处理项目 (1)上传、查重、装载模块 —— 全匹配查重
三、近两年以ALEPH系统为基础的创新应用 • 项目功能介绍 3、民国时期文献数据处理项目 (1)上传、查重、装载模块 —— 装载
三、近两年以ALEPH系统为基础的创新应用 • 项目功能介绍 3、民国时期文献数据处理项目 (2)离线装载模块 —— 装库前预处理