720 likes | 845 Views
数字资源整合化建设和组织. 张建勇 中国科学院国家科学图书馆 2009 年 9 月. 提纲. 信息环境分析 用户需求和行为分析 资源整合化建设模式 整合化实践 数字资源组织 新的挑战. 引言. 数字环境改变了信息利用环境,图书馆不再是资源保存者、提供者的唯一或重要角色 信息技术的发展使得信息的生产和发布更加直接和便利,信息资源不再是稀缺的资源要保藏在图书馆 图书馆馆藏的资源只是用户需要资源的一部分,大量的资源呈分散或自由存在的状态 电子出版和服务发布日益结合,图书馆在科学交流中的位置不再是必须的 用户利用信息和创造知识的过程数字化和网络化
E N D
数字资源整合化建设和组织 张建勇 中国科学院国家科学图书馆 2009年9月
提纲 • 信息环境分析 • 用户需求和行为分析 • 资源整合化建设模式 • 整合化实践 • 数字资源组织 • 新的挑战
引言 • 数字环境改变了信息利用环境,图书馆不再是资源保存者、提供者的唯一或重要角色 • 信息技术的发展使得信息的生产和发布更加直接和便利,信息资源不再是稀缺的资源要保藏在图书馆 • 图书馆馆藏的资源只是用户需要资源的一部分,大量的资源呈分散或自由存在的状态 • 电子出版和服务发布日益结合,图书馆在科学交流中的位置不再是必须的 • 用户利用信息和创造知识的过程数字化和网络化 • 知识社区、虚拟交流
出版市场的变化 • 网络出版成为出版的主流 • 通过Ulrich’s Peridical Directory 统计,网络期刊或有电子版的数量是52,112种,年增长是500余种 • 根据Cox对大出版机构的统计,科技期刊有电子期刊的比例约占70% • 据有关研究预测到2015年学术类期刊可能全部以网络版方式出版
Migration from print to electronic: Expect e-journals to grow from 15% of market in 2003 to 60% in 2008 Year
电子出版物市场销售份额的变化 • Current estimates of the overall eBook market range from $3 million to upwards of $30 million. Officially, Nick Bogaty, Executive Director of the International Digital Publishing Forum (IDPF) • Vincent Janoski, Business Manager at SparkNotes, ventures a higher estimate, placing the industry around $21 million based on a 40-50% growth rate from $10 million in 2003 • "Our PDF downloads are fast approaching $500,000 in sales," he said. "In the context of a $15-20 million market, that is a pretty big share that is not captured in the IDPF stats.“ • --引自:http://www.publishingtrends.com/
开放获取期刊快速发展 • 开放获取是在坚持期刊原有的同行评议的质量审核机制的前提下,在现有的法律框架内实施的新型学术出版模式,通过互联网,任何读者可以随时随地免费地获取和使用期刊论文
开放获取期刊快速发展 • 开放获取期刊数量激增,许多有影响的期刊也进入了开放获取期刊的行列 • 在某些学科预印本系统成为了用户首选的获取资源的途径 • 开放存储系统快速发展,如中国科技论文在线,奇迹文库等
国内外电子图书的发展变化 • 国外重要出版社都陆续推出了自己的电子图书产品 • Springer ,年3000种左右 • John wiley • … • 电子图书的集成商 • Netlibrary , i-library 集成了众多知名出版商的电子图书 • 我国的方正电子图书、书生等
其他资源的发展 • 机构仓储的资源数量很难估计,据调查不同国家大学构建的机构仓储数量占大学数量从5%-100%不等,哈佛大学规定所有教师的研究成果必须存入其机构仓储库 • 个人blog的数量据统计2000余万个,平均每秒产生9个 • 可以提供收割的oai资源提供者的数量难以估量 • RSS种子提供网站数量也以千万计
图书馆面临的危机 • 资源和服务正在逐渐绕过图书馆,由用户自己和其他机构向用户提供服务 • Google的数字图书计划一旦通过听证和法律认可,其可提供的图书数量将超过任何一家图书馆的收藏,成为全球最大的图书库 • 开放获取和自存储将改变科研经费的流向,国家或个人负担了开放获取的出版费用,而资源全社会共享 • 用户的选择呈现多元化
资源的管理分布 • 正式出版的资源,所谓的主流资源 • 经过筛选的、高质量的资源并正在数字化 • 图书馆主要关注的资源 • 图书馆投入了较高的组织管理成本 • 图书馆根据用户需要再一次筛选 • 占所有资源的比例是多少呢?20% • 能满足用户需求的图书馆资源有多少?不知道 • 非正式出版的资源 • 这部分资源有多大?网络多大,资源就有多大 • 非主流资源越来越占据着重要的地位 • 没有经过评议的,质量参差不齐 • 自组织 • 网络搜索引擎简单过滤
需求分析 • 用户的文献需求分散性 • 对二八定律的质疑 • 20%的资源满足80的需求?,不均衡分配理论 • 图书馆只建设20%的资源是简单思维的结果 • 一项用户需求的研究显示用户的需求表现为一个长尾(long tail) • 我国科研人员和研究生过去5年来在国内外公开学术刊物(SCI和CSCD来源期刊)上发表的学术论文引用过去10年内的外文期刊种类和频次的统计 • 谁来满足用户100%的需求
西文期刊需求满足率与预期期刊品种比较示意图西文期刊需求满足率与预期期刊品种比较示意图 60000 55000 50000 45000 40000 引用期刊数 期 35000 阅读期刊数 刊 30000 预期期刊数 数 25000 量 20000 15000 10000 5000 0 满足 75% 满足 80% 满足 85% 满足 90% 满足 95% 满足率
用户需求资源呈现的一个长尾,图书馆只管理了高端的头部用户需求资源呈现的一个长尾,图书馆只管理了高端的头部
用户信息行为分析 • 数字时代的特征决定了资源的利用是网状的结构 • 科研信息形态的多样化:文献资源、科学数据、实验仪器设备、网络计算环境、机构、项目、人员…集成融合 • 数字化网络化信息成为主体 • 多个用户信息行为的调查都让图书馆沮丧 • OCLC的用户信息行为调查报告 • 其他机构的用户行为 • 用户选择了谁? • 用户对图书馆的期望 • 数字化资源 • 知识组织服务 • 一个基于图书馆用户调查
电子资源的用户使用方式 电子资源的使用场所 :83.8%只在办公室或实验室 经常使用的电子资源数量 :40.5%在5个以下 电子资源的使用频率 :40.5%平时不用、写论文、有工作任务时用 使用电子资源每周下载文章数量 :40.5%5篇以下 每周能够阅读的下载文章的数量 :48.6%5篇以下 使用电子资源时首选类型 :64.9%首选全文数据库 恶意下载行为 :73%不知道 在使用电子资源时,还结合使用其他网络资源:100%
设定使用目的情境下,用户对电子资源的使用倾向设定使用目的情境下,用户对电子资源的使用倾向 设定了 7 种使用电子资源的情境: 1.写综述 2.获取最新研究文章或最新研究动态 3.获取一种实验方法 4.查询一位研究者的工作 5.查询某研究机构的工作 6.知道题名查文章 7.查询某种期刊
设定使用目的情境下,用户对电子资源的使用倾向设定使用目的情境下,用户对电子资源的使用倾向 1.写综述 既使用数据库查询,又使用搜索引擎 先查询文摘数据库,再查询全文数据库 直接使用全文数据库查询 只使用搜索引擎查询所需文章 请图书馆员帮助查询
设定使用目的情境下,用户对电子资源的使用倾向设定使用目的情境下,用户对电子资源的使用倾向 2.获取最新研究文章或最新研究动态
设定使用目的情境下,用户对电子资源的使用倾向设定使用目的情境下,用户对电子资源的使用倾向 3.获取一种实验方法
设定使用目的情境下,用户对电子资源的使用倾向设定使用目的情境下,用户对电子资源的使用倾向 4.查询一位研究者的工作 无人请图书馆员帮助查询
设定使用目的情境下,用户对电子资源的使用倾向设定使用目的情境下,用户对电子资源的使用倾向 5.查询某研究机构的工作 无人请图书馆员帮助查询
设定使用目的情境下,用户对电子资源的使用倾向设定使用目的情境下,用户对电子资源的使用倾向 6.知道题名查文章
设定使用目的情境下,用户对电子资源的使用倾向设定使用目的情境下,用户对电子资源的使用倾向 7.查询某种期刊
有代表性的用户行为特征 1.用户使用电子资源的主要地点为办公室或实验室; 2.用户主要利用Google等搜索引擎和登陆图书馆网站,查询学科相关电子资源信息; 3.用户不太了解电子资源(包括资源类型、揭示深度等); 4.用户偏好直接使用电子资源; 5.用户使用的资源类型主要期刊、学位论文和电子图书(电子图书专指研究生); 6.用户使用的资源数量有限,主要为5个以下; 7.用户使用资源无固定时间,主要在有工作任务或写论文时使用;
图书馆面临的困境 • 图书馆购买资源的价格不断上涨 • 出版商在和图书馆的博弈中胜出 • 图书馆单纯依靠经费增长方式购买资源的努力在资源价格面前不断后退 • 任何一个图书馆固守传统的馆藏建设方式都难以在有限经费条件下可靠满足自己用户的需要
图书馆的机遇 • 数字信息资源逐步成为主流、网络利用成为主要形式、多方面的供应能力日益丰富,使得图书馆有可能经济地利用各种机制来为自己的用户获得和传送所需要的文献 • E_Science, E_learning • 科研信息形态的多样化 • 国家或非赢利组织的数字化资源与网络化服务,如nstl,calis, cadal, csdl等 • 商业化的内容服务商 • 图书馆文献传递网络 • 开放获取资源 • 网上的资源 • 机构仓贮的资源 • 个人出版资源
文献资源整合化建设的思路 • 转变观念 • 改变资源增长模式的单一思维,经费<>购买资源 • 在数字化网络化信息环境和多元化文献供应市场的情况下,需要把文献资源建设的立足点放在“文献供应能力建设”上 • 从经济、方便、可靠地保障“文献供应”的角度,根据用户需要的程度和满足途径的效率与效益,把纸本与电子资源的建设、文献资源与文献传递服务系统的建设、资源供应能力的建设充分结合起来,形成整合建设的机制
文献资源整合化建设的思路 • 创新发展模式 • 从供应管理(Supply Management)的角度,重新思考资源建设问题 • 供应管理的基本视场是将资源提供给使用者的全过程,是基于用户和基于使用的资源建设 • 供应管理的目标不是占有资源,而是将用户所需信息在用户需要的时候提供给用户 • 整合资源采访、资源共享、供应渠道和和服务流程的供应管理为核心的文献资源整合化建设是图书馆在新的环境下进行资源建设的新思路
资源整合保障模式分析 • 进入供应链的资源是一个大的集合 • 从获取途径划分为购买的网络资源、购买的印本资源、开放获取的资源、网上科技资源、第三方资源、合作建设的资源等 • 从文献类型划分为科研论文、科技图书、学位论文、会议论文、科技报告、标准、专利、工具书等 • 从科研过程的角度看,科学数据、科学仪器信息、科研设施信息、实验室信息、科研人员、科研工具 • 资源组织包括直接购买、组团购买、组织人员投入、管理设备投入、管理过程成本、资源评估成本等 • 图书馆对本馆拥有的资源给与较强的组织管理成本 • 而对大量的网络资源、第三方资源组织强度相对较弱
资源整合保障模式分析 • 从总量分析,图书馆在少量的资源上投入较高,在大量的资源上投入较低。其中少量的商业资源占据了图书馆80%的组织管理投入 • 资源的获取时间和图书馆投入的组织管理成本呈反比例关系,投入较高组织管理成本的资源,相对获取时间较短,反之亦然。例如,图书馆投入较高的商业性全文数据库可提供全面的即查即得的服务,而投入较低的印本资源或第三方的资源的获取时间相对较长
文献资源整合化建设过程 • 基于资源整合建设模式,图书馆投入较高组织管理成本的资源可保证较好的获取性,用户就可以在较短的时间内获取服务。这样,将图书馆组织管理投入与用户的需求紧密匹配是提高服务效果的关键。根据用户资源需求调查分析结果,从用户需求的广度和强度两个维度分析用户对资源的需求特点,并以之作为构建资源供应方式和投入的依据
文献资源整合化建设过程 广度高 强度高 广度低 强度高 广度高 强度低 广度低 强度低
文献资源整合化建设过程 • 供应市场分析 • 出版商市场,需要精细分析 • 网上资源,可靠获取程度 • 国家平台,利用的效率 • 第三方专业信息服务机构,合作的紧密度,成本 • 图书馆原文传递服务网络,稳定和效率 • 个人信息资源,机构仓贮的推广 • 非赢利组织信息库,价值和易用程度
文献资源整合化建设过程 • 对用户需求从多个角度的精细分析,有多大范围、多少人、什么频度、多么急迫、需要什么资源等的详细分析 • 对信息资源供应状况的精细分析,在什么地方、有什么资源、可以如何供应、成本效率如何等的全面掌握 • 对用户的不同需求设计和建设不同的供应方式 • 建立跟踪监测机制来不断分析上述方式在服务上和经济上的有效性
文献资源整合化建设过程 • 资源保障形式设计 • 需求强度大,需求广度宽的资源,主要是普遍经常使用的综合性和大学科领域检索工具类资源和普遍经常使用的综合性全文库 • 资源保障顺序:出版商资源,国家平台资源,非赢利组织库等 • 服务方式:大范围,网络服务,即查即得 • 需求强度大,需求广度窄的资源,主要是某学科领域普遍常用的资源,需要在所在领域的单元提供最佳的使用 • 资源保障顺序:出版商资源,机构仓储资源,专业机构信息资源等 • 服务方式:小范围,网络服务,即查即得
文献资源整合化建设过程 • 资源保障形式设计 • 需求强度小,需求广度宽的资源,主要是有普遍需求的综合性资源,可提供较大范围但有访问控制的服务 • 资源保障顺序:国家平台资源,非赢利组织库,商业资源,第三方专业信息服务机构,原文传递服务网络等 • 服务方式:网络单点服务,原文转递服务 • 需求强度小,需求广度窄的资源,该类资源与服务对象的需求距离较远,有零星的需求 • 资源保障顺序:国家平台,原文传递服务网络,第三方专业信息服务机构 • 服务方式:原文传递服务
文献资源整合化建设的实践 • 中国科学院国家科学图书馆面向全院、服务全国的科研人员 • 在文献资源整合化实践中,基于用户需求调查分析,以有效满足用户需求为出发点,以用户合理可靠地获取资源为目的,设计资源建设的保障模式 • 资源建设中加强基于需求分析的采集决策,采集过程中综合考虑信息内容、资源质量、同类资源状况、可能利用的获取渠道和服务等 • 保证用户使用资源数量的最大化,寻求服务效果和资源建设成本平衡的最优化方案
文献资源整合化建设的实践 • 典型事例 • 资源开通方式的创新 • 单点/多点开通资源,针对小范围(少数研究所)有需求的资源,国科图补贴经费在研究所开通使用,同时研究所承诺对其他研究所的零星需求通过原文传递解决。比如AGU • 第三方渠道的开通 • 国防科技信息服务,与国防科技信息中心达成协议,国科图建立国防方面的科技报告、会议文献、科技期刊等资源的元数据检索库,国防科技信息中心接入中心的原文传递网络,向全院的研究人员提供原文传递服务。满足了用户对国防方面文献需求
文献资源整合化建设的实践 • 典型事例 • 可稳定提供服务的非商业资源的发现和揭示 • 积极发现非商业性有价值的资源,如日本的J-Stage • 国际组织和政府资源 • 与搜索引擎的跨界合作 • 开放我们的期刊和图书元数据 • 搜索引擎引导用户到图书馆的服务,如google和百度 • 集成原文传递服务 • 集成国家平台、中心平台和其他平台的原文传递服务,发展代查代借服务 • 资源采集流程的创新
建设实践 • 建立新的资源建设机制 单篇/单种订购 打包订购(学科/整库) 集团/自主订购 开放获取 园区IP 原文传递 第三方资源 个性化资源需求分析/效果评估 P-First/Only E-Only E-First+DDP 研究所资源 保障体系设计 研究所资源 配置方案设计 谈判方案设计经费预算控制免费资源采集服务渠道组织 学科馆员和学科采访馆员 采访馆员
问题讨论 • 文献资源建设基于用户的需求,而需求的不确定性和用户目标的迁移,使图书馆难以及时把握,资源的连续性累积目的不容易达到 • 文献资源的整合化建设使资源供应者、图书馆、用户联结成了一个整体,任何一个环节出现问题,都会影响服务的效果。大世界小网络,各个部分和环节的流畅运作仍需要深入研究 • 文献资源的整合化建设依赖有效的文献资源共享,而文献资源共享成本和资源利用效益的平衡需要进一步研究
商业资源销售政策的动向和我们的策略 • 目前商业资源仍是我们图书馆资源建设的主体 • 在新的出版模式和服务模式没有出来前,我们仍得面对一个个商业资源和他们的垄断价格
建设环境与创新需求 • 2008年Elsevier、ACS、Science等数据库纷纷转变政策 • Science——按照各单位使用量划档确定订购价格; • ACS——以使用量作为定价基础,限定使用成本; • Elsevier——限定集团最低订购额,在此基础上收取电子费; • 政策的转变无一例外地带来高涨幅,主要理由: • 中国用户的订购费用和使用成本过低,远低于全球标准订价 • 中国的经济增长、中国的科研(经济)实力使接受价格调整成为可能
小结 • 知识产品的“垄断” 特性和“不可替代性”使我们在订购资源时极其“被动” • 在知识产品高额涨幅面前,图书馆文献资源建设经费的正在不断“缩水”和“贬值” • 建立从 “需求”出发的资源建设模式,掌握“需求”,设计个性化的资源保障体系,并在此基础上形成符合实际需求资源建设方案 • “主动出击”,对抗“卖方市场” • 图书馆积极联合,通过联合和协同谋求解决方案!
数字化资源组织实例 ----建设服务全国的数字资源集成服务网络