360 likes | 531 Views
大数据时代图书馆的服务创新. 赵继海 2013 年 4 月 26 日@浙江师范大学. 提纲. 引言:我们进入了大数据时代 大数据将会给图书馆带来什么? 大数据时代图书馆的对策 结束语:提升图书馆服务价值. 一、引言:我们进入了大数据时代. 图书馆技术发展热点层出不穷,各领风骚两三年。 近十多年来,数字图书馆( DL )、信息共享空间( IC )、 IFRD 、机构知识库( IR )、移动图书馆( ML )、云计算等等轮番登场,成为热点。从去年开始,大数据( Big Data )开始成为热点。.
E N D
大数据时代图书馆的服务创新 赵继海 2013年4月26日@浙江师范大学
提纲 • 引言:我们进入了大数据时代 • 大数据将会给图书馆带来什么? • 大数据时代图书馆的对策 • 结束语:提升图书馆服务价值
一、引言:我们进入了大数据时代 • 图书馆技术发展热点层出不穷,各领风骚两三年。 • 近十多年来,数字图书馆(DL)、信息共享空间(IC)、IFRD、机构知识库(IR)、移动图书馆(ML)、云计算等等轮番登场,成为热点。从去年开始,大数据(Big Data)开始成为热点。
2012年3月29日,美国奥巴马政府宣布推出“大数据研究和发展计划”(Big Data Research and Development Initiative),该计划涉及NSF等6个联邦政府部门,投资超两亿美元,研发采集、组织和分析大数据的工具及技术。有人将其比之为克林顿政府1993年推出的“信息高速公路”计划 。 • 美国政府大数据计划的出笼,表明大数据技术已经上升为国家战略。
大数据的由来 • 数字资源的积累经历了传统资源的数字化到原生数字资源为主的发展过程。 • 到目前为止,中文纸质图书、期刊、学位论文等文献类型,已大部完成数字化转换。报纸、灰色文献正在进行数字化转换。 • 英文及其他文种的纸质资源正在进行大规模数字化。
传统资源被数字化只占数字资源的很小部分,原生数字资源(Born –digital resources )不断产生,每个用户、每台终端都在产生信息。
Google Glass Explorer Edition 4月16日开始对2000位测试者发放,进行用户体验。预计2014年大规模上市。
微型投影仪+摄像头+传感器+存储+传输+操控系统的结合体。微型投影仪+摄像头+传感器+存储+传输+操控系统的结合体。
声控 • 动作
已经或即将问世的穿戴式设备还有:iWatch,智能手环“Jawbone up”,卫星导航鞋,等等。 • 市场研究机构Forrester Research公司认为,下一次计算革命将来自穿戴式设备,而非智能手机和电脑。 • 穿戴式设备将使得计算和网络进一步泛在化,进一步改变人们信息获取与交流的习惯,同时,将加剧数据量的增长。
据IDC(国际数据公司)统计,全球数据量以年均50%的速率增长。2011 年全球所产生的数据总量是 1.8 ZB(10的 21次方) 1TB (Trillionbyte ,太字节)=1024GB 1PB (Petabyte, 拍字节)=1024TB 1EB (Exabyte , 艾字节)=1024PB 1ZB (Zettabyte , 泽字节)= 1024 EB =100万PB=10亿TB
非结构化的数据(图片、声音、视频、地理位置信息等等),已成为数字资源的主体,约占数据总量的80%以上。非结构化的数据(图片、声音、视频、地理位置信息等等),已成为数字资源的主体,约占数据总量的80%以上。 • 数据中蕴藏的巨大价值引发了对于数据处理、分析、挖掘的巨大需求。 • 这样催生了大数据的概念与相关技术。 • 大数据技术的宗旨就是从海量、多样性的数据中,快速获得有价值的信息。
二、大数据将会给图书馆带来什么? 大数据将是下一个社会发展阶段的“石油”和“金矿”。无论是个人、企业还是国家,谁能更好地抓住数据、理解数据、分析数据,谁就能在下一波的社会竞争中脱颖而出。关于数据的知识,将成为个人知识结构中的必备要素和基础。 ——施伯乐(复旦大学计算机研究所所长)
春江水暖鸭先知。商业或经济领域的触角一般来说是最灵敏的。大数据已经对商业企业产生影响。春江水暖鸭先知。商业或经济领域的触角一般来说是最灵敏的。大数据已经对商业企业产生影响。
乐购公司(Tesco)通过挖掘分析会员卡用户的购物数据,对顾客分类,有针对性地发广告邮件,每年节省 3.5 亿英镑的广告费用。图书馆的服务推广能否这样精准? • 智能手机可实现号码(身份信息)的一对一锁定,空间的一对一锁定(LBS平台)、时间的一对一锁定(“时间轴”)、资金流的一对一锁定(支付数据平台),提供精准广告与销售。图书馆能否借鉴应用?
乐购公司在韩国地铁站的墙面展示所售商品的图片,每张图片上附有一个二维码。消费者可用智能手机读取二维码,并将选好的商品放入虚拟购物车中,下班回家就可坐等送货上门。曾经被浪费的等车时间成了便捷的购物时间。借书能否如此?乐购公司在韩国地铁站的墙面展示所售商品的图片,每张图片上附有一个二维码。消费者可用智能手机读取二维码,并将选好的商品放入虚拟购物车中,下班回家就可坐等送货上门。曾经被浪费的等车时间成了便捷的购物时间。借书能否如此?
数据处理分析将成为许多行业的主业。例如,在网上支付中,数据业务已成为主业,而金融业务(刷卡、转账等)将走向免费化。在商业流通中,数据分析已成为主业,柜台服务则日益边缘化。数据处理分析将成为许多行业的主业。例如,在网上支付中,数据业务已成为主业,而金融业务(刷卡、转账等)将走向免费化。在商业流通中,数据分析已成为主业,柜台服务则日益边缘化。 • 图书流通业务也将有这样的趋势,即主业应是分析流通数据,而不是流通操作本身(用户自助),从而提高服务的针对性、有效性和质量。
大数据对图书馆的机遇 • 提供了采集数据的不竭来源。 • 提供了采集与分析处理数据的技术工具。大数据技术研究的主要目标就是开发、提供技术工具。 • 提供了分析问题的思想方法。跳出图书馆看(办)图书馆。
大数据对图书馆的挑战 • 一是用户眼球的争夺将更加剧烈。用户的时间是有限的,太多的媒体与内容吸引着他们,导致高校图书馆不仅纸书流通和到馆读者量处在下降通道,而且数字图书馆网站对用户的吸引力也在下降。
二是人才缺乏。限于人才与技术水平,图书馆对于文献数据库以外的数字资源的采集、处理、保存、挖掘和服务,还没有引起足够的重视。对于非结构化数据的采集、处理、管理与利用,图书馆基本上还没有作出反应。二是人才缺乏。限于人才与技术水平,图书馆对于文献数据库以外的数字资源的采集、处理、保存、挖掘和服务,还没有引起足够的重视。对于非结构化数据的采集、处理、管理与利用,图书馆基本上还没有作出反应。
三是用户隐私保护难度加大。个人隐私的泄漏和滥用的可能性在增大。三是用户隐私保护难度加大。个人隐私的泄漏和滥用的可能性在增大。 • 随着移动互联、社交网络、物联网、电子商务等的迅速发展,人们在互联网以及物理空间上的行为轨迹、检索阅读、言论交流、购物经历等等都可能被捕捉到。 • “数字化生存” “透明化生存”
四是数据安全、知识产权、商业利益、公共安全受损的威胁增大。四是数据安全、知识产权、商业利益、公共安全受损的威胁增大。 • 大数据的发展,信息开放度加大,新的信息采集、数据分析、数据挖掘技术以及海量数据存储技术和设备将不断涌现,云计算将更加普及。带来的副作用是IT基础架构将变得越来越一体化和外向型,对数据安全和知识产权、商业利益甚至公共安全构成较大的风险。
三、大数据时代图书馆的对策 • 第一,更加关注特色资源建设。不同图书馆数字馆藏趋向于同质化。在大数据时代,围绕特色优势学科进行专题数据采集,建立特色数据库并实时更新数据变得十分重要。因此,我们需要从新的视角来看待数字图书馆的特色数据库建设。在特色数据库建设中,不仅要重视结构化的文献数据,更要重视非结构化数据的采集、分析、管理与服务,如dataset、图片、视频等
第二,引进、研发与应用数据挖掘、分析和发现工具,加强数字资源的整合、分析和挖掘。提供高质量的信息服务。第二,引进、研发与应用数据挖掘、分析和发现工具,加强数字资源的整合、分析和挖掘。提供高质量的信息服务。 • 关联度分析。 • Hadoop:大数据处理软件框架 • 大数据一体机。 • 硬件软件一体化的数据处理平台 • 大数据处理的云服务。
用数据说话。目前图书馆积累的数据:书目数据、用户数据、流通数据、参考咨询数据、OPAC查询数据、图书馆网站利用数据、数据库利用数据、门禁系统数据等等。对这些数据进行分析挖掘,是改进资源建设与服务的重要依据。用数据说话。目前图书馆积累的数据:书目数据、用户数据、流通数据、参考咨询数据、OPAC查询数据、图书馆网站利用数据、数据库利用数据、门禁系统数据等等。对这些数据进行分析挖掘,是改进资源建设与服务的重要依据。
图书馆流通量下降的数据分析 • 浙大宁波理工学院的流通数据分析 • 借书学生比例减少,从2008年的81.7%下降到2011年的67.4%,但借书的学生年均借书量维持在18册左右。 • H、I、F、O、TP五类图书的馆藏比例占53.39 %,借阅比例占 65.8%。 • 图书利用率在入藏第1-2年呈上升趋势,第2年达到峰值,第3年开始逐年下降。
4年来借阅总量平均减少了21.5%,其中,H类图书借阅总量只减少了5.5%,从2010年始借阅总量取代I类位居第一。F类减少了21.5%,TP类减少了22.8%,与平均值基本持平。但I类减少了34.8%,下降量占总减少量的39%。文学类图书历来是大学生的最爱,但情况在发生改变,大学生对文学类纸质图书的借阅量下降得最为明显。Why?4年来借阅总量平均减少了21.5%,其中,H类图书借阅总量只减少了5.5%,从2010年始借阅总量取代I类位居第一。F类减少了21.5%,TP类减少了22.8%,与平均值基本持平。但I类减少了34.8%,下降量占总减少量的39%。文学类图书历来是大学生的最爱,但情况在发生改变,大学生对文学类纸质图书的借阅量下降得最为明显。Why?
提高图书利用率的举措 • 吸引读者来馆:改良馆舍环境、延长开放时间、提供考研专座、增强院系互动(协助自修考勤、网络课程、阅读协会)。 • 增加借书册数。本科生20册。 • 取消借阅文学类图书的册数限制。 • 加快新书采编速度和典藏入库频率。 • 常年开展馆藏展览,激活资源。 • 常年开展读者选书活动,“你选书、我付款”。……
第三,加强用户研究与交互数据的利用。 基于对用户行为数据的分析,提升个性化服务的水平,开展跟踪服务、精准服务、知识关联服务、宣传推广服务。第三,加强用户研究与交互数据的利用。 基于对用户行为数据的分析,提升个性化服务的水平,开展跟踪服务、精准服务、知识关联服务、宣传推广服务。
如果说过去一个图书馆的核心竞争力是文献资源,那么从现在开始,图书馆的核心竞争力将转变为用户资源。文献资源趋向于同质化,衡量图书馆竞争力的将是用户数及其服务效益。对用户数据,包括用户的类别、特征、位置、专业领域、信息行为等等数据的分析、挖掘和整合,是做好服务的基础,也是吸引用户、增加用户的手段。如果说过去一个图书馆的核心竞争力是文献资源,那么从现在开始,图书馆的核心竞争力将转变为用户资源。文献资源趋向于同质化,衡量图书馆竞争力的将是用户数及其服务效益。对用户数据,包括用户的类别、特征、位置、专业领域、信息行为等等数据的分析、挖掘和整合,是做好服务的基础,也是吸引用户、增加用户的手段。
第四,关注和融入社交网站,扩大图书馆的受众面,实时了解读者的需求,提升和扩展图书馆在读者个人文化生活中的作用和影响。第四,关注和融入社交网站,扩大图书馆的受众面,实时了解读者的需求,提升和扩展图书馆在读者个人文化生活中的作用和影响。 • 2012年底,腾讯QQ活跃帐户数达到7.982亿亿,“QQ空间”活跃帐户数达到6.027亿。 • 社交网站吸引了大量用户,图书馆服务需要融入社交网站。
第五,努力增加数字图书馆网站和服务项目对用户粘性,节省用户时间,提高服务质量,提升服务价值。第五,努力增加数字图书馆网站和服务项目对用户粘性,节省用户时间,提高服务质量,提升服务价值。 • 从三方面提升图书馆的服务价值:为用户提供高质量的信息资源;帮助用户快速找到并获取所需要的资源;持续不断地跟踪并推送用户关注的信息。
第六,在数据共享、数据公开的大趋势下,要切实保护用户隐私,尊重与保护他人的知识产权,争取大数据时代图书馆的服务权益与自身知识产权保护。第六,在数据共享、数据公开的大趋势下,要切实保护用户隐私,尊重与保护他人的知识产权,争取大数据时代图书馆的服务权益与自身知识产权保护。
四、结束语:——提升图书馆服务价值 • 大数据时代,互联网将从网页相联走向“数据相联”和“知识相联”。 • 大数据技术应用将是图书馆服务创新、提升服务价值的重要手段。 海量数据(数字资源+用户交互数据+位置信息等等)+实时数据分析挖掘和知识发现工具+个性化精准服务=提升图书馆服务质量和效率
谢谢大家! zhaojihai@zju.edu.cn