关键词:图书馆服务;大数据;数据挖掘;数据分析
摘要:文章分析了大数据理念及其对图书馆服务的影响,指出图书馆要想真正提供个性化服务和智慧服务,使服务更具价值,必须将服务建立在分析、挖掘相关海量数据的基础上。
中图分类号:G250.7文献标识码:A文章编号:1003-1588(2016)09-0112-03
互联网促使数字数据量猛增,让人类迈入大数据时代,使图书馆馆藏资源与日俱增,数据类型多种多样,存储系统空间日益增大,图书馆服务开始提供访问、互动、共享、数字化和备份等功能,管理系统支持不同的输入、输出密集行为及数据查询密集行为。因此导致图书馆相关数据急剧膨胀,造成图书馆无法在一定时间内用常规软件或工具对其内容进行分析、处理和管理,大数据开始对图书馆的服务方式、馆藏结构、管理模式产生重大影响。
1大数据内涵及理念
1.1大数据内涵
关于大数据,目前学界尚未形成统一的定义,但是存在一些共识:大数据是一个动态概念,是一个用来描述海量的结构化、半结构化和非结构化数据的流行短语,大数据的容量非常巨大以至于很难用传统的数据库和软件技术进行存储、管理和处理。但是,人们没有明确提出数据量必须达到TB级或PB级才算是大数据,数据量随着信息技术的发展而改变,过去或目前的大数据,在未来可能不再是大数据。
大数据具有4V特征,即种类(Variety)多、速度(Velocity)快、容量(Volume)大、价值(Value)大[1],其中价值大是其首要特征。建立数据驱动的关于大数据相关关系的分析以及建立在相关关系分析法基础上的预测是大数据的价值所在[2]。对图书馆来说,大数据的价值是分析读者和图书馆的各种数据来创新、完善图书馆服务,制定图书馆未来发展策略。
1.2大数据理念
大数据基本理念是通过包括互联网在内的多种渠道收集研究对象的多维度数据,通过对海量数据的关联分析和数据挖掘,发现被研究对象的潜在行为模式或规律[3]。
1.2.1提炼数据的价值。大数据时代,重要的不是数据,而是如何使用数据。企业要想创新发展立于不败之地,必须改变它们的经营方式,学会从数据中洞察事实并做出反应,否则数据整理得再有条理,也没有什么价值。美国麻省理工学院管理评论在一个研究报告中指出:“顶尖绩效的公司使用正确分析挖掘方法和工具的使用率,与绩效低的公司相比,高出5倍。”[4]可见,挖掘数据价值在企业中非常重要,是人们利用大数据进行决策、发现事物规律的前提。
1.2.2分析数据,预知未来。美国学者艾伯特-拉斯洛・巴拉巴西认为,93%的人类行为均可以通过数据分析予以预测[5]。因此,图书馆要把用户访问图书馆网站、利用资源习惯、用户网络行为等数据搜集起来,进行分析挖掘,去发现用户利用资源的规律及信息需求特点。
1.2.3服务精确与个性化。大数据时代,对一个企业来说,它能够收集来自电子商务、企业网站、博客、微信、移动应用等不同渠道的用户访问、交易和反馈数据,通过这些数据能够了解用户的全方面信息,通过分析数据帮助企业针对不同的用户提供更加精确、更加贴心的产品或服务;对信息服务机构来说,通过收集、分析用户信息,可以提供个性化服务或一对一服务。
2大数据对图书馆造成的影响
大数据时代,图书馆服务质量的提升需要大数据的支持,大数据将成为图书馆的核心资产,图书馆对读者数据进行分析、处理和预测,能够给读者提供更好的服务模式[6]。读者信息需求呈现个性化与多样化,为满足其需求图书馆需要分析处理图书馆与读者之间、不同服务数据之间、读者与服务数据之间的关系数据,预测读者多样化需求、提供针对性服务和个性化定制服务。因此,从海量数据中分析潜在的价值、读者需求和行为,并通过个性化服务来满足读者获取信息的效率、准确性和便捷性,成为影响图书馆服务发展及质量提升的关键。
大数据对图书馆馆藏造成的影响主要有:一是数据量猛增。过去图书馆没有关心或没有能力关心的数据,如:社交媒体、实时位置、智能设备、传感器计量、消费痕迹等复杂业务数据,也成为收藏对象。另外,随着资源共享、图书馆联盟建立,有的馆藏可用量已达TB级,甚至PB级。二是随着图书馆越来越重视个性化服务,图书馆系统与网络日志、监控与服务视频、音频、图片、网络行为及增值服务信息等非结构化数据将占数字总量的80%以上,大大超越了以数字文本为主的机构化信息资源的数据量。三是图书馆数据量的增长与数据的价值密度背道而驰,造成图书馆海量数据的价值密度较低,而图书馆收藏及提供的信息资源是经过筛选的高质量知识信息。因此,图书馆需要利用大数据技术与理念处理、挖掘海量数据来提高数据的价值密度和可用性。
3大数据环境下图书馆服务的新发展
3.1数据分析与数据挖掘是基础
大数据时代,图书馆间的竞争不仅是对文献信息的拥有与组织的竞争,更多的是对多类型数据的拥有、融合、挖掘与利用能力的竞争,即大数据推动图书馆服务体系从以资源为中心向以数据为中心的方向发展,并且数据分析与数据挖掘成为图书馆提供服务与开展工作的基础。
图书馆要想提升服务水平,需要对用户数据进行分析、处理和预测,以便提供更好的服务和更多的服务方式。图书馆通过对用户借阅记录、数字资源使用下载行为、网站浏览等记录进行分析,建立用户数据库,再进行用户行为模式相似性比对,提供准确的信息资源推荐及推送服务;通过对图书借阅率、借阅排行、借阅次数、访问数字资源类型及时间、学习行为、利用资源模式等记录进行分析,图书馆能有针对性地采购用户需要的信息资源;通过对读者阅读习惯、学习方式、获取资源方式等数据进行分析,图书馆能科学合理地完善图书馆工作流程与服务模式。
3.2服务走向个性化
大数据环境下,图书馆的服务策略建立在对大规模复杂数据搜集、组织、整理、分析和挖掘的基础之上,因而大数据时代的图书馆服务项目更具有针对性和操作性[7]。所以图书馆在解决用户问题时,可以完全抛弃传统的解决流程,而采用大数据策略的解决方案,即搜集解决用户问题的相关数据,量化分析,再找出相互关系,给出最优解决方案。图书馆对数据的挖掘、分析,不仅要分析MARC、电子论文、电子图书等结构化数据,还要分析用户的借阅行为、阅读习惯等非结构化数据以及用户的网络交流、购物、娱乐等网络行为数据,这样图书馆才能实现“一对一”的个性化服务。如:美国国会图书馆通过分析馆内布局与藏书流通率的关系,来量化并预测用户的借阅行为,进而提供针对性服务[8]。 3.3服务趋向智慧性
大数据是数据世界的智慧基因,分析和应用大数据是获得智慧的关键[9]。传统分析数据的思路基本上都是抽取样本,事先确定收集什么样的数据,然后寻找“已知的未知(Known unknows)”,即证实某一结论正确。而大数据分析则是以全部数据为对象,发现未知的未知,即找到一些未曾想到的结果。大数据这种发现未知的未知功能为图书馆服务创新、实现智能化开辟了途径,图书馆服务开始趋向智慧化发展:第一,大数据技术不仅能够利用数据了解用户、信息行为、意愿、业务需求、知识应用能力及服务需求等,还能够利用数据分析和预测用户科研创新将要发生什么,从而提供智慧服务。第二,对图书馆已有信息资源进行挖掘,抓取有价值的知识、关系、模式等,对网络免费信息资源利用蜘蛛爬行器、自动跟踪等技术完成对其搜集、处理和保存等,以便构建智慧型知识服务引擎。第三,大数据时代,智慧服务的三个基本要素是智慧馆员、数据(知识)和用户,其中智慧馆员是核心和主体。智慧馆员不仅要具备掌握分析和预测大数据的范畴、价值、状态和周期的能力,还要具备灵活运用信息技术、人工智能、自然语言理解、数学算法等多学科先进成果的能力。
3.4提供面向创新的知识服务
大数据环境下,图书馆提供面向创新的知识服务,该服务以解决用户问题为核心,深入解决问题的各个环节,拥有解决问题的探索、构建和测试等服务机制。此服务建立用户数据库,跟踪和整理大量文献(馆内外信息资源),对比、筛选与组织相关内容,鉴别、分析可能的结构和趋势来构建宏知识,利用大数据技术进一步挖掘知识结构中的冲突、变异和可能性,分析知识内容的发展趋势与路径,支持对科技创新未来演变方向与可能性的挖掘与预警,从而开拓和激发创新思路与路径。通过对多样化数据和信息的关联与分析,来支持具体领域的具体问题及其解决方法的分析,再根据需求的动态变化不断调适,与用户共同探索问题的解决方案[10]。
3.5服务更具价值
通俗地讲,大数据技术就是从海量的各种类型的数据中发现有价值信息的技术,此技术对图书馆服务质量的提升具有很大的帮助。如:图书馆员利用大数据方差分析、判别分析与常规仿真模型、神经网络分析相结合的分析方法,针对读者某一具体研究问题或研究领域进行分析,发现未被人知的研究方向,预测某一学科的前沿发展或学者影响力评价等。再如:图书馆员搜集某一学科的各种类型、各种结构的数字资源,使用聚类分析与大数据技术架构相结合的分析方法,对该领域的研究方向进行归纳、分类,为读者提供了解学科隐含着的发展趋势、学科文献之间的联系、可视化学科图谱等有价值信息。
参考文献:
[1]郭育艳.大数据时代图书馆信息服务的创新[J].郑州航空工业管理学院学报,2014(1):122-124.
[2]维克托・迈尔-舍恩伯格,肯尼思・库克耶.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2012:150-156.
[3]李善青,赵辉,宋立荣.基于大数据挖掘的科技项目查重模型研究[J].图书馆论坛,2014(2):78-83.
[4]Bill Franks.驾驭大数据[M].北京:人民邮电出版社,2013:60-78.
[5]艾伯特-拉斯洛・巴拉巴西.爆发:大数据时代预见未来的新思维[M].北京:中国人民大学出版社,2012:99-110.
[6]韩翠峰.大数据时代图书馆的服务创新与发展[J].图书馆,2013(1):121-122.
[7]杨海燕.大数据时代的图书馆服务浅析[J].图书与情报,2012(4):120-122.
[8]王天泥.知识咨询:大数据时代图书馆的知识服务增长点[J].图书与情报,2013(2):74-77.
[9]韩炜.大数据时代公共图书馆消除数据不平等的路径选择[J].图书馆论坛,2014(3):14-21.
[10]张晓林.研究图书馆2020:嵌入式协作化知识实验室?[J].中国图书馆学报,2012(1):11-20.