时间:2024-05-22
陈 臣(兰州商学院信息中心 兰州 730020)
基于小数据的图书馆个性化服务QOS保证研究
陈 臣
(兰州商学院信息中心 兰州 730020)
〔摘 要〕为了解决图书馆个性化服务质量保证的相关问题,提出一种基于小数据的图书馆个性化服务模式。该模式实现了图书馆的精准营销,保证CRM系统以客户为中心,可为图书馆的个性化服务服务质量(QOS)保证提供有力支撑。
〔关键词〕小数据 图书馆 个性化服务 QOS
伴随云计算技术、移动互联网技术和物联网技术在图书馆读者服务中的广泛应用,图书馆的读者特征数据、用户服务数据和系统管理数据呈现级数递增,图书馆界已进入大数据时代。
大数据具有Volume(海量)、Velocity(高速度)、Variety(多样性)和Value(低价值)的4V特性,导致基于大数据支持的图书馆读者个性化智慧服务,存在着决策成本高、应用算法与预测模型复杂、分析与决策实时性差、系统资源使用效率低等问题,因此,大数据决策已不适合读者个性化阅读活动安全、智慧、即时和便捷的需求。[1]小数据决策是指图书馆以读者个体为中心,进行的全天候、全方位读者数据采集、存储、处理、分析和决策的活动,可为图书馆准确发现读者需求和科学制定个性化智慧服务模式提供可靠的数据决策支持。如何将读者个性化阅读服务需求和小数据决策优势相结合,是图书馆提升读者个性化服务水平和读者阅读满意度应关注的重要问题。[2]
2.1 小数据概念的产生与特点
“小数据”的概念由美国康奈尔大学计算机科学教授德波哈尔·艾斯汀提出,她的小数据价值发现来源于对其年迈父亲生活、行为的细微观察。艾斯汀的父亲于2013年去世了,她发现父亲去世前几个月的数字社会脉动信号发生了异常——这位90岁的老人不再发送电子邮件,去超市购物的次数逐渐减少,到住所附近散步的距离也越来越短。然而,这些细微的异常却没能在医生的心电图检查中显示出来,心电图检查结果显示老人身体健康。这启发艾斯汀开始研究小数据,从病人日常生活的小数据中寻找异常之处,并把它当作一种新的医学证据运用到病人的治疗中,这些小数据可为病人诊断和治疗决策提供直接的科学依据。[3]
从数据的定义、结构、特点和作用对象分析,小数据和大数据具有较大的区别。世界领先的麦肯锡咨询公司对大数据的定义是:“大数据是指大小超出了传统数据库软件工具的抓取、存储、管理和分析能力的数据群”。与大数据相比,小数据并不仅仅指数据总量小,而是指以读者为中心而进行的数据采集、处理、存储、分析、判断和决策等活动。图书馆能够依据小数据决策发现读者需求,小数据可为图书馆读者个性化智慧服务和服务模式变革提供可靠的数据支持,是图书馆QOS和读者满意度的必要保障。其次,小数据分析在分析的对象、方法和侧重点上与大数据不同,小数据是以读者为中心而开展的深度数据分析,具有持续、不间断和个性化的特点。而大数据主要涉及图书馆建设、运营和服务模式变革的宏观全局,具有全面、复杂和价值发现难度大的特点。第三,与大数据决策相比,小数据具有数据采集高效、可控、易处理和易操作的特点,能够在较低数据决策成本投入的前提下,为图书馆提供高价值、实时、易组织和可视化的数据决策服务,具有较高的数据决策投资收益率。
2.2 图书馆小数据的内容与小数据决策价值
2.2.1 图书馆小数据的内容
在图书馆的管理、运营和服务活动中,小数据是指图书馆通过视频采集设备、传感器网络、可穿戴式设备、服务器与网络监控器等设备,采集的与读者相关的阅读行为与历史记录、阅读社会关系、在论坛与博客发表的评论、读者个体移动路径、个体地理位置、阅读终端访问记录和配置等数据信息。图书馆小数据是与读者相关的个人数据,具有数据价值高、决策成本低、可控性强和实时决策服务的优点。但同时也存在数据类型复杂、结构性差、分析难度大和读者隐私易受侵犯的问题。[4]这些小数据可为图书馆精确发现读者阅读需求、用户服务模式科学变革、QOS保障和读者个性化服务质量保证提供可靠的数据决策支持。
2.2.2 小数据决策与大数据决策的区别
在图书馆数据决策中,小数据是以读者为唯一的数据采集、分析和决策对象,而进行的全方位、全天候数据价值深度挖掘和利用活动,是大数据宏观全面分析、决策的必要补充。同时,小数据系统也是读者个人数据与外界大数据系统唯一的数据交换、传输接口,小数据决策系统可以将分析结果直接传输给大数据决策系统,以此提高大数据决策的科学性和可用性。其次,与大数据应用环境和决策模式相比,小数据具有数据总量有限、价值密度高、可控性强和决策效率高的优点,传统的大数据思维、决策模式已不适应小数据决策的需求。第三,小数据信号通常隐匿在海量的大数据信号中,可能会被当作随机、不规范和高误差的噪音信号而过滤,会导致图书馆数据决策的科学性和可用性大幅下降。[5]此外,大数据更加注重全数据的观念。只有通过对大数据的标准化定义,才能实现大数据的大规模采集、批量化处理和海量数据概率统计。而小数据更加注重读者数据的个性化特征挖掘,通过对读者小数据全天候、全方位和精确的挖掘与分析,来发现读者小数据的相关价值和数据之间的因果联系。
2.2.3 大数据决策无法满足个性化服务读者隐私安全保护的需求
大数据时代,图书馆会通过视频监控系统、网络监控设备、传感器网络系统、读者个人资料的爬虫采集系统,全方位、不间断地采集读者相关个人信息、社会关系和行为数据,这些小数据信息混杂在大数据中间,读者无法了解、掌握和控制这些小数据使用的对象、方式和程度,因此,读者个人隐私易遭受非法践踏和侵犯。
其次,大数据时代读者没有获取可穿戴阅读设备的完全控制权限,图书馆无法在保障QOS的前提下完全保护读者隐私安全,读者阅读行为数据可能会在用户不知情的情况下被过度采集和使用。同时,依据大数据制定的读者个性化服务决策,可能会因为侵犯读者隐私而导致用户阅读可信度和愉悦感的下降。第三,大数据具有海量、多类型、存储分散和数据总量级数递增的特点,图书馆无法对其进行有效的生命周期全程管理,也难以对其采集、存储、分析和决策过程开展有效的安全评估与审计。因此,如何有效利用小数据总量有限、高价值和易监控的特点,将小数据的采集权、存储权、访问控制权和使用权交付读者管理,是保护读者隐私安全和增强小数据可用性的有效途径。[6]
2.2.4 小数据可为读者个性化智慧服务提供可靠决策支持
图书馆大数据资源具有海量、复杂、快速处理和低价值密度的特点。为了增强大数据处理效率和数据决策实时性,图书馆通常会按照地理位置和读者群数量划分,在不同的服务区域均衡部署若干个云数据中心,以此提升大数据传输、存储、备份、处理、分析和决策的效率。但是,随着图书馆大数据总量、数据结构复杂度和数据决策质量需求的快速增长,传统的仅靠增强数据中心IT设备性能来提升大数据处理能力的方式,已远远不能满足图书馆大数据决策的需求。因此,图书馆必须依靠小数据总量可控、高价值和数据处理高效率的优势,才能提升数据决策效率和有效降低数据决策的成本。其次,大数据具有海量、异质性、低价值密度、高数据噪音和实时性差的缺点,图书馆难以从海量、低价值密度的大数据中快速挖掘数据价值,无法为图书馆管理、决策层和普通馆员提供安全、可靠和实时的大数据决策服务,而传统依靠直觉、经验和不可靠数据进行的服务创新与决策,将最终影响决策的科学性和读者个性化服务的QOS保证。第三,基于小数据的支持,图书馆可以实时发现读者的阅读需求和阅读模式变化,实现读者个性化服务从直觉和经验驱动的主观经验决策,向小数据驱动的客观科学数据决策转变。
3.1 增强小数据的价值属性和决策可用性
统计学家纳特·西尔弗在《信号与噪声》中写到:“专业预测人员可以通过基于数据的定量分析,很好地摒除我们预测中的主观偏见。然而,无论你采用什么方法,定量、定性等手段,都会遭遇一个巨大的问题,就是如何区分信号和噪音。”因此,噪音信号是导致小数据信息过载、价值密度降低和数据可用性下降的重要因素。[7]为了降低小数据的数据总量和噪音干扰,图书馆必须确保读者可穿戴设备、视频监控设备、阅读终端管理设备和传感器网络采集等设备,在读者小数据的采集、处理、存储和应用中,坚持统一数据标准、统一处理系统、统一访问接口和统一分析平台的原则,不断增强小数据的可用性和可控性。其次,小数据的结构完整性和生命周期可用性,是关系图书馆小数据决策科学性的主要因素。图书馆不能单纯依靠小数据作出个性化服务的决策,还应与读者的阅读心理、阅读场景和阅读社会关系相结合,基于小数据的支持,重点加强对读者阅读需求和阅读心理驱动的发现、挖掘,提高图书馆对读者的阅读需求和服务模式变革的感知力。第三,图书馆小数据具有数据量庞大、数据来源多、结构复杂和数据粗糙的特点。图书馆只有通过对来自不同采集源、不同部门、不同系统数据的整合,才能发现小数据中蕴涵的新价值属性,才能实现“ 1+1大于2”的数据增量。
3.2 用小数据去匹配读者个人需求
大数据决策是从大数据中挖掘事物的客观规律和相互关系,而小数据决策则是从小数据中发现读者个体的阅读需求和阅读模式变化趋势,因此,图书馆可从大数据中得到规律,而用小数据去发现和匹配读者个体。
在传统的读者阅读服务中,读者群阅读需求变化和阅读环境变化是图书馆服务模式变革应重点关注的两个方面。图书馆基于大数据的读者个性化服务决策中,往往依据服务过程中整个读者群普遍存在的阅读需求、阅读方式、阅读环境特征和IT服务系统性能,制定可保证大多数读者QOS需求的服务策略,具有服务投资收益和读者个性化满意度低的缺点。而基于读者实时小数据决策的服务模式,将服务决策理念从“对症下药”转变为“对人下药”,通过实时的数据采集、分析、处理,可及时掌握读者个性化阅读需求、阅读模式和阅读环境的变化,并依据小数据决策制定动态和自适应反馈控制的服务策略,具有较高的服务系统资源利用率、服务投资收益率和读者阅读满意度。《大数据时代》作者维克托·迈尔-舍恩伯格说:“由大数据带来对人的重新认识,不是在阿波罗神庙,而是在小世界网络中认识你自己。”[8]因此,读者是图书馆小数据决策的核心和重点。图书馆通过小数据可将图书馆、读者、服务模式和服务市场关联为一个整体,会更加专注于对读者和读者需求的准确、及时识别与理解,并在恰当的时间、地点和阅读模式条件下,为读者精确投放个性化阅读服务保障,建立一个读者与图书馆服务共存的紧密关系。
3.3 可为读者个性化智慧服务提供小数据决策支持
图书馆小数据具有数据总量有限、价值密度高、个性化特征强和处理实时的优点,因此,小数据决策比大数据决策有更高的个性化针对性、动态可调控性和服务经济性。利用小数据高速处理和实时决策的优势,图书馆可在特定的时间及时掌握不同读者的阅读需求和模式,并通过商业智能(BI)系统智能化预测模型对小数据的实时分析结果,为不同读者制定精准的智能、自动化营销策略,在基于小数据的个性化服务中构建一个图书馆服务品牌和读者阅读互惠、共存的关系。其次,在传统的图书馆服务广告推送中,通常采取将广告内容无选择地向绝大多数目标读者投放的方式,导致广告精确度低和造成对读者阅读的干扰。基于小数据的决策支持,图书馆通过对读者的个体位置、移动路径、阅读喜好与习惯、历史阅读记录、论坛与博客发表的观点、检索与查询记录、阅读社会关系等小数据的分析,可以准确预测、判断读者在未来某一时刻的阅读需求和阅读模式,并在恰当的时间、地点以最优方式,为读者提供精准的阅读广告和个性化阅读服务。第三,随着科技的发展,应用程序(App)已成为关系读者阅读模式智慧化、多样化和服务决策科学性的重要因素。基于小数据决策服务的支持,图书馆可对APP的读者群个体特征、阅读内容、阅读习惯与行为、阅读兴趣等预先设定规则,通过读者阅读服务订阅、读者群互动、阅读行为与习惯等条件触发,保证用户个性化服务的精准、实时和动态推送。第四,基于小数据的决策支持,图书馆可在“以读者为中心”服务理念指导下,加强个性化服务中的风险审计与管控、质量精细化管理、服务模式创新和个体需求QOS保证等,确保图书馆读者个性化服务具有较高的投资收益率和读者满意度。[9]
3.4 利用小数据决策有效保护读者的隐私安全
图书馆大数据采集具有全天候、大范围、深层次和不间断的特点。此外,大数据的处理、整合、二次价值挖掘、分析和决策过程,是以精确发现读者需求、服务模式变革趋势、市场竞争环境变化和读者阅读方式转变为其最终目标。但过度的大数据价值挖掘、数据整合和决策分析,可能会导致读者隐私泄露或被侵犯。因此,必须构建安全、高效、精确和可控的小数据决策系统,在保护读者隐私的前提下提高图书馆数据决策的科学性。[10]
首先,小数据系统的构建应坚持统一系统、统一平台、统一管理和统一决策的原则,确保小数据的采集、过滤、传输、处理、分析和决策过程与大数据系统相互独立。当大数据系统决策需要小数据支持时,小数据系统仅将处理、分析和判别后的结果通过数据接口传输至大数据系统,为大数据系统决策提供判断依据,而不允许大数据系统对小数据资源进行完全控制权限的访问、下载、修改、删除和存储等操作。其次,图书馆应将小数据的管理权限交付读者,由读者决定图书馆对自身相关小数据采集、分析、共享、决策的内容、方向、途径和程度,并允许读者对自身隐私数据进行使用范围的限定、授权和永久删除,或通过指令自动关闭小数据系统,中断小数据采集与监控系统对自身行为数据的采集。[11]第三,读者小数据具有极高的价值属性,对图书馆个性化服务和第三方运营商服务有着重要的意义,会成为商家监控、采集、交换和共享的目标。因此,图书馆应通过对大数据系统的读者隐私数据开展监控、加密、删除和匿名化处理等活动,及时将发现的读者隐私小数据传输至小数据系统存储,严禁与第三方服务商进行读者隐私数据的无限制交换和共享。
3.5 增强读者群价值属性和提高图书馆客户关系管理CRM)效率
读者、馆员、服务资源和服务产品是图书馆开展个性化服务的四个基本要素。如何基于图书馆服务资源总量和服务模式实际,通过对小数据的科学分析来准确发现读者的阅读需求,并在读者、馆员、服务资源和服务产品之间构建一种科学、高效的关联性,是图书馆增强读者群价值属性和提高CRM效率的必要保证。
图书馆小数据是以读者为中心的数据集合。通过对小数据的采集、分析、判断和决策,图书馆可以更加准确地发现、识别和理解读者,并在精确的时间、地点为读者提供高价值的个性化服务,在读者、图书馆员和服务之间实现基于小数据的动态关系管理和决策反馈控制。其次,由二八定律可得出20%的高端读者可为图书馆带来80%的服务收益,而80%的普通读者只为图书馆带来20%的服务收益。因此,只有快速、准确地发现高价值读者,依据读者的阅读收益率将用户划分为不同等级,并将服务资源大比例的投入到高端读者的服务中,以及潜在高价值客户的培养中,才能确保读者群整体有较高的阅读忠诚度和满意度。[12]第三,差异化服务创新是图书馆提高个性化服务质量和读者阅读满意度的前提。图书馆基于对读者个体特征、阅读行为、读者服务、阅读社会关系等小数据的分析,可以精确地判断出为不同读者提供的产品与服务是否最优,是否比其它图书馆服务有更强的竞争力,是否会有更高的服务投资收益。同时,小数据决策也可作为大数据决策的必要补充和完善,为图书馆服务系统管理、服务模式变革、服务市场竞争和读者群CRM提供可靠的决策支持。
目前,读者个性化服务需求的精准预测、服务资源的科学分配、服务QOS的有效保障和读者个性化阅读活动的满意度,已成为关系图书馆服务模式有效变革和服务市场竞争力发展的重要因素。在图书馆基于大数据的分析、决策中,存在着大数据决策复杂、数据应用成本高、决策时效性差和读者个性化保障水平低的问题,不能满足读者服务精准、实时、经济和个性化定制的需求,而小数据决策则是有效满足读者阅读需求发展、提升读者服务质量和降低服务成本的有效途径,是图书馆大数据决策的必要补充和完善。
因此,图书馆必须将读者个性化服务需求发现和用户服务能力提升放在小数据决策的中心位置,重点加强小数据决策的精细化管理和读者阅读服务的个性差异化保障,确保小数据采集、传输、存储、处理、分析、决策的过程安全、高效、经济和可控,才能有效提升小数据决策的科学性、精确性和可预见性,才能为读者提供安全、高效、经济和便捷的小数据个性化智慧阅读服务。[13]
(来稿时间:2015年5月)
参考文献:
1.马晓亭.大数据时代图书馆数据可用性:价值、挑战和保障.图书馆理论与实践,2014(10):5-8
2.(英)维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革.盛杨燕, 周涛, 译.杭州:浙江人民出版社, 2012
3.李勇等.基于小数据的在线用户兴趣长程演化研究.计算机研究与发展, 2015, 52(4):779-788
4.刘晓英,文庭孝.大数据时代的数字资源融合研究.图书馆, 2015(2):58-61
5.熊文龙,李瑞婻.基于科学数据管理的图书馆数据服务研究.图书情报工作, 2014, 58(22):48-53
6.漆晨曦.立足小数据基础的电信企业大数据分析应用发展策略.电信科学, 2014(10):15-20
7.彭华杰.大数据时代图书馆读者的隐私危机与隐私保护.图书馆工作与研究, 2014(12):56-59
8.朱夏等.云计算环境下基于协同过滤的个性化推荐机制.计算机研究与发展, 2014, 51(10):2255-2269
9.马晓亭.基于用户服务价值的图书馆大数据价值分析与服务质量保证研究.图书馆, 2014(5):95-98
10.许碧文.论大数据时代图书馆服务的发展与创新.图书馆理论与实践,2014(12):19-20, 34
11.王艳等.网络用户行为的隐私保护数据挖掘方法. 计算机工程与应用, 2012, 48(13):138-143
12.马晓亭.大数据时代图书馆客户关系管理研究.图书馆工作与研究, 2014(6):49-52
13.孟小峰, 李勇, 祝建华.社会计算:大数据时代的机遇与挑战.计算机研究与发展,2013, 50(12):2483-2491
〔Key words 〕Small data Library Personalized services Quality of service
〔分类号〕G250.76
〔作者简介〕陈臣(1974-),男,陕西西安人,硕士,兰州商学院信息中心副教授,研究方向:大数据、数字图书馆建设。
Research on QOS Guarantee for Personalized Services of Library Based on Small Data
Chen Chen
( Information Center, Lanzhou university of Finance and Economics )
In order to deal with the QOS guarantee for personalized services of library, in this paper, a library personalized service model based on small date is presented. The model can guarantee precision marketing of library, guarantee CRM implements among the customer, and can give a strong support for QOS guarantee of library.
〔Abstract 〕
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!