时间:2024-06-19
喻萍萍,刘 敏
(1.惠州学院 图书馆,广东 惠州 516007;2.湖南农业大学 图书馆,湖南 长沙 410128)
近年来,围绕着“真实用户的虚拟代表”的用户画像技术逐渐成为学术界的关注热点。用户画像成为大数据时代研究用户主题的利器之一,可以将用户心理、需求、行为、实时体验、满意度等有效融入图书馆服务实践中。大数据时代的到来,引发了图书馆服务转型及变革的浪潮,用户画像在图书馆领域的应用,为建设智慧图书馆、智慧校园提供了技术支持,有利于图书馆为用户实施精准化、精细化和个性化服务创造了必要条件。笔者结合大数据需求驱动的时代背景,从图书馆视角切入,采用文献计量法和主题分析方法,回顾我国图书馆用户画像研究进展,系统梳理最新研究成果,以期为今后图书馆服务及用户画像研究提供参考和借鉴。
从图书馆视角梳理用户画像相关主题文献,可以把握业界研究动态、避免重复研究以及发现研究亮点。笔者采取“分类+主题途径”的检索策略,选用“中国知网CNKI”作为数据获取来源,检索语句为“主题=图书馆AND用户画像”,检索时间为2021年2月21日。检索结果显示命中文献264篇,其中图书情报与数字图书馆学科领域228篇。经去重、排除不相关文献等数据清洗工作后,共获得193篇文献。
科学研究文献分布状态可以作为衡量科研成果累积量的重要衡量指标。
如图1,我国图书馆用户画像的研究文献累积193篇,始于2014年,相关文献累积主要集中在2018-2020年。2014年李业根在“基于大数据的图书馆信息营销策略”[1]一文中首次提及采用用户画像策略实现图书馆信息精确营销。从2017开始,国内图情人士开始关注用户画像研究,“基于用户画像的数字图书馆知识社区用户模型构建”[2]一文开启了图书馆用户画像技术的研究新思路。随后,用户画像技术引入到图书馆实践领域,并逐步出现系列研究成果,年度发文量逐年稳步增加。其中,2018年34篇,2019年66篇,2020年79篇。从文献的年度分布趋势来看,图书馆用户画像研究将逐步成为国内图情领域的研究热点之一。从科研累积量来看,“用户画像”在图书情报领域的研究明显滞后于其他领域(笔者以“SU=用户画像”在CNKI数据库中以主题途径检索获得2111篇,最早始于2010年)。结合年度发文量和科研累积量可知,我国图书馆用户画像主题研究文献起步不久,基于当前智慧图书馆、智慧校园等建设需求,预计未来用户画像技术在图书馆领域的应用研究将继续保持研究势态。
图1 相关文献年度发文量趋势
对研究文献来源统计结果显示,174篇为期刊论文,17篇为硕博士学位论文,1篇会议论文。文献类型以期刊分布为主的现象说明,该研究领域主要还是在学术期刊领域进行探讨。相关文献发表在39种期刊上,均刊载4.46篇,含23种图情类专业期刊。发文6篇及以上文献的期刊共10种,分别为《图书馆学研究》(21篇)、《图书馆学刊》(12篇)、《图书情报工作》(11篇)、《图书馆研究与工作》(6篇)、《图书馆理论与实践》(6篇)、《现代情报》(6篇)、情报科学(6篇)、新世纪图书馆(6篇)、河南图书馆学刊(6篇)、四川图书馆学报(6篇)。经统计,所有期刊论文中发表在图书情报类核心期刊上的论文约44%,其中CSSCI收录文献68篇,CSSCI来源期刊扩展版收录文献9篇。关于学位论文,相关研究硕士论文12篇,博士论文5篇,主要机构为吉林大学、南京大学及郑州大学。
通过对支持成果完成的项目或基金情况分析,可以了解和把握该领域的相关研究热点及趋势。从立项支持完成情况来看,相关课题累计63项,其中,国家级33项、部级7项、省级23项。经统计,图书情报学科领域项目名称中明确含有“用户画像”一词的国家级项目有4项,厅级项目5项。如2018年国家社科基金项目“基于大数据深度融合的移动图书馆用户画像情境化推荐模型研究”“多源异构数据融合的图书馆用户画像研究”;2020年国家社科基金项目“基于用户画像的图书馆低幼儿主体阅读推广及阅读服务创新研究”“基于群智图谱的图书馆用户画像及知识服务优化研究”;2019年教育部人文社科规划项目“智慧校园环境下图书馆用户画像及其应用研究”;2020年教育部人文社科规划项目“基于用户画像的高校图书馆精准服务模式构建及实证研究”等。从项目资助情况来看,近两年国家非常重视用户画像在图书情报领域的应用研究,具有明确的导向性。各省市也在积极探索引入用户画像技术促进图书馆服务的升级。如2017年福建省中青年教师教育科研项目“高校移动图书馆用户画像构建研究”、2018年湖南省教育厅科学研究项目“基于用户画像的信息素养教育模式研究”、2019年浙江省高校图工委项目“基于用户画像的高校图书馆数字阅读推广研究”等。
关键词分析可以从主题揭示角度把握研究的具体热点。193篇文献共获得关键词607个,关键词词频数为3-6个不等,均篇3.1个。利用EXCEL软件对关键词统计处理,汇总词频数大于或等于4的关键词共43个,统计结果如表1所示。
表1 图书馆用户画像研究词频分布(词频≥4)
通过对高频词的分布进行分析,可了解我国图书馆用户画像研究文献的一些基本特点:一是围绕着“用户”“读者”“数据”“图书馆”等出现了和画像关联的概念,如“用户画像”“读者画像”“数据画像”等,其表述的概念内涵与用户画像接近。“用户需求”“用户行为”“目标用户”等揭示了其需要解决的问题。二是关注于基于大数据背景探讨用户画像技术在高校图书馆、数字图书馆、智慧图书馆的应用研究,在图书馆服务实践领域主要包括“精准服务”“知识服务”“学科服务”“阅读推广”“移动图书馆”“个性化服务”“情景化推荐”等。三是“大数据”“数据驱动”“数据挖掘”“标签体系”“用户数据”“模型构建”等揭示了图书馆用户画像的主要实现路径及技术手段。
通过梳理我国图书馆用户画像主题文献,了解到大数据时代图书馆用户画像研究涉及研究方法、构建方式、服务维度等内容,从用户需求角度提升图书馆服务效率,促进了理论研究推进实践应用的发展。
认识用户画像的概念及内涵是开展高校图书馆用户画像研究的基础。1999年,软件开发者、程序设计师及理论家Alan Cooper[3]认为:用户画像(Personas)是“基于用户真实的行为及动机,代表真实用户并在数据基础上形成综合原型(Composite Archetype),即真实用户数据的虚拟代表”。Harley A[4]认为Personas是真实用户代表,是不同群体行为、动机及目标的“典型用户”,可以抓住用户关键特征从支持以用户为中心的整个项目生命周期进行设计。之后,绝大部分学者将用户画像翻译为“User Profile”,用以表述基于用户数据描述的标签集合。
用户画像可以全面细致地描述用户信息全貌,是基于海量真实数据抽象化得到虚拟用户并提炼出用户行为习惯、态度偏好,进而归类用户[5]。在图书馆学研究领域,基于大数据和个性化图书馆的定制推送服务可以理解为用户画像技术的应用之一。图书馆用户群体属性,使得用户使用馆藏资源和服务过程中,极易产生海量的静态和动态数据。其中,静态数据,如姓名、性别、专业等,相对稳定;而用户的一些动态行为,如咨询、借阅、访问、下载等,因时间而异,具有较强的时效性。然而,图书馆对于用户数据的广度、深度的敏感度不高,使得用户画像研究尚处于理论探索与实践同步阶段。
图书馆用户画像需要紧密围绕图书馆服务用户群体展开,对其构成要素及维度研究,可以准确而更好地理解图书馆用户属性以及服务的维度和方向。由于图书馆服务类型和用户群体不同,其构成要素和维度也有所不同。用户画像标签通常可以划分为基本属性标签、社会属性标签、用户行为标签、用户兴趣标签、用户能力标签等多种类别[6]。刘海鸥等[7]基于图书馆用户的基本信息、内容偏好数据、互动数据、会话数据、情境数据进行了标签化识别。李晓敏[8]从自然属性、兴趣属性、社交属性三个数据维度构建了智慧图书馆用户画像。杨群等[9]认为高校图书馆用户画像构成要素包括用户基本信息数据、馆藏资源利用数据、用户设计活动及互动数据、第三方开放数据等。晁明娣[10]认为高校图书馆用户画像包括静态属性(学历、性别、年龄、专业等)和动态属性(性格、阅读偏好、情绪状态等)两个维度,利用真实用户在图书馆数据化平台的互动痕迹,抓取关键信息分类筛选,实现属性标签刻画的专属“用户画像”。
由于理解角度和构建用户画像的目的不同,构建模型运用的方法和工具也不尽相同。专门涉及用户画像构建方法及模型的研究文献较多。如基于设计与思维的目标导向、参与导向、虚拟导向、角色导向等构建法;基于行为或日志的构建法;基于多维或融合的构建法等[11]。王仁武[12]通过用户访问日志来构建图书馆学术用户画像的信息行为标签和研究兴趣标签。毕达天等[13]综合运用问卷调查方法、访问日志挖掘方法、出声思考法挖掘用户在不同场景的信息需求期望、信息搜索习惯和信息接受偏好,运用专家访谈法基于向量空间模型(VSM)构建用户画像模型。许鹏程等[14]提出数据驱动下用户画像数据化→标签化→关联化→可视化的驱动主路线,从自然维度、兴趣维度、社交维度,构建多维度、多层级、立体化的用户画像模型。吴智勤等[15]提出一种基于社交网络分析方法的高校图书馆用户画像构建策略。胡云飞[16]提出利用基于马氏距离的二分K-means算法进行聚类得到用户画像。王震飞[17]通过八爪鱼数据采集器在科学网上采集图书馆学、情报学、档案学三个学科领域博主相关数据,结合RFM模型和K-Means聚类算法构建博主群体画像。梁欣[18]提出一种基于Hadoop的数字图书馆用户画像系统。徐海玲[19]利用Con Exp1.3工具构建不同群体用户类别的细分标签,并生成Hasse图,通过概念格“Calculate Association Rule”对不同群体的用户行为进行关联规则挖掘。冯龄萱和魏群义[20]运用扎根理论分析访谈数据并提取用户流失因素、用户变化、用户行为、用户基本属性四个方面的用户画像标签,构建高校移动图书馆流失用户画像标签框架及模型。陈添源[21]利用因子分析、聚类分析等方法选取用户画像个数,借助R语言wordcloud2软件包可视化不同用户画像的特征标签云并对每个画像标签展开描述。
大数据背景下用户画像服务应用领域涉及了基础应用、业务应用和决策应[22]。从图书馆用户画像服务领域研究则更多的是面向精准服务、知识发现、阅读推广、情境化推荐等应用层面。肖海清等[23]基于数据采集层、数据处理层、标签抽取层、用户交互关联层及应用实现层构建了高校图书馆阅读推广参与式用户画像模型。刘海鸥[24]从个性化学习的数据获取、标签体系构建、学习者画像建模等多个层面深入挖掘大数据时代用户个性化学习的精准服务需求,提出契合用户需求的个性化学习精准服务模式。陈丹等[25]从知识服务、阅读推广、场景推荐、主动定制等方面提出基于用户画像的图书馆个性化智慧服务策略。王益成等[26]提出运用标签云技术为处于不同场景的科技情报用户定制有针对性的个性化服务方案。刘漫[27]结合聚类、关联算法构建了高校图书馆大学生用户画像阅读推广模式。马管[28]认为利用用户画像建模技术对学科用户数据的深度挖掘分析,可为用户提供更加精准、高效的学科服务。朱会华[29]提出通过建立用户画像学科采访系统,实现线上图采中心、用户画像学科群、分级分类式采访、读者决策等相融合的学科采访模式。此外,袁军[30]认为大数据环境下用户画像还可用于读者信用管理、制定科学合理的发展规划等,康存辉[31]研究了用户画像对智慧图书馆空间再造的作用,吴智勤[32]研究了高校图书馆科研用户画像构建。
国内学者积极引进国外图书馆用户画像的实践经验并进行了初步探索,开拓了图书馆用户画像的本土化研究进程。鄂丽君等[33]以美国康奈尔大学、杨百翰大学、纽约大学、科罗拉多大学的图书馆为例,介绍了用户画像构建的前期准备、数据获取及分析、构建及验证等环节。董丽[34]以美国北卡罗来纳州立大学和中国社科院用户画像成功经验为例,认为高校图书馆精准服务需要明确思路。王丹[35]介绍了加南大多伦多大学图书馆特色服务,提出构建读者画像并建设智慧型图书馆。李晶洁等[36]以天津商业大学图书馆阅读者数据为例,建立关键词数据画像,并参照内容对图书馆资源建设和服务提出了建议。杨帆[37]以国家图书馆大数据项目为例,实证了基于大数据平台的迭代分析方法对图书馆大数据平台构建和精细化读者服务的指导意义。蒋君等[38]以中国医学科学院图书馆NSTL原文传递数据为例,采用文献计量、聚类、分类和序列分析等方法,从用户偏好、用户行为两个维度对原文传递用户构建用户画像。
通过对现有研究的总结分析可知:(1)图书馆用户画像理论研究较为薄弱,未形成研究体系。虽然业内有大量有关用户画像的相关成果,但涉及图书馆用户画像的知识体系范畴、服务维度、构建流程、评价指标等研究深度不够,有待进一步加强。(2)不断完善中的图书馆用户画像构建流程研究。对文献研究主题梳理分析可知,我国图书馆用户画像主题涉及了服务要素及维度、设计模型、服务应用范畴等,包括图书馆用户属性、用户数据获取、用户标签提取等内容并有相应的实践成功案例。这些涉及了图书馆用户画像的构建流程,也说明该领域的研究具有较好的基础并在不断完善中。(3)图书馆用户画像应用领域有限。大数据背景下,用户画像应用范畴极为广泛,包括通信、互联网、搜索引擎、网络视频、即时聊天、图书馆等多个领域。但图书馆用户画像的应用以阅读推广、推荐服务为主,仍有较大发展空间。
通过对现有文献研究回顾,笔者认为图书馆用户画像主题领域研究有待进一步引起业内重视,包括用户信息安全与隐私保护、用户画像更新与评估、多源数据融合与统一等。未来在相应领域开展相关研究,促进图书馆用户画像实践研究的百花齐放。
1.丰富图书馆领域研究方法,促进图书馆学研究本土化发展。图书馆学研究思维是在图书馆学研究过程中,为解决或解答某个具体的图书馆学问题所使用或创造的思维方法及研究范式。从我国的图书馆学理论研究的发展可以看出,“引进”“移植”后“本土再造”是当代图书馆学及图书馆事业实践应用发展的一大特色,即我国一部分图书馆学理论与研究方法借鉴了国外的概念、研究范畴、思想体系等,结合国情再进行本土改造后实现创新。未来,结合图书馆用户画像的理论思维和实践效果研究以及图书馆发展的实际,促进本土图书馆领域技术方法的革新、服务模式的创新、服务质量的提升、服务内容的延伸等,有利于进一步拓宽本土化图书馆学研究方法和理论。
2.不断完善图书馆用户行为模型及服务模式的研究。在研究图书馆用户行为时,学者们更多的是从用户属性、兴趣爱好等静态维度研究群体特征,具有一定的局限性。而从图书馆用户画像角度较好地融合了用户群体的各类属性特征,包括服务内容、资源特征、阅读属性、教育范畴等多种特点并实现多维交互分析。因此,从静态和动态角度研究用户行为,以期为用户匹配不同特征和属性的图书馆服务,为不断完善中的图书馆用户行为模型、服务模式提供了新的思维方法和角度。
3.加强对图书馆用户画像中信息安全、质量评估等问题研究。用户画像是对用户个人信息及数据的有效利用。因此,在搭建图书馆用户画像时面临着隐私保护及个人信息安全的矛盾,比如用户的姓名、性别、年龄、阅读喜好等。用户数据越全面、越多,则用户画像越有用、越精准,而这极易引起泄露用户数据而引起不必要的侵害用户权益的可能。因此,如何加强图书馆用户画像中涉及的隐私保护及个人信息安全是一个值得深入研究的主题。另外,图书馆用户画像更新、质量评估及反馈机制,图书馆网络舆情生态环境等都是未来图书馆用户画像领域中有待进一步研究内容。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!