时间:2024-07-06
李晓旭
(滨州市图书馆,山东 滨州 256600)
互联网技术的广泛应用,在给用户获取信息带来便利的同时,也使得用户的信息行为轨迹更容易被获取。借助大数据、数据挖掘等技术,对用户数据进行采集分析,是深入分析用户需求、跟踪掌握用户动态变化的有效方法。对于转型发展中的数字图书馆而言,借助用户数据与资源分析,利用智能化技术创新阅读推广方式,强化对用户需求的感知度,将更好地提升图书馆服务价值。但随着数字图书馆存储资源的迅速增多,尤其是数字化信息的迅速增长,不仅对图书馆数据处理能力提出考验,也增加了用户获取感兴趣资源的难度。图书馆要提高海量资源的处理效率,将适宜的阅读内容推送给用户,实现资源推荐与用户需求的匹配,还需要探索建立阅读推荐模型,进而保障数据处理与推送的可靠性。而用户画像作为当今研究的热点之一,是将抽象的用户数据转化为具象实体的技术,为图书馆预测用户需求,实现精准信息推荐提供了新思路。笔者认为,将用户画像与智能推荐技术引入数字图书馆服务中,可有效掌握用户多样化的需求,建立智能阅读推荐模式,以便更好地提升阅读推荐服务效益。
数字图书馆与传统图书馆的区别,就在于其能够突破时空限制,拓展资源存储空间,让用户足不出户就可以轻松获得即时信息。数字图书馆通过各种方式将阅读资源推荐给用户,并引导他们合理利用,就是阅读推荐[1]。在移动互联网环境下,数字化资源不断丰富,数字图书馆存储的资源更加多样,能够提供的服务内容也逐渐增多,如基于客户端、官网、微信等,向特定用户推荐阅读资源。数字图书馆阅读推荐属于主动服务,不需要用户自行检索,系统就可以直接将阅读资源推送至用户终端,通过智能代理方式减少信息冗余,提高服务水平,是当下流行的图书馆服务新模式。
图书馆用户来自各行各业,专业背景、工作经历与阅读需求均有很多的差别,这就需要对用户进行合理分类,将具有相同爱好的用户聚集起来,方便阅读资源的推送。网络环境下信息来源增多,图书馆用户更加希望获得个性化内容,希望接收到的推荐内容具有真实性、权威性、可靠性。同时相较于传统的短信服务方式,基于移动APP的信息推送更受用户青睐,也成为图书馆开展移动阅读服务的新方式[2]。此外,并非所有用户都希望经常接收图书馆的推荐内容,过多的信息推送反而会招致反感,这也提醒数字图书馆要考虑推送频率问题。
用户画像是以大量用户真实数据设计的目标用户模型,是以多种方式获得用户特征信息,将抽象的用户数据具象化的方法。互联网环境下每时每刻都在产生用户数据,采用数据挖掘、关联分析等技术,对用户标签进行描述与抽取,从行为习惯、社会属性等角度勾勒用户画像,本身也是给用户“贴标签”的过程。用户画像技术的应用,可以将用户的行为、特征与需求关联起来,让服务者将焦点放在目标用户的动机上,进而设计更有针对性的服务产品。用户画像在数字图书馆中的应用,将帮助馆员挖掘潜在用户,掌握用户偏好,结合不同群体的特点定制合理的资源,实现精准化信息推送。
推荐算法是建立推荐模型的基础,是数字图书馆保障阅读推荐可靠性、决定用户体验的重要方法。随着科学技术的进步,推荐算法的种类增多,成为实现个性化信息推送的关键,目前图书馆常用的推荐算法包括基于知识的推荐、基于内容的推荐、协同过滤推荐等。
数字图书馆引入基于知识的推荐算法,实质上是通过分析特定应用场景,对目标群体的特征进行提取,建立能够描述整个推荐场景,涵盖目标对象、关联规则与对应关系的知识领域。基于知识的推荐强调深入分析服务项目的特点,并非依赖用户行为数据捕获与计算分析,而是一种信息过滤机制,是引导用户主动发现候选项中潜在的感兴趣内容,然后将这些内容主动推送至用户终端的个性化方法。该算法包括基于约束规则和基于实体推荐两类,均需要引导目标群体发现需求,然后根据需求设计推送方案[3]。若系统在一定时间内不能给出解决方案,则用户可以修改或提出新请求,并由系统再次进行计算处理。
数字图书馆根据服务系统中既有的用户数据,找到与目标用户行为偏好对应的阅读资源,并主动推送给用户的方式,就是基于内容的推荐。这项技术是对信息过滤技术的拓展,涉及信息提取、过滤、文本处理等过程,以对服务项目的针对性分析制定推荐方案,不需要用户参与服务项目评价。基于内容的推荐融入了信息检索技术,在具体的服务场景中,数字图书馆选择的推荐项目,一般具有可以描述的属性,方便进行特征提取、相似度计算与关联分析。然后根据既往用户对项目的兴趣偏好,将感兴趣的用户提取出来,建立目标用户的兴趣模型,再通过该模型开展用户兴趣学习,以为不同的目标群体推送个性化的内容[4]。
协同过滤算法的应用较为广泛,是利用集体智慧处理问题的方法[5]。协同过滤算法的应用分为离线过滤与在线协同两部分,其中离线过滤是去除与目标用户无关的信息,在线协同是结合用户兴趣模型实现主动推荐。数字图书馆利用协同过滤算法,可以找出兴趣爱好、价值观知识水平相近的用户,即根据不同用户的相似性与差异性,将偏好相似的用户分为一类,以用户聚类的方式实现主动推送服务。在大数据密集型系统中,仅依靠既往用户数据进行分析,很难保障最终的推荐效果。为此可以采用基于模型的信息推荐方法,在用户数据挖掘和机器学习基础上,借助混合搜索算法、贝叶斯分类算法等实现用户聚类,然后推送该群体感兴趣的内容。
数字图书馆要保障阅读推荐效果,笔者认为首先要建立用户画像,深入分析具有相似需求的群体,由系统调取合适的信息,借助智能推荐算法、智能代理等技术,提供有针对性的服务内容,由此设计的智能阅读推荐模式如图1所示。
图1 数字图书馆基于用户画像的智能阅读推荐模式
数字图书馆用户需求是动态变化的,智能阅读推荐模型的设计,需要结合每个用户的特征,建立对应的用户画像。用户画像层包括用户基本信息、行为数据、标签体系等。建立用户画像是动态采集信息,逐步分析数据与完善模型的过程,目的在于精确掌握用户特点,为每个用户贴上特有的标签[6]。图书馆员首先要采集系统中的用户基本信息,包括姓名、年龄、职业、学科背景等,然后对用户的浏览历史、阅读资源类型等数据进行采集,通过数据分类、关联等处理,了解用户的资源检索利用偏好,以及不同用户之间的交互关系,勾勒出用户画像。此外,该层要设计静态与动态相结合的信息采集方式,实现对用户信息的全程跟踪,并将所有信息纳入用户数据库。
数字图书馆结合用户画像模型,深入分析用户的个性化需求,要利用数据挖掘、机器学习等技术,然后从馆藏资源库、专业数据库与网络平台中调取资源,筛选、匹配符合用户需求的阅读资源。在这个过程中智能代理发挥着重要作用,这是一种能够自动感知、学习与推理,基于知识库训练主动表现出目标驱动行为,自行选择合适的时机提供服务的技术。智能代理是阅读推荐系统体现智能化的关键,能够实现动态的信息推送[7]。数字图书馆借助智能代理技术,可以主动跟踪用户数据,分析不同群体的潜在需求,建立用户需求的动态模型,并从馆藏资源与网络资源中通过迅速筛选、过滤、分析、匹配,将个性化阅读内容推送至用户终端。智能代理采用与其他实体交互信息的方式,以学习经验与知识为依据,保障阅读推荐的连续性与准确性,让每个用户拥有定制服务内容,基本模式如图2所示。
图2 数字图书馆阅读推荐服务的智能代理模式
应用层提供了多种形式的系统对外接口,方便用户接受、检索和查阅推送信息。在获取用户请求后,智能代理模块将主动检索匹配资源,并传输至应用层形成推荐清单。数字图书馆对应用层的功能设计,要做到简单、易用、操作性强,保障资源分类的合理性,服务界面的清晰性,便于用户自行选择。除了为用户推荐阅读内容外,还需要记录用户的浏览、下载、检索等数据,并反馈至智能代理系统进行深层分析[8]。数字图书馆可以借助网页、移动APP、短信等方式传递信息,推送丰富的服务内容,如最新书目清单、馆内活动通知等,设计用户评论、荐读设置等模块,便于用户在线发表评论,分享经验,也便于用户对感兴趣的内容、资源类型、接受频率进行修改,满足他们的动态需求。
结合上述模式,数字图书馆提供智能阅读推荐服务,需要经历数据采集、资源匹配、个性化推荐3个阶段,每个阶段都需要采用适宜的技术、方法和手段,切实满足用户的个性化阅读需求。
在初始阶段,数字图书馆需借助智能阅读推荐系统,实现对用户特征信息的采集,对用户个体、用户群体、社会活动进行监测,从微观与宏观角度获得用户终端的场景信息。具体采集内容包括3个方面:一是以定时遍历的方式,在图书馆服务系统的空闲时段,对内网中的用户注册信息、图书借阅情况等静态数据进行采集,从中提取读者的特征信息;二是借助网络爬虫、网页抓取等技术,从图书馆官网、社交论坛等处,不定时采集用户数据,发现不同群体关注的热点内容;三是在图书馆服务系统更新时,主动对智能阅读推荐模型进行更新,并同步更新用户数据库。然后对用户数据进行梳理、分析,将多个异构数据源关联起来,建立可用的信息结构,将零散的数据连缀成用户场景信息,为智能推荐提供依据。
智能阅读推荐是以用户画像为基础,确保用户需求与阅读资源有效匹配的过程。在这个过程中,数字图书馆首先要进行读者群体聚类,根据用户信息采集结果,从读者年龄、专业背景、阅读偏好等角度,做好用户需求分类,并结合多方采集的用户详细信息,对用户需求细节进行勾勒。然后向数据库管理模块提出匹配请求,自动检索符合条件的资源,将异构数据处理结果变为推荐数据集。智能推荐模型也可以根据活跃度较高的群体需求,主动将匹配度高的阅读资源检索出来,或借助隐语义模型、协同过滤算法等,调取与用户需求匹配度高的资源。当某个用户产生阅读需求后,系统会根据采集信息建立临时的用户场景视图,主动实现数据库信息与用户需求的匹配,提高对用户需求的响应效率。
智能推荐模型在获得用户需求匹配数据集后,采用推荐式发布的方式,满足特定群体的需求。当用户登录数字图书馆后,该模型会自动以滚动播放、信息弹窗等方式,在线为他们推送感兴趣的内容。若用户未进入图书馆系统,则采用短信、新媒体平台、电子邮件推荐等方式。数字图书馆的阅读推荐,可采用本体概念来描述读者的特征,将需求相似的用户聚合起来,为他们推荐个性化内容。物联网、射频识别等技术的应用,让数字图书馆可以随时采集、感知用户信息,以后台分析的方式判断用户阅读偏好,为不同的群体标注对应的标签,由推荐系统实时提供移动阅读服务。例如,武汉大学图书馆建立“移动图书馆”,根据用户需求在线推送新书清单、优质书评等内容,读者只需登录手机客户端,就可以享受个性化推荐内容。沈阳工业大学设计基于用户画像的图书推荐APP,根据用户的阅读习惯进行数据挖掘,为他们推荐有价值的书籍。
随着信息技术的进步,数字图书馆得以不断普及与完善,存储的阅读资源日益丰富,为广大用户获取信息提供了便利。然而要想满足用户的个性化需求,数字图书馆必须准确把握用户特点,主动推送用户感兴趣的内容。数字图书馆有必要引入用户画像,确立科学的目标与规划,建立智能阅读推荐模型,结合多种推荐算法与智能技术,全方位提取用户特征信息,掌握用户需求动态变化,提高阅读推荐的资源匹配精准度。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!