当前位置:首页 期刊杂志

基于读者个性化特征的图书馆书目推荐

时间:2024-05-04

李萍 彭小华

摘 要: 采用协同过滤的图书馆书目推荐方法存在冷启动以及矩阵稀疏等问题,新书目未被读者评分或少量评分无法被推荐,存在推荐命中率低以及个性化服务差的缺陷。因此,提出基于读者个性化特征的图书馆书目推荐方法,设计基于读者个性化特征的数字图书馆书目推荐模型,给出图书馆书目个性化推荐流程,采集读者特征并分析读者行为后,塑造读者兴趣个性化特征,通过兴趣模型向读者推荐书目,塑造基于读者个性化特征的读者兴趣模型,基于显式信息和隐式信息对读者兴趣模型实时更新,进化读者个性化特征本体模型。分析基于读者个性化特征的图书馆书目推荐过程,个性化推荐业务实现过程。实验结果表明,所提方法可实现图书馆书目的个性化推荐,推荐准确率和效率较高。

关键词: 读者; 个性化特征; 图书馆书目; 协同过滤; 兴趣模型; 推荐业务

中图分类号: TN99?34; TP391 文献标识码: A 文章编号: 1004?373X(2018)17?0182?05

Abstract: The traditional library bibliographic recommendation method based on collaborative filtering has the problems of cold start and sparse matrix, low recommendation hit rate and poor personalized service because the new bibliography is not scored by readers or can′t be recommended with a small number of scores. Therefore, a library bibliographic recommendation method based on personalized feature of readers is proposed, a digital library bibliography recommendation model based on personalized feature of readers is designed, and the recommended procedure of library bibliographic recommendation is given. The reader feature is collected and the reader behavior is analyzed to construct the personalized features of interest of readers. The interest model is used to recommend books to readers, and the readers′ interest model based on personalized feature of readers is constructed. On the basis of explicit information and implicit information, the readers′ interest model is updated in real time to improve the ontology model of users′ personalized feature. The library bibliographic recommendation process based on personalized feature of users and implementation process of personalized recommendation business are analyzed. The experimental results show that the proposed method can realize the personalized recommendation of library bibliography, and has high recommendation accuracy and efficiency.

Keywords: reader; personalized feature; library bibliography; collaborative filtering; interest model; recommendation business

0 引 言

数字图书馆是整合线上以及线下图书资源的重要手段,其通过分布式网络以及数据挖掘等手段,向读者提供可靠的信息服务。由于图书馆系统的文献资源量不断提升,采用有效的图书馆数码推荐方法,协助读者准确挖掘出感兴趣的图书书目成为研究的重点方向[1]。采用协同过滤的图书馆书目推荐方法存在冷启动以及矩阵稀疏等问题;新书目未被读者评分或少量评分无法被推荐,存在推荐命中率低以及个性化服务差的缺陷。个性化图书馆书目推荐方法全面分析了读者以前个体或同其相似的读者群体的偏好,协助读者从海量图书资源中获取感兴趣的资源,并将资源推荐给读者,为读者提供主动且多样化的信息服务。因此,提出基于读者个性化特征的图书馆书目推荐方法,提高图书馆书目推荐命中率和效率,实现图书资源的个性化推荐。

1 基于读者个性化特征的图书馆书目推荐方法

1.1 基于读者个性化特征的图书馆书目推荐模型

将读者个性化特征本体融入图书馆书目推荐模型中,塑造基于读者个性化特征的图书馆书目推荐模型,如图1所示。为了让资源在结构化表示中获取语义关联,应使用读者个性化特征本体描述资源。协同与内容过滤推荐是个性化推薦模型的中心特征,本体概念针对读者评价矩阵中评价信息项目进行更新,其增强的个性化推荐性能表现为可以完全运用读者偏好与本体概念语义相关联[2]。

读者在登录以后,根据注册读者标识可以得到预设个性化数据和初始模型读者注册基础数据。为了取得让读者满意的推荐列表,可利用读者兴趣模型中推荐算法和相关信息处理收集到用户的兴趣概念集。读者兴趣模型的关键标志是:资源项目在读者对系统进行评论、浏览、下载时实施信息互换,利用此互换信息进一步评估、分析获得读者感兴趣的访问资源,从中了解评测出读者项目评价矩阵。以此评价矩阵为核心,反映领域本体概念,产生读者兴趣本体,概念间关系可运用统一领域本体查询,如此即可最大化减少系统消耗,降低多余数据,而且在某种角度确保了模型中概念间关系的相似性,也使读者兴趣模型的实时更新更为便捷。已知兴趣概念后,兴趣概念相似度就可以利用传统推荐算法计算,并从中获取读者关联紧密兴趣概念进而整合为概念推荐集[3]。最后为了得到興趣概念对应资源,经过数字图书馆资源库查询并总结生成读者个性化推荐列表反馈于读者。

1.2 图书馆书目个性化推荐流程

综合图1推荐模型,可看出依据读者个性化特征本体数字图书馆的个性化推荐流程为:

1) 采用OWL本体描述语言和本体构建工具Protégé按照资源特点、构建方式打造与其资源相配的领域本体。

2) 读者的行为分辨和特征提取。注册的读者系统会按照读者的注册信息和系统浏览的自动记录、下载过程等实施剖析归纳,总结读者的兴趣特点和浏览资源的侧重点;而未注册的读者,因为缺少从前的历史数据和基础信息,系统只能按照读者目前的浏览记录来剖析读者的兴趣度[4]。

3) 读者兴趣本体的构建。领域本体的概念应在观察读者行为和取得读者兴趣特征之后进行。利用对读者兴趣特征的辨别,领域本体中相呼应的概念也被弱化,保留上下位和同位这种普遍的关系,应用系列评价值描述兴趣概念,读者兴趣模型推荐的依据是读者兴趣本体的形成。复杂语义可利用查询领域本体获取,这样可以减少系统消耗,使读者兴趣概念和领域本体概念保持更加稳定的相似性。

4) 向读者推荐时使用兴趣模型。读者兴趣本体被取得时,把读者间的关系和读者感兴趣的概念编辑成读者兴趣概念矩阵,读者兴趣模型便可以构建出来,图2为其详细过程。通过该过程辨析兴趣概念评价矩阵,采用过滤推荐算法计算出读者兴趣概念评价矩阵的相仿程度,收集不同读者对概念间喜爱的一致性,从中获取与读者联系最密切的兴趣项,获取读者兴趣推荐集。为收集读者个性化推荐列表,还需要经过数字图书馆资源查询,才能找出哪种是读者常用的资源,并将资源反馈给读者。

5) 进化读者个性化特征本体模型。因为读者的兴趣是时刻变换的,读者兴趣模型必然依照兴趣的改变而变化,这样模型才能更好地与读者的真实爱好吻合,以便于更加精准确切地为读者实施个性化推荐。有两种稳妥信息源可以指导模型更新[5]:第一种显式信息(由读者主动提供);第二种是隐式信息(由读者动作辨识得到)。以上信息是模型进化的基础数据,能让更新后的模型对读者的喜爱有更准确的认识,读者当前的喜爱是读者兴趣模型更新的关键[6]。

1.3 个性化图书馆书目推荐方法

采用如下方法实现图书馆书目的推荐,推荐过程如图3所示。

读者的查询和借阅爱好是图书馆书目推荐的基础信息,个性化图书馆书目推荐方法过程是:

1) 取得读者查询[Q],读者进入后输入寻找[Q],当[Q]={([c1],[q1]),([c2,q2]),…,([cn,qn])}即需要类别[ci]和需求值[qi]是查询中读者确定的;

2) 读者访问整理,整理改正模块加载读者访问[Q],形成整理目录[Qi]且暂时保存;

3) 寻找读者满意的访问资源。依照[Qi]里元素的不同特点和各元素间的线索联系,把访问目标[Qi]变成与之关联的SPARQL语句[Qsparql]满足条件的资源集合[LR=][{lr1,lr2,…,lrn}];

4) 读者个性化特点的取得。登录借阅者本体中目前的读者实例[Icurrent]相对的借阅爱好信息集合[UP=up1,up2,…,upn];

5) 个性化过滤条件的取得。推理作业的进行是目前读者本体实例[Icurrent]和推理规则[R]的结合。把读者借阅喜好变换成图书馆馆藏资源特征集[LRF=]

6) 在馆藏资源寻找符合个性化特征资源。用LRF做过滤,对LR实施进一步选择,直到最后检验结果为[LR=][lr′1,lr′2,…,lr′n];

7) 排序结论。

对目前读者的满意度用复检结果[LR]中的各个资源进行计算,结果用总权重[C]表示:

式中:[wij]代表读者阅读喜好;[upi]表示和馆藏资源特征[lrfj]相似度,某列条文生效后的影响系数默认值为[1;kij],[0

以上过程中,两个部分形成了最后的推荐结果列表,当[LR?LR],结果列表的开始环节(即[LR]环节)要经历排序处理的审核报告,余下是被第一次检验个性化部分过滤掉的环节。剩下环节的结束可以利用统计借阅次数(TotalNOL)和读者评价(Rate)实施排列,各个资源的分值用[S]代表,依据降序顺序回溯。[S]计算公式为:

1.4 个性化推荐业务实现

本文基于读者个性化特征的图书馆书目推荐方法,其推荐主体为读者,根据读者的喜好变化,对其推荐不同类型的书目。读者的个人喜好评价指标包括性别、年龄、学历和职业等,读者将各种评价指标的特征值填写在读者个性化特征的图书馆书目推荐平台上[7],可实时查看图书馆书目推荐结果。图书馆书目推荐业务采用本体概念对读者阅读喜好进行描述,利用本文方法进行相似度计算,按此结果向读者推荐其最感兴趣的书目。图4为向读者个性化特征推荐书目的应用层读者推荐业务时序图[8]。

2 实验结果与分析

实验从本文方法推荐的图书馆书目质量的好坏和推荐结果的准确度来判断本文方法的有效性。图书馆书目推荐的标准包括决策支持精度测量和统计精度测量两种。决策支持精度测量对图书馆书目推荐质量的评价标准有查准率和查全率;统计精度测量常采用平均绝对偏差算法(MAE)对本文方法推荐书目结果精度进行评价[9]。

本文方法对读者推荐的书目列表中使读者满意的书目用查准率表示;查全率可以衡量书目推荐列表中使读者满意的书目在测试集中占该读者所有满意的书目的比例。查准率和查全率的计算公式为:

式中:ret表示经过训练后估计出的目标读者满意的书目列表;rel为向读者推荐的读者真实喜好的书目;[ret?rel]为目标读者估计的读者真实喜好的书目的集合。

图书馆推荐书目精度评价中采用的平均绝对偏差是计算测量值与算术平均值偏差的绝对值的平均数。将这种精度评价算法应用于图书馆推荐书目质量评价中,对估计的读者评分结果与实际读者的评分结果进行偏差程度计算,得出结果的数值越小说明本文方法推荐的书目推荐精度较高。将估计的目标读者评分结果设为[p1,p2,…,pn],实际目标读者的评分结果为[q1,q2,…,qn],对目标读者实施估计评分的书目数量为[N],式(5)为平均绝对偏差的定义公式:

实验利用Matlab 7.0编程对本文方法和传统协同过滤推荐方法进行实验仿真,将仿真结果进行对比分析。实验为验证本文方法和传统协同过滤方法对读者个性化特征的图书馆书目推荐效果,对实验数据进行划分。将评分次数不超过300的读者作为实验研究对象;将30位读者分为一群,每位读者属于读者群的标准由评分项目数进行判决,该评分项目数不超过[30n]([n]=1,2,…,10);在选定的10个读者群中随机选取5名读者,比较两种方法对他们推荐书目的质量。

实验采用5折交叉验证的方法对读者数据实施处理操作。该操作过程将读者数据集随机地划分成5份,依次选取4份当作训练数据,另外一份为测试数据,据此操作进行数据处理,目的是增强图书馆书目的推荐质量。对属于某一读者群中的读者来说,通过5折交叉法向该读者进行5次图书馆书目推荐,取5次推荐结果的平均值作为最终的推荐结果。以此类推得到该读者群中其他读者的图书馆书目推荐结果,求该读者群中所有读者的图书馆书目推荐结果的平均值。实验中本文方法和传统协同过滤方法分别利用5折交叉验证的方法对读者群的图书馆书目推荐结果的平均值进行求解[10]。實验分析两种方法在平均绝对误差、查准率和查全率三个图书馆书目推荐评价指标的实验仿真结果,表1为两种方法的实验结果数据表。

从图5可以得出,本文方法相比传统的协同过滤推荐方法,在图书馆书目推荐上的质量较好。从图5中可以明显看出,本文方法的平均绝对误差结果比传统协同过滤方法小,传统协同过滤方法的MAE曲线远远高于本文方法。MAE值越小说明推荐的书目推荐精度较高,在特定评价读者集合较小的情况下MAE曲线的差别更大。

从图6和图7两种方法的查准率和查全率对比结果可以看出,本文方法的查准率和查全率均优于传统协同过滤方法。从图6可以明显看出两种方法在随着特定读者评价集合增大的过程中,查准率均逐渐提高,且本文方法的查准率始终高于传统协同过滤方法;从图7中可以看出,两种方法随着特定读者评价集合的不断增大,查全率的变化比较平稳,但本文方法的查全率曲线始终明显高于传统协同过滤方法,说明本文方法在进行图书馆书目推荐过程中的推荐效果较高。

3 结 论

本文提出基于读者个性化特征的图书馆书目推荐方法。在采集读者特征并分析读者行为后,塑造读者兴趣个性化特征,通过兴趣模型向读者推荐书目,同时构建了基于读者个性化特征的读者兴趣模型,对读者个性化特征实时更新,提高图书馆书目推荐的个性化以及效率。

参考文献

[1] 蔡宝家.读者代购:基于PDA的图书馆个性化服务[J].现代情报,2014,34(10):149?152.

CAI Baojia. Reader purchase: a personalized service of library based on PDA [J]. Modern information, 2014, 34(10): 149?152.

[2] 陈臣.图书馆个性化智慧服务体系的构建[J].图书馆建设,2014(11):37?40.

CHEN Chen. Construction of the personalized intelligence service system of the library [J]. Library development, 2014(11): 37?40.

[3] 郑祥云,陈志刚,黄瑞,等.基于主题模型的个性化图书推荐算法[J].计算机应用,2015,35(9):2569?2573.

ZHENG Xiangyun, CHEN Zhigang, HUANG Rui, et al. Perso?nalized book recommendation algorithm based on topic model [J]. Journal of computer applications, 2015, 35(9): 2569?2573.

[4] 琚春华,裘月.一种融入个体人格特质的混合图书推荐方法[J].情报学报,2015,34(2):164?175.

JU Chunhua, QIU Yue. A hybrid method for books recommendation involving individual personality traits [J]. Journal of the China society for scientific and technical information, 2015, 34(2): 164?175.

[5] 马晓亭.大数据时代图书馆个性化服务读者隐私保护研究[J].图书馆论坛,2014,34(2):84?89.

MA Xiaoting. Study on user privacy protection for library personalized service in big data era [J]. Library tribune, 2014, 34(2): 84?89.

[6] 李默,梁永全.基于标签和关联规则挖掘的图书组合推荐系统模型研究[J].计算机应用研究,2014,31(8):2390?2393.

LI Mo, LIANG Yongquan. Research of hybrid recommendation system model based on tags and association rules mining for books [J]. Application research of computers, 2014, 31(8): 2390?2393.

[7] 张闪闪,黄鹏.高校图书馆图书推荐系统中的稀疏性问题实证探析[J].大学图书馆学报,2014,32(6):47?53.

ZHANG Shanshan, HUANG Peng. Empirical study on sparsity of university libraries [J]. Journal of academic libraries, 2014, 32(6): 47?53.

[8] 宋楚平.一种改进的协同过滤方法在高校图书馆图书推荐中的应用[J].图书情报工作,2016,60(24):86?91.

SONG Chuping. Application of an improved collaborative filte?ring method on recommending books in college libraries [J]. Library and information service, 2016, 60(24): 86?91.

[9] 程远.公共图书馆展览服务中嵌入图书推荐的实践探索:以江西省图书馆为例[J].国家图书馆学刊,2015,24(5):110?112.

CHENG Yuan. Exploration on the mode of recommendation on books embedded in exhibition services in public libraries: taking Jiangxi Library as an example [J]. Journal of the national library of China, 2015, 24(5): 110?112.

[10] 郭明环,张峰,焦娜.新凯恩斯理论在高校图书馆图书资源配置效益中的应用:以西安科技大学图书馆为例[J].西安科技大学学报,2016,36(2):296?300.

GUO Minghuan, ZHANG Feng, JIAO Na. Application of the new Keynes theory in university library book resource distribution efficiency: taking Xian University of Science and Technology Library as an example [J]. Journal of Xian University of Science and Technology, 2016, 36(2): 296?300.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!