当前位置:首页 期刊杂志

基于协同过滤的影视营销推荐算法研究

时间:2024-04-24

阳甫军 李博

摘 要:随着三网融合的不断发展,传统广电媒体更需要建立一套完善的影视营销推荐系统,将海量的影视资源精准有效的推荐给每一位用户。在推荐系统中,协同过滤算法是应用较为广泛的一种推荐方法。讨论了传统协同过滤算法在影视营销中的应用,提出一种加权混合推荐算法,并将算法应用在影视营销推荐场景中,推荐算法的精准度得到了一定提升。

关键词:协同过滤;推荐算法;皮尔逊相似度

中图分类号:F27     文献标识码:A      doi:10.19311/j.cnki.1672-3198.2019.17.024

随着互联网技术的不断发展,三网融合为传统广播电视媒介带来了新的发展机遇。影视行业也受到大众的关注和喜爱,海量的影视资源爆炸性增长。传统广电媒体更需要建立合理的推荐系统,将海量的影视资源精准的推荐给用户,用户也能在平台上快速找到自己喜欢的电影,提高用户对广电媒体平台的依懒性,最终使得个性化的影视产品营销服务成为现实。

本文的主要工作是建立用户影视评价体系、得到用户与影视产品的评价矩阵,结合协同过滤的个性化推荐思想,综合考虑推荐系统中的矩阵稀疏性问题、冷启动问题,对协同过滤算法进行改进,设计出一种混合推荐算法,并运用到实际推荐系统中,提高个性化影视资源推荐的精准度。

1 数据分析

本文的影视产品数据包含561288条用户收视信息数据,这些数据来自1329位用户和41876部影视。本文对这些数据进行数据清洗、数据规约之后,得到了部分用户收视信息情况如图1。

2 构建用户影视评价体系

本系统采用隐式评分的方式构建评价体系,即根据用户的收视行为数据进行模型构建,具体模型如下:

其中,Spij表示用户i第p次观看影视产品j的时长,λ表示用户i观看影视产品j的总次数。Tj表示影视产品j的总时长。ξij表示最终评分,式(3)表示将得到的ξij进行标准化处理。

同时,将隐式评分的等级分为5个等级,具体如表1所示。

根据上述的隐式评价模型,我们可以得到一个关于用户与影视作品的评价矩阵,其散点图如图2所示。

3 协同过滤算法设计

协同过滤算法又称社会过滤,其在不同的场景具有不同的运用,故算法种类较多。而在实践中较为广泛利用的协同过滤推荐算法主要有两种,下文将具体分析。

3.1 基于内存的协同过滤算法

基于内存的协同过滤算法第一步是计算用户之间的相似度,相似度可以衡量两个用户对影视作品之间的兴趣程度。常用的相似性度量标准有余弦相似度、改进余弦相似度、皮尔逊相似度。其中ξi表示用户对所有影视作品j的评分均值,ξi,j表示用户i对影视作品j的评分值, Sik=Si∩Sk表示用户i和用户k都评价过的电影集合。其公式分别如下:

然后,将最大目标用户相似度的用户作为最邻近用户集合,邻居用户对目标影视作品未评分的进行预测评分。采用中心加权平均方法来计算目标用户i对影视作品j的預测评分,评分r^i,j可表示为:

最后,根据评分高低得到推荐结果,基于内存的协同过滤算法流程图如图3。

3.2 基于模型的协同过滤算法

基于模型的协同过滤算法在实践中运用广泛,它可以通过矩阵分解、关联算法、神经网络、聚类算法等方法来进行实现。本文综合考虑用户与影视作品数据的稀疏性、算法的计算效率、影视作品冷启动等问题,采用矩阵分解方法(SVD)完成协同过滤算法。

因此,需要将误差平方和SSE降到最小即可。在本文推荐系统中,为了P和Q中所有值都全部更新,故选取常用的梯度下降法对其进行训练。

3.3 混合推荐算法

上述两种推荐算法都各自具有优缺点,但在实际过程中,不同的推荐算法往往适用于不同的场景,采用混合推荐算法更加精准。为了发挥不同推荐算法的优缺点,本文将上述两种算法组合,对其推荐结果进行线性加权平均得到最终推荐结果,公式如下:

4 结果对比

4.1 评价标准

均方根误差是衡量结果精准度的常用评价标准之一,其通过计算实际值与预测评值之间的误差来判断推荐结果的精准度。在本文场景中,RMSE (均方根误差)公式见式(13)。均方根误差越小,推荐系统的精准度越高。

4.2 评价分析

本文随机采取5组评分数据对以上3种方法推荐结果精准度检验,将方法一记作UB- CF,方法二记作SVD,混合推荐算法记作P-CF。三种推荐算法最终实验结果如图4。

由图可以看出,随着测试次数的增加,混合推荐算法精准度更高。

5 结论

本文首先构建了用户隐式评分模型,对于基于内存、模型两种协同过滤算法进行了讨论。针对这两种算法的不足,提出了一种加权混合推荐算法,通过最后结果分析,混合推荐算法提高了算法的精准度和可适应性,更能满足广电媒体的个性化推荐影视作品的要求。

参考文献

[1]刘青文.基于协同过滤的推荐算法研究[D].北京:中国科学技术大学,2013.

[2]尹航,常桂然,王兴伟.采用聚类算法优化的K近邻协同过滤算法[J].小型微型计算机系统,2013,34(4):806-809.

[3]顾军华,官磊,张建.基于Hadoop的IPTV隐式评分模型[J].计算机应用,2017,(11):156-161.

[4]刘文佳,张骏.改进的协同过滤算法在电影推荐系统中的应用[J].现代商贸工业,2018,39(17):63-66.

[5]杨文娟,金子馨.基于聚类的协同过滤算法的研究[J].电脑知识与技术,2018,14(16):190-193.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!