当前位置:首页 期刊杂志

一种基于用户动态社交网络的协同过滤推荐方法

时间:2024-05-04

彭玉

摘要:电子商务推荐系统的发展与数据稀疏性,冷启动,可扩展性和隐私保护的研究密切相关,尽管許多研究人员提出了不同的改进推荐算法来解决这些问题,但仍有很大的提升空间。在复杂的社交网络中,我们可以充分利用用户的动态信息偏好,社会关系和历史记录信息来改善推荐系统的性能。基于此,本文提出了一种基于用户动态社交网络信息的新型推荐算法,解决了传统协同过滤算法中的冷启动问题,同时,由于考虑了用户偏好随时间的动态变化因素,改进的推荐方法准确度大大提高。

关键词:协同过滤;动态社交网络;相似度;兴趣模式

中图分类号:TP39 文献标识码:A 文章编号:1009-3044(2019)04-0250-03

Abstract: The development of e-commerce recommendation systems is closely related to the research on data sparsity, cold start, scalability and privacy protection. Although many researchers have proposed different improved recommendation algorithms to solve these problems, there is still much room for improvement. In complex social networks, we can make full use of users' dynamic information hobbies, social relations and historical records to improve the performance of the recommendation system. This paper proposes a new recommendation algorithm based on user dynamic social network information, which solves the problem of cold start in the traditional coordinated filtering algorithm. At the same time, since the dynamic change factor of attenuation of user preference information over time is also added to the recommendation algorithm, the recommendation accuracy of the recommendation system is greatly improved.

Key words:Collaborative filtering; Dynamic social network; Similarity;Interest mode

1 引言

Facebook,Twitter和新浪微博等社交网站已成为互联网用户不可或缺的在线社交平台。同时,社交网络也是用户共享信息和获取信息的重要途径。然而,社交网络信息数量的爆炸性增长加剧了信息过载问题,用户将大大增加获取有用信息的成本。推荐系统作为一种有效缓解信息过载问题的技术,已大量引入电子商务社交平台,可为用户提供高质量的个性化推荐服务[1]。

协同过滤推荐算法基于用户或项目之间的偏好相似度来预测推荐结果。传统协同过滤算法的缺陷是它没有反映用户的偏好的动态变化特征[2,3],它也没有把用户的情境因素考虑进去。因此,传统的协同过滤算法存在一定的缺陷,导致推荐精度下降。在本文中,我们提出了一种基于用户动态社交网络信息的改进推荐算法,通过考虑复杂社交网络中用户响应的动态信息和时间因素来反映用户的动态偏好功能。由于考虑了用户偏好信息随时间的动态衰减变化,大大提高了推荐系统的推荐精度。

2 传统协同过滤算法

目前,在移动电商平台智能推荐系统中采用最广泛的是协同过滤推荐技术,根据邻居用户的喜爱项目向目标用户作推荐,在协同过滤推荐中提取用户偏好数据和用户间相似度计算成为推荐算法的关键技术。协同过滤推荐算法的主要步骤分为:(1)建立用户数据模型;(2)用户偏好相似测度的计算;(3)近邻用户的选择;(4)产生预测,最终选择预测分数最高的[n]个项目作为推荐项目反馈给目标用户。

3 基于用户动态社交网络的协同过滤推荐方法

3.1 社交网络用户的动态兴趣模型

传统的协同过滤推荐算法没有考虑到社交用户的上下文情境和用户的动态兴趣模式,所以在改进的推荐方法中我们假定用户的兴趣随时间变化是一个单调递减函数,可以划分用户的对不同时间段的更多细节的动态兴趣并构造相应的时间权重函数,所以本文定义时间权重函数传统的协同过滤推荐算法没有考虑到社交用户的上下文情境和用户的动态兴趣模式,所以在改进的推荐方法中我们假定用户的兴趣随时间变化是一个单调递减函数,可以划分用户的对不同时间段的更多细节的动态兴趣并构造相应的时间权重函数,所以本文定义时间权重函数[f(t)]来代表用户的动态兴趣随时间的变化因子,然后结合该函数因子来改良协同过滤算法的相似性度量。

3.2 基于社交网络用户动态偏好信息的相似性计算

4 实验结果

为了验证新提出的基于用户动态复杂社交网络信息的推荐算法比传统基于用户的协同过滤推荐算法具有更好的推荐性能,我们收集了国内主流的社交网站新浪微博的相关信息数据来完成本文的实验测试。从新浪微博中抓取出包含6040个用户的大约3682条微博信息以及100000个响应日志信息。由于在新浪微博的场景中,消极的响应信息很难被定义,所以我们认为用户对于浏览了的微博信息不转发,没有评论等等通常表示用户对此信息不感兴趣。所以本文将相似度调节因子[θ]设定为1,只考虑社交用户积极的响应信息。我们认为用户收集、转发和评论微博信息的行为为正面响应行为[4]。

对于现有的数据集,数据集是平分的,通过随机选择分成10个子集,其中9个被随机选为训练集,其余一个被选作测试集。参数[?]为用户兴趣偏好值随时间的动态衰减率调节因子,其表征动态的用户兴趣,得到最优化的价值参数[?]对最终的推荐结果影响很大。所以在本实验中我们通过调节参数[?]的取值来比较推荐算法的推荐性能以期得到最佳的参数值。我们使用平均值绝对偏差MAE [5,6]作为评估指标评估推荐算法的性能,MAE越低,推荐精度越高,推荐结果就越准确。参数[?]我们取值从0.8到2.2,每次增加0.1,实验结果如图1所示。

从图1中可以看出,衰减率最好参数[?]的取值为1.7。但是参数[?]的最优值可能是与此值不同,应该根据具体环境因素进行调整你的参数[?]的取值。主要影响推荐算法的性能因素是数据集的特征。

一旦我们确定了参数[?]的取值问题,我们再将本文改进的算法推荐精度和传统的基于用户的协同过滤推荐算法在推荐精度方面做对比。基于用户的协同过滤算法是经典的和最成功的推荐算法之一, 如此比較的基础上,会有一定的说服力。在下面的实验中,数据集也是一样的通过随机选择分成10个相等的子集,随机选取了9个作为训练集,选择剩下的一个作为测试集。我们可以通过改变最近邻居的数量来对比两种算法在推荐精度方面的表现,最近邻居的数量取值从6到24,每次增加3 。实验结果如图2所示。

从图2中可以看出,在相同最近邻居数目下,改进的算法性能优于传统基于用户的协同过滤推荐算法,有相对较低的MAE值。同时也发现随着最近的邻居数量的增加,推荐算法能得到更好的推荐精度, 即MAE的值呈下降趋势,但不是无限的下降,它会随着邻居数量的继续增加趋于一种稳定的状态。

5 结论

本文介绍了社交平台协同过滤推荐算法的基本原理,协同过滤推荐算法是一种广泛应用于电商推荐领域较为成熟的算法,并且有较好的推荐效果。然而,协同过滤推荐算法在某些方面有缺陷,例如,传统的协同过滤算法没有考虑到用户兴趣特征的时效性,所以会失去一部分的推荐准确性和多样性。同时,随着社会社交网络的兴起,社交网络用户激增,网站用户面临社会信息超载的问题。由于社交用户包含丰富的上下文信息,所以本文采用社交用户的动态兴趣偏好来改进基于用户的协同过滤算法来进一步提升推荐效果。最后通过对比实验验证新的改进算法提高了推荐精度。但是,社交网络用户的动态信息不仅仅是响应信息和时间因素,也有地理信息,社会关系信息,和其他上下文信息,未来我们将探索应用其他上下文信息来不断优化提出的改良算法。将来的研究工作也会尝试如何更好地塑造社会用户动态的工作信息,深入挖掘用户的行为模式,将其组合成更优的推荐算法,并将推荐算法应用到更广泛的电商平台。

参考文献:

[1] 邓爱林.电子商务推荐系统关键技术研究[D].上海:复旦大学,2003.

[2] B. Sarwar, G. Karypis, J. Konstan et al., Item-based collaborative filtering recommendation algorithms[C]. in Proceedings of the 10th International World Wide Web Conference, pp. 285–295,New York, NY, USA, 2001.

[3] Herlocker J. Konstan J A, Riedl J. An empirical analysis of design choices in neighborhood-based collaborative filtering algorithms[J].Information Retrieval, 2002, 5(4): 287-310.

[4] S.H.M. Qing Li, Byeong Man Kim, A probabilistic music recommender considering user opinions and audio features[J].Inf. Process, Manage, 2007:134-152.

[5] L.Wang and J. Zhai Z. Collaborative filtering algorithm based on time weight[J]. Journal of Computer Applications, vol. 27(9),2007: 2302–2303.

[6] K. Kwon, J. Cho and Y. Park.Multidimensional credibility model for neighbor selection in collaborative recommendation[J]. Expert System with Applications, 2009,36(3):7114-7122.

【通联编辑:梁书】

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!