基于情感的混合推荐模型

时间：2024-06-19

杨静

（天津现代职业技术学院，天津 300350）

基于情感的混合推荐模型

杨静

（天津现代职业技术学院，天津 300350）

情感因素对于顾客购买行为有很大的影响，本文使用传统的基于内容的推荐算法与协同过滤算法相结合，在此基础上引入基于情感的推荐算法，通过计算顾客对于商品的情感分值，作为推荐主要依据，通过行实验评估，对推荐的准确性和稳定性都有较大的提升。

电子商务；协同过滤；基于内容的推荐；基于情感的推荐

图1 混合推荐模型流程

一、引言

时至今日，电子商务的发展已经深刻地改变着人们的生活和社会节奏，面对几何级数增长的电子商务信息，顾客在购买决策和寻找商品时需要花费的时间和经理也随之增加。为了解决上述问题，绝大多数电子商务平台都不同程度地使用推荐技术，通过分析顾客行为推测顾客喜好，进行主动推荐，提高顾客满意度的同时也提高了销售量。目前应用较多的推荐技术有：

基于内容的推荐方法，为每个顾客建立兴趣模型，根据顾客以往的购买历史和访问数据，提取顾客的兴趣特征集合，形成顾客的偏好模型。该方法的简单、高效，但难以区分和拓展兴趣资源。

协同过滤应用较普遍的方法，通过将兴趣相同的顾客作为一类，据此推测某顾客对某商品的兴趣。该方法适用性较强，但不适用于样本很少或者样本急剧增加的情况。

研究表明，在诸多推荐方法中，往往都忽略了推荐系统与人在交流中最关键的“情感智能”因素。特别是对于特定的商品，如音乐、电影，情感因素对推荐往往起决定性作用，这就要求推荐系统要能够更加主动地适应顾客的情感需要。为此，推荐系统必须能够识别顾客情感并据此作出正确、及时的推荐。目前，对于情感信息关注和研究越来越多，但多围绕语音信号处理。本文将该方法引入电子商务推荐过程中，从而解决常用方法存在的问题。

二、混合推荐模型简介

整个推荐过程分为三个阶段，即基于内容的推荐、基于情感的推荐和协同过滤推荐，其基本流程是：首先将顾客当前访问序列、顾客购物历史数据以及Web日志等信息进行预先处理，计算出未评价商品和已评价商品的相似度，然后基于内容进行过滤；再依据数据库中商品数据和顾客兴趣值，计算出顾客的情感分值和商品拥有的情感类别，实施推荐；最后根据顾客兴趣特征、顾客评分数据以及访问序列等信息，基于协同过滤进行推荐；然后、对商品信息库中的商品，与混合推荐算法推荐结果进行相似度计算，产生N个推荐访问结果推荐给顾客，并获得顾客对推荐结果满意情况的反馈信息，然后对模型进行自适应调整，以获得最好的推荐效果。基本流程如图1所示。下面介绍各模块的工作原理。

（一）基于内容的推荐模块

基于内容的推荐算法，使用特征属性定义商品对象，通过将顾客对于商品对象的评价做依据，进行推荐。因此该算法可以针对稀疏状况下的商品进行推荐。首先，计算数据库中各商品之间相似度及喜爱的商品，使用公式（1）：

（1）

其中，P代表数据库中的某商品；A为已被某些顾客评价为喜爱的商品；n代表与商品所属类别对应的商品属性的个数；wi代表上述各属性的权重值；mi代表该商品P第i个属性的值；αi表示喜爱商品A的第i个属性值。

（二）基于情感的推荐模块

情感作为人和人之间交流所使用的信息，是由主观思想和客观事件引发的行为变化、生理变化以及主观体验。不同类型的情感可以引起不同的行为，情感的变化也会引起带来行为的变化。因此，在关注顾客行为的推荐系统，关于顾客情感和情感信息处理技术的研究也应该受到人们的关注和重视。

表1 情感分类表

商品可以带给顾客的情感多种多样，以电影为例，它可以带给观影者快乐和满足，同时也可以带来恐怖和悲伤。而无论情感的类型如何，都会成为顾客选择某种商品的直接或间接原因。这里，将影响顾客选择商品的情感分为积极和消极两大类，如表1所示：

针对上述情感将对顾客产生不同的行为影响，基于情感的推荐过程是相当重要的，该模块通过计算顾客偏好和商品情感之间的不同，达到准确推荐的目的。

（2）

其中，Si代表顾客对第i种感情ei的评分；ni-favored代表在顾客喜欢的商品中，第i种感情ei出现的次数；Nfavored代表顾客喜欢的商品的数量；相应地，ni-disfavored代表在顾客喜欢的商品种第i种感情ei出现的次数；Ndisfavored则代表顾客不喜欢的商品的总数量。则有：

（3）

其中，p（ej）代表拥有第j类情感的商品数量；p代表积极情感的平均值；q代表消极情感的平均值；ei代表顾客喜欢和不喜欢的情感；ej代表商品所包含的情感类型。则有：

（4）

其中Pi代表商品i的得分；n代表商品中包含的情感类型的数量。则Pi就是该模块推荐的依据，将Pi按降序排列进行推荐。这里，为了说明模块的工作原理，如图2所示，以某一顾客U1为例，说明了该推荐模块的推荐过程：

（三）协同过滤推荐模块

为顾客能找到更多的可能感兴趣的商品，要依据其他顾客提供的意见进行推荐。为了达到上述目的，这里使用协同过滤算法，必须计算出顾客真实兴趣和依据同类顾客兴趣判断出来的可能感兴趣的商品之间的差值。算法如下

输入：商品问卷中的顾客兴趣（包括顾客和某一其他顾客的选择）

输出：差值[-100,100]

变量：

图2 基于情感推荐模块示例

U1[i,0],U2[i,0]：第i个商品的选择，如喜欢（yes），不喜欢（no），空（neutral）

U1[i,1],...,U1[i,5]：顾客选择某商品的5个原因

U2[i,1],...,U2[i,5]：某一其他顾客选择某商品的5个原因

P：积极的奖励或消极的惩罚

D：对于同一商品，两个不同顾客的差值

S：差值之和

Collaboration-based（U1,U2）

S=0

forifrom1to20

P=-1

ifU1[i,0]=U2[i,0]then

P=1

end

forjfrom1to20then

ifU1[i,j]=U2[i,j]then

D=D+1

end

S=S+（D×P）

Collaboration-based（U1,U2）=S

三、实验及评价

（一）实验数据

采用MovieLens站点提供的数据集（http://www.grouplens.org/node/73）。MovieLens是一个基于Web的电影推荐系统，可做研究使用。该版本中包括1682部电影、943个顾客、以及100000条以上的评分记录。混合推荐模型的原理是首先计算各商品之间相似度及喜爱的商品，然后针对顾客偏好与商品情感进行对比，再进行过滤作为推荐依据。而MovieLens的数据主要是针对推荐电影的评分作为顾客喜好的反映，它依据电影的内容以及拍摄手法和年代，将电影分为浪漫、动作、喜剧、冒险、科技、幻想、战争、音乐、纪录、儿童等类型作为属性。

评分值采用5分制，分别是1-讨厌（Awful）、2-差点（FairlyBad）、3-还好（It'sOK）、4-享受（WillEnjoy）、5-必看（MustSee）。将顾客评分数据库中6000条评分数据和7部电影作为实验数据集。实验时，应将所有数据集划分为训练集和测试集两大部分，抽取一部分数据作为训练评分所使用的训练集，测试集则在其余的顾客数据中随机选取。这里，为了在设定测试情况较为稀疏，将其中20%的数据作为训练集，80%的数据作为测试集，要求保证训练集与测试集之间没有交集。

（二）评价标准

模型的推荐效果要通过量化指标来评估，评价标准的选取也影响着实验数据。这里，针对基于情感模型的推荐的准确度和实时性，将下属两项指标作为测试依据：

模型的性能要通过特定的指标来体现，因此评价标准的确定也决定着最终的实验结果。这里，为了评价个性化推荐模型的准确性和实时性，选取以下三项指标，对模型进行测试：

（4.1）

平均误差率的计算主要将顾客对商品喜好的预测值和实际值（即评分值）的差值，进行加权后再求平均。平均误差率是推荐准确性的体现，值越小，推荐精确度越高，值越大，推荐模型的质量越差。

（4.2）

其中，标准差是针对平均误差率进行的标准差计算，是针对顾客预测值的平均误差率进行的标准差的计算。标准差主要反映在训练集和测试集数据随机的情况下，即测试顾客数数随机时，模型误差的稳定性，是推荐整体性能的体现。

（三）结果分析

这里，评价推荐质量的标准设定为平均误差率和标准差。平均误差率是通过预测类别和实际类别的偏差情况来确定推荐质量，平均误差率值越大，推荐质量越差。标准差的计算沿用统计学的方法，可以较为直观地测量出推荐质量。这里，将基于内容的推荐算法和协同过滤推荐算法作为对照，三种算法分别反复执行100次，推荐质量如图3、4所示：

图3 算法平均误差率比较

图4 算法标准差比较

由图、表可以观察出针对于电影类商品，与其他两种推荐算法相比，混合算法表现出较高的推荐精度、较好的稳定性，明显提高推荐精度。

四、结束语

随着计算机技术和信息技术的进步，人们对于智能系统的依赖程度越来越强。如何让计算机能像人一样感知态度、情感，进而能据此准确地为顾客进行主动推荐，以及成为各电子商务平台竞争的焦点。成功的推荐是以准确的获取顾客对产品的喜好为前提的，基于内容的推荐是传统推荐算法之一，方法简单、高效，但存在扩展性问题；过滤技术是准确推荐的又一关键技术，虽然适用性较强，但存在稀疏性问题。

混合推荐模型就是将基于情感构建模型结合传统推荐算法，将影响顾客选择商品的情感分为积极和消极两大类，情感将对顾客产生不同的行为影响，通过计算顾客偏好和商品情感之间不同，结合用户评分，进行主动推荐。基于情感的推荐过程是相当重要的，能够单独针对每一位顾客的喜好进行推荐，不仅能够通过顾客提交的商品情感评价获取顾客情感信息，进而预测顾客对于商品的好恶程度，从而避免了传统推荐方法仅仅简单依据顾客在网站上的随意行为作为推荐依据的缺点，更具准确性和灵活性。据了解，把情感因素加入推荐模型，结合另外两种技术进行应用的还很少，该算法通过实验，即使在较为极端的测试状况下，依旧表现出较好的推荐精确度和及时性，大大提升了推荐质量。

[1]Dixon,S.,Bainbridge,D., &Typke,R. （2007）.Sociologyandmusicrecommendationsystems[C].InProceedingsoftheinternationalsymposiumonmusicinformationretrieval.DownWithTheLoads. .

[2]Karydis,I.,Nanopoulos,A.,Papadopoulos,A.,Katsaros,D., &Manolopoulos,Y.Content-basedmusicinformationretrievalinwirelessad-hocnetworks.InProceedingsofthe6thsymposiumonmusicinformationretrieval[C].KIDiddles. .

[3]Krumhansl,C.L.Music:Alinkbetweencognitionandemotion[J].CurrentDirectionsinPsychologicalScience, 2002.

[4]Yeh,C.C.,Tseng,S.S.,Tsai,P.C., &Weng,J.F.Buildingapersonalizedmusicemotionpredictionsystem[C].InProceedingsofthe7thPaci?crimconferenceonmultimedia.2006.

[5]Weyde,T., &Datzko,C. （2005）.Ef?cientmelodyretrievalwithmotifcontourclasses[C].InProceedingsofthe6thsymposiumonmusicinformationretrieval.

[6]林鸿飞,杨志豪,赵晶.基于内容和合作模式的信息推荐机制[J].中文信息学报,2005，（09）.

[7]詹永照,曹鹏.语音情感特征提取和识别的研究与实现[J].江苏大学学报（自然科学版），2005，（01）.

[8]曹毅,贺卫红.基于向量空间模型的信息安全过滤系统[J].计算机工程与设计,2006，（27）.

[9]谭雄,谭庆平,陈骏. 新型电子商务网站的研究与设计[J]. 微计算机信息,2008，（02）.

Emotion-Based Hybrid Recommendation Model

YANG Jing

（TianjinModernVocationalTechnologyCollege,Tianjin, 300350）

Emotion plays an important role in customers’ purchasing behaviors. Based on the traditional content-based recommendation algorithm and the collaborative filtering algorithm, this paper introduces the emotion-based recommendation algorithm. It calculates scores of customers’ emotion for commodities and takes it as the main clue for recommendation. The experimental evaluation proves that it greatly improves the accuracy and stability of recommendation.

e-commerce; collaborative filtering; content-based recommendation; emotion-based recommendation

2015-03-16

杨静（1981-），女，汉族，天津人，天津现代职业技术学院管理工程学院，讲师，硕士，主要研究方向：电子商务与知识工程。

TP391

1673-582X（2015）05-0094-05