多标签文本情绪分类研究综述

时间：2024-05-04

霍君慧

（四川大学计算机学院，成都610065）

0 引言

多标签文本情绪分类主要工作是提取文本中的情绪内容，如，喜悦、生气、悲伤、愤怒等，然后对这些内容打上特定的一个或多个情绪标签。分析文本中的情绪是一个广泛的研究领域。通过分析文本中的情绪，商家从中分析用户的心理，提高自己的服务；制造商从中分析产品的不足，提高产品质量，提升用户的满意度。Aman S[1]提出了一种识别情绪类别、情绪强度和文本中表示情绪的单词/短语的情绪标注方案，该方法在博客语料库上，情绪分类的准确率为73.89%，明显高于基线。

传统的情绪分析只是将一条信息归为单一的情绪类别，然而在现实生活中一条信息可能属于几个不同的情绪类别，Yang J 等人[2]通过图形表情符号、标点符号和词汇来标记文本，来进行多标签文本情绪分类。

1 基于词典的方法

基于词典的多标签情绪分类方法是在情绪词典库的基础上，将文本中的情绪关键词提取出来，从而对该文本进行情绪分类。同时，生成的词典具有广泛的用途，包括预测文章中的情绪分布，识别新闻事件中的情绪，提高情绪分类的准确率等。对情感词典的构建方式一般有基于启发式规则、基于图、基于词对齐模型、基于表示学习的方法。

Ma C 等人[3]设计了基于文本和嵌入式会话信使情绪估计的聊天系统，该系统是在一个评估文本聊天消息的情绪内容评估模块的基础上，通过关键字提取文本中的相关情绪，再通过句法特征、语音合成及相关的情绪手势来评估文本的情绪。

由于情绪词典中的情绪词会受时间、领域、语言和文化的影响，即同一个情绪词在不同的时间、领域、语言和文化的环境中表达的情绪可能会不同，因此在跨时间、跨领域、跨语言、跨文化的多标签文本情绪分类任务中的效果不是很理想。

在跨时间环境中，人类的大脑可能会在不同的时间对相同的情绪做出不同的表现，Liu S[4]通过使用支持向量机对中性、积极或消极三种情绪状态进行分类，在训练集上加入不同的天数，实验结果表明实验结果的准确率会随着训练天数的增加而增加，极大地提高了情绪分类器的泛化能力。

在跨领域的环境中，Scheve C V 等人[5]提出了一个结合跨领域的方法来研究情绪和社会的结构，分析了社会对认知和情感相互作用的影响，考察了情绪是如何在社会中被激发和表达的，研究了社会是如何影响情绪的处理和调节。

在跨语言的环境中，Choi J 等人[6]记录了正负效价（valence）、主动/被动觉醒(arousal)、已知会影响情绪识别的属性的基本情绪（basic）和非基本情绪（non-basic）等情绪，来解决跨语言中的不对称问题。

在跨文化的环境中，Sanchez J 等人[7]通过让墨西哥人说西班牙语和让美国人说英语在两分钟内尽可能多的列出情绪，对两种语言的数据进行分析，结果表明在两种语言中两国人对情感的认知显示出了相同的比例分布，对情感的处理是跨文化不变的。Li A 等人[8]研究了文化对表情、声音和感知的影响，从而探讨了中日两国在情感表达和情感感知上的差异，研究表明相互冲突的信号会受到文化背景的影响。

基于词典的情绪分类方法一般步骤为：①文本预处理，包括分词（主要的分词工具有jieba 分词、Snow-NLP、Yaha 分词等）和去除停用词（文本中有许多词语不用于表示情绪，但是出现的频率却很多，如中文中“的”，可以将其去除，来提高分类效率）。②载入情绪词典（包括积极词典、消极词典、否定词词典、程度副词词典）。③多标签文本情绪分类。

此外，基于词典的情绪分类方法在情感词标注的准确率较低和情感词覆盖率较低的情况下，分类效果会降低，而且该方法会受到时间、语言、领域等方面的影响，所以如何构建高质量的情绪词典仍然是这个研究领域的重点。

2 基于规则的方法

基于规则的多标签情绪分类是在定义一个规则的基础上进行分类的方法。Zhang X[9]等人将基于规则的方法应用到中文微博文本上，通过总结表达情绪的基本语义规则，对中文微博文本进行情绪分类，并与基于SVM 的方法进行比较，其结果优于基于SVM 的方法。

多标签情绪分类的研究多集中在对文本中情绪的显示表达上，对于隐含的情绪分类研究较少，Udochukwu O 等人[10]提出了一种基于规则的隐含情绪分类方法，并在三个不同的数据集上进行评估，在F-measure上有17-30%的优势，并在给出的“Happy”、“Angry-Disgust”、“Sad”上的平均F-measure 为82.7%，高于监督学习分类的基线近17%。Liu H 等人[11]通过构建基于规则的情绪分类系统，来识别真实数据集中的密集分类。

基于规则的多标签情绪分类方法加入一些规则来提高多标签情绪分类的准确率，在数据量较小时，比较简单，容易维护。

3 基于主题的方法

基于主题的方法一般是先从词语中生成主题，再从主题中提取情绪。Bao S 等人[12]提出了一个情绪主题模型，该模型从情绪中产生一组潜在的主题，然后从每个主题中产生情绪词，在新闻数据集上，该模型能够有效识别每个情绪所在的潜在主题。

Li Q 等人[13]提出了两种基于社交媒体的情绪主题模型，第一种模型是对现有监督主题模型的扩展，从单词生成主题模型，再从每个主题中获取情绪。而第二种模型是直接从社会情绪中产生话题，将潜在主题和作者的情绪联系起来，从而发现能够表现情感焦点的潜在主题。

Lei J 等人[14]通过使用三种剪枝策略来自动构建基于社会情绪检测的词汇级情绪词典。并提出了一个基于主题的方法来构建一个主题级词典。

Xu H[15]通过构建基于主题的条约图模型，通过LDA 来确定基于主题的单词关系，然后将其集成到分布式的单词嵌入学习中，该模型能够同时使用不同种类的词嵌入来进行情绪分类，并应用于生物医学领域，优于当时最先进的方法。

传统的基于主题的分类算法中的主题一般是上下文敏感的，为了解决这个问题，Yanghui 等人[16]构建情境情绪主题模型，将上下文无关的主题与背景主题（非歧义性文本信息）和上下文主题（跨不同集合的上下文相关文本信息）进行区分，以自适应社会情绪分类。

基于主题的多标签情绪分类方法依赖于主题模型，对主题模型的要求较高。

4 基于机器学习的方法

传统的基于机器学习的情绪分类方法通常是通过语言模型来提取文本特征，然后通过使用机器学习方法来进行分类。

基于机器学习的常用情绪分类方法是通过朴素贝叶斯、支持向量机、最大熵等方法来进行多标签文本情绪分类。Pang B[17]等人在电影评论的基础上，测试三种机器学习方法（朴素贝叶斯、支持向量机、最大熵）的文本情绪分类效果，结果表明支持向量机要比朴素贝叶斯和最大熵的效果好。Roth D[18]等人将监督机器学习和BOW 方法，应用在儿童通话故事的叙事领域中，对文本中的情感内容和非情感内容进行分类，结果令人鼓舞。Li J 等人[19]提出了一个基于多标签的最大熵模型，通过对多个用户的共同评分和多个情绪标签进行建模，然后对短文本进行情绪分类。

基于机器学习的多标签文本分类在许多数据集上的实现效果很好，但是在特征提取时可能会出现特征向量系数、提取难度较大等问题。

5 基于深度学习的方法

基于深度学习的多标签情绪分类方法一般是将词嵌入得到的词向量作为情绪分类模型的输入，输入到深度学习模型中，常用的深度学习模型有循环神经网络（Recurrent Neural Network，RNN），卷积神经网络（Convolutional Neural Network，CNN）等。

Akhtar M S 等人[20]通过使用多任务集成框架，将CNN、长短记忆网络（Long Short-Term Memory，LSTM）和GRU（Gated Recurrent Unit）三种深度学习模型集成，来解决情绪分类中粗细粒度和不同范围的领域（即tweet、Facebook 信息、博客等）问题。

Kumar A[21]提出了一种注意神经网络，在双向长短记忆网络的基础上，加入外部知识（分布类同义词典），以提高情绪预测能力。并在SemEval 2016 Task 6 数据集上进行评估，提高了3.2 个F-score 分。

基于深度学习的多标签情绪分类模型能够从数据中提取出更为深层次的特征，在学习和表达等方面明显优于传统的机器学习方法，但是该种方法会受到词向量的影响，因此构建更好的词向量仍然是研究的热点。

6 结语

本文对多标签情绪分类进行了研究，从基于情绪词典、基于主题、基于规则、基于机器学习、基于深度学习五个方面来介绍其方法，多标签情绪分类是从文本中提取出情绪，是自然语言处理的一个分支，可应用于市场分析、金融预测、舆情监控等领域，可以预见，在未来的文本分类研究领域中，将会涌现出大量的人对多标签情绪分类进行研究。