当前位置: 首页 > 专利查询>福州大学专利>正文

一种方面级用户产品评论情感分析方法及系统技术方案

技术编号:24497978 阅读:28 留言:0更新日期:2020-06-13 03:48
本发明专利技术涉及一种方面级用户产品评论情感分析方法及系统,该方法包括以下步骤:步骤A:提取用户的产品评论、评论涉及的产品方面词、产品方面词的位置信息,并对产品方面的情感极性进行标注,构建训练集

An emotion analysis method and system for aspect level user product reviews

【技术实现步骤摘要】
一种方面级用户产品评论情感分析方法及系统
本专利技术涉及自然语言处理与情感分析应用领域,具体涉及一种方面级用户产品评论情感分析方法及系统。
技术介绍
情感分析(SentimentAnalysis,SA),又被称为意见挖掘,是自然语言处理中文本分类任务的一项基本任务,其基本目标是从文本中识别观点,分析其情感倾向性。随着近年来社交媒体和电子商务的兴起,越来越多研究人员参与到该领域的研究。随着研究的深入,人们对情感分析的分类粒度要求也越来越高,从文档级、句子级再发展到如今的方面级(aspectlevel)。方面级情感分析的目标是识别给定的句子中的每一个方面的情感极性(积极、消极和中性)。如在句子“这款笔记本电脑的分辨率很高,但是价格一点贵”中,评论者对笔记本电脑(实体)的某个方面“分辨率”的情感极性为积极,而对另一个产品方面“价格”的情感极性为消极。方面级情感分析的早期研究通常采用传统的监督学习算法,该类研究着重于通过诸如词袋模型、LDA等方法来提取特征以训练分类器。这些方法需要复杂的特征工程来提取文本特征,十分繁琐。最近,端到端的神经网络,本文档来自技高网...

【技术保护点】
1.一种方面级用户产品评论情感分析方法,其特征在于,包括以下步骤:/n步骤A:提取用户的产品评论、评论涉及的产品方面词、产品方面词的位置信息,并对产品方面的情感极性进行标注,构建训练集SA;/n步骤B:使用训练集SA,训练用于方面级用户产品评论情感分析的融合记忆网络与双向长短期记忆网络的深度学习网络模型M;/n步骤C:输入用户对产品的评论,提取评论涉及的产品方面词,将产品评论、产品方面词输入到训练好的深度学习网络模型M中,输出对产品方面的情感评价极性。/n

【技术特征摘要】
1.一种方面级用户产品评论情感分析方法,其特征在于,包括以下步骤:
步骤A:提取用户的产品评论、评论涉及的产品方面词、产品方面词的位置信息,并对产品方面的情感极性进行标注,构建训练集SA;
步骤B:使用训练集SA,训练用于方面级用户产品评论情感分析的融合记忆网络与双向长短期记忆网络的深度学习网络模型M;
步骤C:输入用户对产品的评论,提取评论涉及的产品方面词,将产品评论、产品方面词输入到训练好的深度学习网络模型M中,输出对产品方面的情感评价极性。


2.根据权利要求1所述的一种方面级用户产品评论情感分析方法,其特征在于,所述步骤B具体包括以下步骤:
步骤B1:对训练集SA中的每条用户产品评论、评论中的产品方面词、产品方面词的位置、产品方面的情感极性进行编码,得到方面级用户产品评论的初始表征向量和产品方面向量
步骤B2:将步骤B1得到的初始表征向量输入到双向长短期记忆网络中,得到方面级用户产品评论的带位置信息的记忆向量H;
步骤B3:将步骤B2得到的记忆向量H和步骤B1得到的产品方面向量输入到记忆网络中,使用多头注意力机制进行情感极性学习,得到方面级用户产品评论的表征向量ek,其中k是记忆网络中计算层的层数;
步骤B4:连接步骤B2得到的记忆向量H与步骤B3得到的表征向量ek,输入到张量层进行特征融合,得到方面级用户产品评论的记忆融合表征向量e(s);
步骤B5:将步骤B4得到的记忆融合表征向量e(s)输入到softmax层,根据目标损失函数loss,利用反向传播方法计算深度学习网络中各参数的梯度,并利用随机梯度下降方法更新参数;
步骤B6:当深度学习网络模型M产生的损失值小于设定阈值且不再降低或者迭代次数达到最大迭代次数,则终止深度学习网络模型的训练。


3.根据权利要求2所述的一种方面级用户产品评论情感分析方法,其特征在于,所述步骤B1具体包括以下步骤:
步骤B11:遍历训练集SA,SA中的每个训练样本表示为sa=(s,a,c),其中s表示产品评论,a表示评论s涉及的产品方面,c为该产品方面的评论对应的情感极性,情感极性分为三种:积极、消极、中性;对训练样本sa中的评论s和产品方面a进行分词处理,去除停用词;
其中,评论s经过分词及去除停用词后,表示为:



其中,为评论s经过分词及去除停用词后剩余词语中的第i个词,i=1,2,...,N,N为评论s经过分词及去除停用词后剩余的词语数量;
步骤B12:对经过分词及去除停用词后的产品评论s进行编码,得到评论s的初始表征向量表示为:



其中,为第i个词所对应的词向量,通过在预训练的词向量矩阵E∈Rd×|D|中查找得到,其中d表示词向量的维度,|D|是词典D中的词语数;为评论s中第i个词所对应的位置信息的编码,其编码方式如下:



其中,js(a)为经过分词及去除停用词后的产品方面a中的第一个词在评论s中的位置,而je(a)为经过分词及去除停用词后的产品方面a中的最后一个词在评论s中的位置;

是评论s的初始表征向量中第t个单词及其位置信息pt的联合表示,“;”表示向量连接操作,t=1,2,...,N,评论s的初始表征向量
步骤B13:对经过分词及去除停用词后的产品方面a进行编码,得到产品方面a的表征向量,即产品方面向量
其中,a表示为:



其中,产品方面a是一个短语,由1个或多个连续的词构成,为产品方面a中的第i个词,i=1,2,...,m,m为产品方面a经过分词及去除停用词后剩余的词语数量;
用表示第i个词所对应的词向量,通过在预训练的词向量矩阵E∈Rd×|D|中查找得到;
则产品方面a的表征向量表示为:



其中,由对i=1,2,...,m进行平均池化得到。


4.根据权利要求3所述的一种方面级用户产品评论情感分析方法,其特征在于,所述步骤B2具体包括以下步骤:
步骤B21:对于双向长短期记忆网络的正向,依次输入构成产品评论s的初始表征向量的序列得到t=1,2,...,N在正向长短期记忆网络中的隐层状态向量t=1,2,...,N,其中f为长短期记忆网络中对隐层状态的激活函数;
步骤B22:对于双向长短期记忆网络的反向,依次输入得到t=1,2,...,N在反向长短期记忆网络中的隐层状态向量t=1,2,...,N,其中
步骤B23:将隐层状态向量进行连接并转置得到用户产品评论的带位置信息的记忆向量H,H=[h1,...,ht,...,hN]T,H∈RN×2d,ht为正向隐层状态向量与反向隐层状态向量的连接。


5.根据权利要求2所述的一种方面级用户产品评论情感分析方法...

【专利技术属性】
技术研发人员:陈羽中庄天豪刘漳辉
申请(专利权)人:福州大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1