融合用户和整体评价信息的评价对象情感分类方法及装置制造方法及图纸

技术编号:20161111 阅读:27 留言:0更新日期:2019-01-19 00:13
本发明专利技术属于情感分类技术领域,具体提供了一种融合用户和整体标签信息的评价对象情感分类方法及装置。旨在解决现有技术不考虑不同用户的差异性和忽略整体评价信息导致对评价对象情感极性评价不准确的问题。本发明专利技术提供了一种融合用户和整体评价信息的评价对象情感分类方法,包括基于预先获取的评论信息以及相应的用户信息和整体评价信息得到评论向量;基于预先构建的评价对象情感分类模型并根据预设的评价对象,对评论向量进行情感预测,得到每个评价对象对应的情感极性。本发明专利技术的方法全面考虑了用户信息和整体评价信息对评价对象情感分类的影响,相对于其他方法提升了预测的准确率。本发明专利技术的装置同样具有上述有益效果。

【技术实现步骤摘要】
融合用户和整体评价信息的评价对象情感分类方法及装置
本专利技术属于情感分类
,具体涉及一种融合用户和整体标签信息的评价对象情感分类方法及装置。
技术介绍
高速发展的互联网给用户提供了众多的服务和产品评论平台,这些评论平台包含了大量的用户评论,对这些评论文本进行分析能够帮助用户或者公司更好地了解商家所提供的服务或者产品。目前大部分的分析工作是从评论文本中预测出服务或产品的整体极性得分。在实际情况中,一条评论不仅包含了用户对产品或者服务的整体态度,还包含了用户对产品或者服务的各个方面、各个属性的不同态度,用户对产品或者服务的各个方面、各个属性的不同态度可以称之为评价对象。从评论中识别评价对象的情感极性,即对评价对象进行打分,不仅对于用户而言是有价值的,也可以帮助公司清楚地了解产品或者服务的优缺点。现有技术是基于机器理解的方式对需要预测评论的评价对象进行打分,从评论内容中预测评价对象的得分任务中,现有技术忽略了用户信息和整体标签信息两个重要的因素。其中,不同的用户在表达感情上有着不同的用词习惯,不同的用户在打分风格上有着各自的差异,有些用户较为宽容,容易给出高分,而有些用户则比较严格,常常给出低分,不考虑不同用户的差异性,则无法很好地识别评价文本中包含的评价对象的情感极性;整体标签反映了用户对产品或者服务的整体态度,这个态度对预测文本中包含的评价对象的得分也有着先验的提示作用。因此,如何充分利用用户信息和整体标签信息提升对评价文本情感分类的准确率是本领域技术人员目前需要解决的技术问题。
技术实现思路
为了解决现有技术中的上述问题,即为了解决现有技术不考虑不同用户的差异性和忽略整体评价信息导致对评价对象情感极性评价不准确的问题,本专利技术的第一方面提供了一种融合用户和整体评价信息的评价对象情感分类方法,包括:基于预先获取的评论信息以及相应的用户信息和整体评价信息得到评论向量;基于预先构建的评价对象情感分类模型并根据预设的评价对象,对所述评论向量进行情感预测,得到每个所述评价对象对应的情感极性;其中,所述评价对象情感分类模型是基于预设的语料集并利用机器学习算法所构建的神经网络模型。在上述方法的优选技术方案中,所述语料集包括特定领域的评论信息以及相应的用户信息、整体评价信息和预设的评价对象的评价信息;在“基于预先构建的评价对象情感分类模型并根据预设的评价对象,对所述评论向量进行情感预测,得到每个所述评价对象对应的情感极性”的步骤之前,所述方法还包括:根据所述语料集并利用多任务学习算法训练所述评价对象情感分类模型。在上述方法的优选技术方案中,“基于预先获取的评论信息以及相应的用户信息和整体评价信息得到评论向量”的步骤包括:基于预设的双向循环神经网络模型并根据所述评论信息,得到第一向量;将所述用户信息随机初始化为第二向量;将所述整体评价信息随机初始化为第三向量;连接所述第一向量、第二向量以及第三向量,得到所述评论向量。在上述方法的优选技术方案中,“基于预设的双向循环神经网络模型并根据所述评论信息,得到第一向量”的步骤包括:基于预设的双向循环神经网络模型并按照下式所述的方法获取所述评论信息对应的词汇隐层表示向量:其中,wij表示所述用户评论的词汇,和分别表示所述双向循环神经网络前向推算和后向推算过程,是连接符号,hij表示词汇的隐层表示向量,i,j表示所述词汇的下标编码;根据预设的注意力机制模型并根据所述词汇的隐层表示向量按下式所示的方法获取所述第一向量:其中,u表示所述用户信息对应的向量,ak表示单一评价对象ak的向量,Wwh,Wwu,Wwa分别表示预设的词汇的隐层表示向量的权重参数、预设的词汇对应的用户信息向量的权重参数、预设的词汇对应的评价对象向量的权重参数,bw和均表示词汇对应的偏置权重参数;Wsh,Wsu,Wsa分别表示预设的句子的隐层表示向量的权重参数、预设的句子对应的用户信息向量的权重参数、预设的句子对应的评价对象向量的权重参数,bs和均表示句子对应的偏置权重参数;表示句子向量,αij表示评论的句子si中第j个词汇在构建句子表示向量和的重要性,表示所述用户评论的句子关于评价对象的隐层表示,γi表示句子隐层表示在构建总体评价对象ak的向量表示dk中的重要性,dk表示所述第一向量。在上述方法的优选技术方案中,“连接所述第一向量、第二向量以及第三向量,得到所述评论向量”的步骤如下公式所示:其中,dk表示所述第一向量,u表示所述第二向量,o表示所述第三向量。本专利技术的第二方面提供了一种融合用户和整体评价信息的评价对象情感分类装置,包括:获取模块,配置为基于预先获取的评论信息以及相应的用户信息和整体评价信息得到评论向量;预测模块,配置为基于预先构建的评价对象情感分类模型并根据预设的评价对象,对所述评论向量进行情感预测,得到每个所述评价对象对应的情感极性;其中,所述评价对象情感分类模型是基于预设的语料集并利用机器学习算法所构建的神经网络模型。在上述装置的优选技术方案中,所述语料集包括特定领域的评论信息以及相应的用户信息、整体评价信息和预设的评价对象的评价信息:所述预测模块进一步配置为:根据所述语料集并利用多任务学习算法训练所述评价对象情感分类模型。在上述装置的优选技术方案中,所述获取模块进一步配置为:基于预设的双向循环神经网络模型并根据所述评论信息,得到第一向量;将所述用户信息随机初始化为第二向量;将所述整体评价信息随机初始化为第三向量;连接所述第一向量、第二向量以及第三向量,得到所述评论向量。在上述装置的优选技术方案中,所述获取模块进一步配置为:基于预设的双向循环神经网络模型并按照下式所述的方法获取所述评论信息对应的词汇隐层表示向量:其中,wij表示所述用户评论的词汇,和分别表示所述双向循环神经网络前向推算和后向推算过程,是连接符号,hij表示词汇的隐层表示向量,i,j表示所述词汇的下标编码;根据预设的注意力机制模型并根据所述词汇的隐层表示向量按下式所示的方法获取所述第一向量:mij=tanh(Wwhhij+Wwuu+Wwaak+bw)其中,u表示所述用户信息对应的向量,ak表示单一评价对象ak的向量,Wwh,Wwu,Wwa分别表示预设的词汇的隐层表示向量的权重参数、预设的词汇对应的用户信息向量的权重参数、预设的词汇对应的评价对象向量的权重参数,bw和均表示词汇对应的偏置权重参数;Wsh,Wsu,Wsa分别表示预设的句子的隐层表示向量的权重参数、预设的句子对应的用户信息向量的权重参数、预设的句子对应的评价对象向量的权重参数,bs和均表示句子对应的偏置权重参数;表示句子向量,αij表示评论的句子si中第j个词汇在构建句子表示向量中的重要性,表示所述用户评论的句子关于评价对象的隐层表示,γi表示句子隐层表示在构建总体评价对象ak的向量表示dk中的重要性,dk表示所述第一向量。在上述装置的优选技术方案中,所述获取模块还配置为执行如下操作:按照下式所示的方法连接所述第一向量、第二向量以及第三向量:其中,dk表示所述第一向量,u表示所述第二向量,o表示所述第三向量。本专利技术的第三方面提供了一种存储装置,其中存储有多条程序,其特征在于,所述程序适于由处理器加载以执行上述任一项所述的融合用户和整体评价信息的评价对象情感分类方本文档来自技高网...

【技术保护点】
1.一种融合用户和整体评价信息的评价对象情感分类方法,其特征在于包括:基于预先获取的评论信息以及相应的用户信息和整体评价信息得到评论向量;基于预先构建的评价对象情感分类模型并根据预设的评价对象,对所述评论向量进行情感预测,得到每个所述评价对象对应的情感极性;其中,所述评价对象情感分类模型是基于预设的语料集并利用机器学习算法所构建的神经网络模型。

【技术特征摘要】
1.一种融合用户和整体评价信息的评价对象情感分类方法,其特征在于包括:基于预先获取的评论信息以及相应的用户信息和整体评价信息得到评论向量;基于预先构建的评价对象情感分类模型并根据预设的评价对象,对所述评论向量进行情感预测,得到每个所述评价对象对应的情感极性;其中,所述评价对象情感分类模型是基于预设的语料集并利用机器学习算法所构建的神经网络模型。2.根据权利要求1所述的融合用户和整体评价信息的评价对象情感分类方法,其特征在于,所述语料集包括特定领域的评论信息以及相应的用户信息、整体评价信息和预设的评价对象的评价信息;在“基于预先构建的评价对象情感分类模型并根据预设的评价对象,对所述评论向量进行情感预测,得到每个所述评价对象对应的情感极性”的步骤之前,所述方法还包括:根据所述语料集并利用多任务学习算法训练所述评价对象情感分类模型。3.根据权利要求2所述的融合用户和整体评价信息的评价对象情感分类方法,其特征在于,“基于预先获取的评论信息以及相应的用户信息和整体评价信息得到评论向量”的步骤包括:基于预设的双向循环神经网络模型并根据所述评论信息,得到第一向量;将所述用户信息随机初始化为第二向量;将所述整体评价信息随机初始化为第三向量;连接所述第一向量、第二向量以及第三向量,得到所述评论向量。4.根据权利要求3所述的融合用户和整体评价信息的评价对象情感分类方法,其特征在于,“基于预设的双向循环神经网络模型并根据所述评论信息,得到第一向量”的步骤包括:基于预设的双向循环神经网络模型并按照下式所述的方法获取所述评论信息对应的词汇隐层表示向量:其中,wij表示所述用户评论的词汇,和分别表示所述双向循环神经网络前向推算和后向推算过程,是连接符号,hij表示词汇的隐层表示向量,i,j表示所述词汇的下标编码;根据预设的注意力机制模型并根据所述词汇的隐层表示向量按下式所示的方法获取所述第一向量:mij=tanh(Wwhhij+Wwuu+Wwaak+bw)其中,u表示所述用户信息对应的向量,ak表示单一评价对象ak的向量,Wwh,Wwu,Wwa分别表示预设的词汇的隐层表示向量的权重参数、预设的词汇对应的用户信息向量的权重参数、预设的词汇对应的评价对象向量的权重参数,bw和均表示词汇对应的偏置权重参数;Wsh,Wsu,Wsa分别表示预设的句子的隐层表示向量的权重参数、预设的句子对应的用户信息向量的权重参数、预设的句子对应的评价对象向量的权重参数,bs和均表示句子对应的偏置权重参数;表示句子向量,αij表示评论的句子si中第j个词汇在构建句子表示向量中的重要性,表示所述用户评论的句子关于评价对象的隐层表示,γi表示句子隐层表示在构建总体评价对象ak的向量表示dk中的重要性,dk表示所述第一向量,k表示。5.根据权利要求1-4中任一项所述的融合用户和整体评价信息的评价对象情感分类方法,其特征在于,“连接所述第一向量、第二向量以及第三向量,得到所述评论向量”的步骤如下公式所示:其中,dk表示所述第一向量,u表示所述第二向量,o表示所述第三向量。6.一种融合用户和整体评价信息的评价对象情感分类装置,其特征在于包括:获取...

【专利技术属性】
技术研发人员:周玉李俊杰宗成庆
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1