融合用户信息的文本情感分类方法及装置制造方法及图纸

技术编号:20117769 阅读:32 留言:0更新日期:2019-01-16 12:04
本发明专利技术属于文本分类技术领域,具体提供了一种融合用户信息的文本情感分类方法及装置。旨在解决现有技术不考虑不同用户的差异性和忽略用户信息导致对评论的文本情感分类不准确的问题。为此目的,本发明专利技术提供了一种融合用户信息的文本情感分类方法,包括基于预先获取的评论信息和相应的用户信息得到评论向量;基于预先构建的评论文本情感分类模型并根据预设的评价对象,对评论向量进行情感预测,得到每条评论信息对应的情感类别;其中,评论文本情感分类模型是基于预设的语料集并利用机器学习算法所构建的神经网络模型。基于上述步骤,本发明专利技术提供的方法可以准确地获取每条评论信息对应的情感类别。本发明专利技术的装置同样具有上述有益效果。

Text Emotion Classification Method and Device Fusing User Information

The invention belongs to the technical field of text classification, and specifically provides a text emotion classification method and device integrating user information. The purpose of this paper is to solve the problem of inaccurate emotional classification of comments caused by ignoring the differences of different users and ignoring user information in existing technologies. To this end, the present invention provides a text emotional classification method that integrates user information, including obtaining comment vectors based on pre-acquired comment information and corresponding user information; predicting comment vectors based on pre-constructed comment text emotional classification model and according to preset evaluation objects, and obtaining the corresponding emotional categories of each comment information; Emotional classification model of commentary text is a neural network model based on presupposed corpus and machine learning algorithm. Based on the above steps, the method provided by the present invention can accurately obtain the emotional category corresponding to each comment information. The device of the invention also has the above beneficial effect.

【技术实现步骤摘要】
融合用户信息的文本情感分类方法及装置
本专利技术属于文本分类
,具体涉及一种融合用户信息的文本情感分类方法及装置。
技术介绍
高速发展的互联网给用户提供了众多的服务和产品评论平台,这些评论平台包含了大量的用户评论,对这些评论文本进行分析能够帮助用户或者公司更好地了解商家所提供的服务或者产品。在实际情况中,一条评论不仅包含了用户对产品或者服务的整体态度,还包含了用户对产品或者服务的各个方面、各个属性的不同态度,用户对产品或者服务的各个方面、各个属性的不同态度可以称之为评价对象。根据评论所表达的含义和情感信息将评论划分为褒义或者贬义或者其他的情感类型,不仅对于用户而言是有价值的,也可以帮助公司清楚地了解产品或者服务的优缺点。现有技术是通过机器学习的方法训练分类器,从用户评论中抽取特征,分类的效果取决于特征的手动设计和选择。除此之外,现有技术还通过深度学习模型对评论的情感类型进行分类,但是现有技术普遍存在一个缺点:只考虑评论的文本信息而忽略了用户信息,但是用户信息对评论的情感分类具有重要的作用,具体体现在如下三点:1、不同的用户在表达情感上有着不同的用词习惯,充分地捕捉用户的用词习惯可以更有效地识别用户发布评论的情感极性;2、针对同一款产品或者服务,不同的用户关注的对象会有所差异;3、不同的用户在打分风格上有着各自的差异,有些用户较为宽容,容易给出高分,有些用户较为严格,容易给出低分。充分考虑不同用户在评价时的差异性,可以更好地识别评论的情感极性。因此,如何提出一种充分利用用户信息提升对评论的文本情感分类的准确率的方案是本领域技术人员目前需要解决的问题。专
技术实现思路
为了解决现有技术中的上述问题,即为了解决现有技术不考虑不同用户的差异性和忽略用户信息导致对评论的文本情感分类不准确的问题,本专利技术的第一方面提供了一种融合用户信息的文本情感分类方法,包括:基于预先获取的评论信息和相应的用户信息得到评论向量;基于预先构建的评论文本情感分类模型并根据预设的评价对象,对所述评论向量进行情感预测,得到每条评论信息对应的情感类别;其中,所述评论文本情感分类模型是基于预设的语料集并利用机器学习算法所构建的神经网络模型。在上述方法的优选技术方案中,所述语料集包括特定领域的评论信息以及相应的用户信息和预设的评价对象;在“基于预先构建的评论文本情感分类模型并根据预设的评价对象,对所述评论向量进行情感预测,得到每条评论信息对应的情感类别”的步骤之前,所述方法还包括:根据所述语料集并利用梯度下降优化算法训练所述评论文本情感分类模型。在上述方法的优选技术方案中,“基于预先获取的评论信息和相应的用户信息得到评论向量”的步骤包括:基于预设的双向长短期记忆网络模型并根据所述评论信息,得到评论信息向量;将所述用户信息随机初始化为用户信息向量;连接所述评论信息向量和用户信息向量,得到所述评论向量。在上述方法的优选技术方案中,“基于预设的双向长短期记忆网络模型并根据所述评论信息,得到评论信息向量”的步骤包括:基于所述双向长短期记忆网络模型并按照下式所示的方法获取所述评论信息对应的词汇隐层表示向量:其中,和分别表示所述双向长短期记忆网络模型前向推算和后向推算的过程,是连接符号,hij表示所述评论信息中第i个句子中第j个词汇wij对应的词汇隐层表示向量的向量元素;根据预设的注意力机制模型并根据所述词汇隐层表示向量和预设的评价对象,按照下式所示的方法获取所述评论信息向量:si=∑jαijhijti=tanh(Wahai+Wauu+ba)d=∑iγiak其中,u表示所述用户信息向量,Wwh表示所述注意力机制模型的句子表示层的所述隐层表示向量的权重参数,Wwu表示所述注意力机制模型的句子表示层的所述用户信息向量的权重参数,bw和均表示所述注意力机制模型的句子表示层的偏置权重参数,T表示转置符号,w表示所述注意力机制模型的句子表示层;αij表示所述评论信息的第i个句子si中第j个词汇在构建句子表示向量si中的重要程度,ti和表示中间向量;Wah表示所述注意力机制模型的文档表示层的所述隐层表示向量的权重参数,Wau表示所述注意力机制模型的文档表示层的所述用户信息向量的权重参数,ba和均表示所述注意力机制模型的文档表示层的偏置权重参数,γi表示第i个评价对象ai对构建评论信息向量d的重要程度,a表示所述注意力机制模型的文档表示层。在上述方法的优选技术方案中,所述方法还包括按下式所示的方法获取所述评价对象对应的评价对象向量:ak=∑iβikhi其中,Wsh表示所述注意力机制模型的评价对象表示层的权重参数,bs和均表示所述注意力机制模型的评价对象表示层的偏置权重参数,Aik表示所述评论信息中第i个句子si中包含评价对象ak的数量,βik表示第i个句子si对第k个评价对象ak的重要程度,s表示所述注意力机制模型的评价对象表示层。本专利技术的第二方面提供了一种融合用户信息的文本情感分类装置,包括:获取模块,配置为基于预先获取的评论信息和相应的用户信息得到评论向量;预测模块,配置为基于预先构建的评论文本情感分类模型并根据预设的评价对象,对所述评论向量进行情感预测,得到每条评论信息对应的情感类别;其中,所述评论文本情感分类模型是基于预设的语料集并利用机器学习算法所构建的神经网络模型。在上述装置的优选技术方案中,所述语料集包括特定领域的评论信息以及相应的用户信息和预设的评价对象;所述预测模块进一步配置为:根据所述语料集并利用梯度下降优化算法训练所述评论文本情感分类模型。在上述装置的优选技术方案中,所述获取模块进一步配置为:基于预设的双向长短期记忆网络模型并根据所述评论信息,得到评论信息向量;将所述用户信息随机初始化为用户信息向量;连接所述评论信息向量和用户信息向量,得到所述评论向量。在上述装置的优选技术方案中,所述获取模块进一步配置为:基于所述双向长短期记忆网络模型并按照下式所示的方法获取所述评论信息对应的词汇隐层表示向量:其中,和分别表示所述双向长短期记忆网络模型前向推算和后向推算的过程,是连接符号,hij表示所述评论信息中第i个句子中第j个词汇wij对应的词汇隐层表示向量的向量元素;根据预设的注意力机制模型并根据所述词汇隐层表示向量和预设的评价对象,按照下式所示的方法获取所述评论信息向量:si=∑jαijhijti=tanh(Wahai+Wauu+ba)d=∑iγiak其中,u表示所述用户信息向量,Wwh表示所述注意力机制模型的句子表示层的所述隐层表示向量的权重参数,Wwu表示所述注意力机制模型的句子表示层的所述用户信息向量的权重参数,bw和均表示所述注意力机制模型的句子表示层的偏置权重参数,T表示转置符号,w表示所述注意力机制模型的句子表示层;αij表示所述评论信息的第i个句子si中第j个词汇在构建句子表示向量si中的重要程度,ti表示中间变量;Wah表示所述注意力机制模型的文档表示层的所述隐层表示向量的权重参数,Wau表示所述注意力机制模型的文档表示层的所述用户信息向量的权重参数,ba和均表示所述注意力机制模型的文档表示层的偏置权重参数,γi表示第i个评价对象ai对构建评论信息向量d的重要程度,a表示所述注意力机制模型的文档表示层。在上述装置的优选技术方案中,本文档来自技高网
...

【技术保护点】
1.一种融合用户信息的文本情感分类方法,其特征在于包括:基于预先获取的评论信息和相应的用户信息获取评论向量;基于预先构建的评论文本情感分类模型并根据预设的评价对象,对所述评论向量进行情感预测,获取每条评论信息对应的情感类别;其中,所述评论文本情感分类模型是基于预设的语料集并利用机器学习算法所构建的神经网络模型。

【技术特征摘要】
1.一种融合用户信息的文本情感分类方法,其特征在于包括:基于预先获取的评论信息和相应的用户信息获取评论向量;基于预先构建的评论文本情感分类模型并根据预设的评价对象,对所述评论向量进行情感预测,获取每条评论信息对应的情感类别;其中,所述评论文本情感分类模型是基于预设的语料集并利用机器学习算法所构建的神经网络模型。2.根据权利要求1所述的融合用户信息的文本情感分类方法,其特征在于,所述语料集包括特定领域的评论信息以及相应的用户信息和预设的评价对象;在“基于预先构建的评论文本情感分类模型并根据预设的评价对象,对所述评论向量进行情感预测,获取每条评论信息对应的情感类别”的步骤之前,所述方法还包括:根据所述语料集并利用梯度下降优化算法训练所述评论文本情感分类模型。3.根据权利要求2所述的融合用户信息的文本情感分类方法,其特征在于,“基于预先获取的评论信息和相应的用户信息获取评论向量”的步骤包括:基于预设的双向长短期记忆网络模型并根据所述评论信息,获取评论信息向量;将所述用户信息随机初始化为用户信息向量;连接所述评论信息向量和用户信息向量,获取所述评论向量。4.根据权利要求3所述的融合用户信息的文本情感分类方法,其特征在于,“基于预设的双向长短期记忆网络模型并根据所述评论信息,获取评论信息向量”的步骤包括:基于所述双向长短期记忆网络模型并按照下式所示的方法获取所述评论信息对应的词汇隐层表示向量:其中,和分别表示所述双向长短期记忆网络模型前向推算和后向推算的过程,是连接符号,hij表示所述评论信息中第i个句子中第j个词汇wij对应的词汇隐层表示向量的向量元素;根据预设的注意力机制模型并根据所述词汇隐层表示向量和预设的评价对象,按照下式所示的方法获取所述评论信息向量:ti=tanh(Wahai+Wauu+ba)其中,u表示所述用户信息向量,Wwh表示所述注意力机制模型的句子表示层的所述隐层表示向量的权重参数,Wwu表示所述注意力机制模型的句子表示层的所述用户信息向量的权重参数,bw和均表示所述注意力机制模型的句子表示层的偏置权重参数,T表示转置符号,w表示所述注意力机制模型的句子表示层;αij表示所述评论信息的第i个句子si中第j个词汇在构建句子表示向量si中的重要程度,ti和表示中间向量;Wah表示所述注意力机制模型的文档表示层的所述隐层表示向量的权重参数,Wau表示所述注意力机制模型的文档表示层的所述用户信息向量的权重参数,ba和均表示所述注意力机制模型的文档表示层的偏置权重参数,γi表示第i个评价对象ai对构建评论信息向量d的重要程度,a表示所述注意力机制模型的文档表示层。5.根据权利要求4所述的融合用户信息的文本情感分类方法,其特征在于,所述方法还包括按下式所示的方法获取所述评价对象对应的评价对象向量:其中,Wsh表示所述注意力机制模型的评价对象表示层的权重参数,bs和均表示所述注意力机制模型的评价对象表示层的偏置权重参数,Aik表示所述评论信息中第i个句子si中包含评价对象ak的数量,βik表示...

【专利技术属性】
技术研发人员:周玉李俊杰宗成庆
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1