基于情感中心的文本情感分类方法技术

技术编号:16837501 阅读:34 留言:0更新日期:2017-12-19 19:59
本发明专利技术公开了一种基于情感中心的文本情感分类方法,该方法包括:先将文本向量与类别情感向量中心的距离加入损失函数,通过损失函数将情感中心的影响加入到分类模型中;然后使用BLSTM将文本进行初步编码,通过注意力机制改善文本表示的准确度;在文本表征之上,通过情感类别向量与文本表征的距离值引入情感中心的信息,并在模型训练的过程中不断更新情感中心的实值向量表示,使其更加精准。本发明专利技术关注改善目标函数,新的目标函数利用文本情感中心的限制改善了文本情感分类,提升了文本情感分类的准确率。

Text emotion classification method based on emotional center

The invention discloses a method for sentiment classification based on the emotional center, the method includes: first the text vector and category sentiment vector center distance join loss function, will affect the emotional center added to the classification model by loss function; and then the text carries on the preliminary encoding using BLSTM, through the attention mechanism to improve text representation accuracy; in the text representation, value into the emotional center of the information through the emotion category vector and text representation distance vector and updated in the process of training model in the emotional center said, to make it more accurate. The invention focuses on improving the objective function, and the new objective function improves the text sentiment classification by using the limitation of the text emotion center, and improves the accuracy of text sentiment classification.

【技术实现步骤摘要】
基于情感中心的文本情感分类方法
本专利技术属于自然语言处理
,尤其涉及一种基于情感中心的文本情感分类方法。
技术介绍
随着互联网技术的发展,人们越来越倾向于在社交网站上发表自己对于产品、事件等的情感和观点。于是在这些社交网站中包含了大量富含情感的文本,对这些文本包含的情感信息进行挖掘对研究人员或商家都大有裨益。已经有很多研究致力于挖掘这些数据信息,情感分析的一个关键技术就是情感分类,就是将文本情感分为积极、中立和消极或者更细粒度的分类为非常积极、积极、中立、消极和非常消极。传统情感分类方法都是基于词典的方法或者基于机器学习的方法,现目前基于深度学习的分类技术取得了比传统分类法更好的效果。但是之前的基于深度学习的各种神经网络主要研究文本表征来区别不同评论文本的情感,这和正常的文本表征方法没有太大的区别,于是目前有很少一部分研究开始关注改善目标函数去提升特征工程的性能。
技术实现思路
本专利技术的目的在于关注改善目标函数而提出的一种基于情感中心的情感分类方法,新的目标函数利用文本情感中心的限制改善了文本情感分类,提升了文本情感分类的准确率。实现本专利技术目的的具体技术方案是:一种基于情本文档来自技高网...
基于情感中心的文本情感分类方法

【技术保护点】
一种基于情感中心的文本情感分类方法,其特征在于,该方法包括以下具体步骤:步骤1:情感中心约束的损失函数将文本向量与类别情感向量中心的距离加入损失函数,通过损失函数将情感中心的影响加入到分类模型中;步骤2:文本表征和注意力机制使用BLSTM将文本进行初步编码,通过注意力机制改善文本表示的准确度;在文本表征之上,通过情感类别向量与文本表征的距离值引入情感中心的信息,并在模型训练的过程中不断更新情感中心的实值向量表示,使其更加精准。

【技术特征摘要】
1.一种基于情感中心的文本情感分类方法,其特征在于,该方法包括以下具体步骤:步骤1:情感中心约束的损失函数将文本向量与类别情感向量中心的距离加入损失函数,通过损失函数将情感中心的影响加入到分类模型中;步骤2:文本表征和注意力机制使用BLSTM将文本进行初步编码,通过注意力机制改善文本表示的准确度;在文本表征之上,通过情感类别向量与文本表征的距离值引入情感中心的信息,并在模型训练的过程中不断更新情感中心的实值向量表示,使其更加精准。2.根据权利要求1所述的情感分类方法,其特征在于,所述将情感中心向量与文本表征的距离归入损失函数,采用学生t-分布来度量文本表征向量和...

【专利技术属性】
技术研发人员:王茂全陈诗韵吕钊
申请(专利权)人:华东师范大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1