一种文本情感识别方法及装置制造方法及图纸

技术编号:23764600 阅读:64 留言:0更新日期:2020-04-11 19:10
本发明专利技术公开了一种文本情感识别方法及装置,用以解决现有的基于神经网络模型的文本情感识别方法识别准确率低的问题。所述文本情感识别方法,包括:获取待识别文本;根据预设情感识别模型对所述待识别文本进行情感识别,其中,所述预设情感识别模型是根据预设情感分类训练集的文本中的每一个词的情感特征向量和第一预设神经网络模型训练获得的,所述词的情感特征向量是根据所述词的语义特征向量获得的。

A text emotion recognition method and device

【技术实现步骤摘要】
一种文本情感识别方法及装置
本专利技术涉及情感识别
,尤其涉及一种文本情感识别方法及装置。
技术介绍
在自然语言处理领域,情感识别一直是非常重要的任务之一。文本的情感识别是对带有情感色彩的主观性文本进行分析和处理,从而获取用户在文字中所包含的情感倾向,如积极、消极或中性等。目前,中文文本情感识别技术在电商、电影等多个领域的评论分析中应用广泛,同时,在热门话题分析、舆情监控以及消费行为分析等众多任务中发挥着巨大的作用。现有的通用的神经网络模型方法,一般是使用预处理的词向量或者字向量作为模型的输入,但是忽略了向量特征的不可靠性,由于低频词在训练语料中很少或者从未出现,在预测的过程中,无法很恰当地对其进行特征表示,因此,训练得到的向量特征中包含的信息是不可靠的,将会降低情感识别的准确率。在情感识别任务中,不管是电影评论分析、商品评价分析还是舆情分析任务,都面临同样的问题,即文本中包含大量的复杂实体名称,如各种各样的电影名、商品名、话题等,由于这些实体名称本质上是由中文字符的排列组合生成的,因此,给这类文本的情感识别增加了难度。<本文档来自技高网...

【技术保护点】
1.一种文本情感识别方法,其特征在于,包括:/n获取待识别文本;/n根据预设情感识别模型对所述待识别文本进行情感识别,其中,所述预设情感识别模型是根据预设情感分类训练集的文本中的每一个词的情感特征向量和第一预设神经网络模型训练获得的,所述词的情感特征向量是根据所述词的语义特征向量获得的。/n

【技术特征摘要】
1.一种文本情感识别方法,其特征在于,包括:
获取待识别文本;
根据预设情感识别模型对所述待识别文本进行情感识别,其中,所述预设情感识别模型是根据预设情感分类训练集的文本中的每一个词的情感特征向量和第一预设神经网络模型训练获得的,所述词的情感特征向量是根据所述词的语义特征向量获得的。


2.如权利要求1所述的方法,其特征在于,所述词的情感特征向量是根据所述词的语义特征向量和所述词的上下文特征向量获得的;
针对所述预设情感分类训练集的文本中的每一个词,所述词的情感特征向量通过以下步骤获得:
根据所述词的词向量和组成所述词的字的字向量,按照第一预设规则进行组合,获得所述词的语义特征向量,其中,所述词的词向量为根据第二预设神经网络模型对预设训练语料的文本中的所述词进行预训练获得的,所述字的字向量为根据第三预设神经网络模型对所述预设训练语料的文本中的所述字进行预训练获得的;
根据所述词的语义特征向量和预设窗口确定所述词的上下文特征向量;
根据所述词的语义特征向量和所述词的上下文特征向量,按照第二预设规则进行组合,获得所述词的情感特征向量。


3.如权利要求2所述的方法,其特征在于,针对所述预设情感分类训练集的文本中的每一个词,根据所述词的词向量和组成所述词的字的字向量,按照第一预设规则进行组合,获得所述词的语义特征向量,具体包括:
按照以下公式计算所述词的语义特征向量:



其中,表示将两个向量拼接起来;
wp表示所述预设情感分类训练集的文本中的第p个词;
cp,q表示组成所述预设情感分类训练集的文本中的第p个词的第q个字;

表示所述预设情感分类训练集的文本中的第p个词的语义特征向量,p=1,2,......,n,n表示所述预设情感分类训练集的文本中的词的总数量;

表示所述预设情感分类训练集的文本中的第p个词的词向量,表示的权重;

表示组成所述预设情感分类训练集的文本中的第p个词的第q个字的字向量,表示的权重。


4.如权利要求2或3所述的方法,其特征在于,针对所述预设情感分类训练集的文本中的每一个词,根据所述词的语义特征向量和预设窗口确定所述词的上下文特征向量,具体包括:
按照以下公式计算所述词的上下文特征向量:



其中,表示所述预设情感分类训练集的文本中的第p个词的上下文特征向量;
windows表示预设的窗口的值;
当-windows≤k≤windows且k≠0时,表示所述预设情感分类训练集的文本中的第p个词的预设窗口内下标为p+k的词的语义向量,weightp+k表示的权重。


5.如权利要求4所述的方法,其特征在于,针对所述预设情感分类训练集的文本中的每一个词,根据所述词的语义特征向量和所述词的上下文特征向量,按照第二预设规则进行组合,获得所述词的情感特征向量,具体包括:
按照以下公式计算所述词的情感特征向量:



其中,vp表示所述预设情感分类训练集的文本中的第p个词的情感特征向量;

表示所述预设情感分类训练集的文本中的第p个词的语义特征向量,表示的权重;

表示所述预设情感分类训练集的文本中的第p个词的上下文特征向量,表示的权重。


6.一种文本情感识别装置,其特征在于,包括...

【专利技术属性】
技术研发人员:胡晓慧苏少炜陈孝良常乐
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1