当前位置: 首页 > 专利查询>山东大学专利>正文

基于自适应注意力机制的句子级情感预测方法及系统技术方案

技术编号:24456277 阅读:27 留言:0更新日期:2020-06-10 15:38
本发明专利技术公开了一种基于自适应注意力机制的句子级情感预测方法及系统,包括:利用双向LSTM网络提取每个句子的前序特征信息和后序特征信息,将上下文特征信息整合到每个句子中,然后借用自注意机制,用不同的权重表示其他句子对目标句子的影响,其目的是给与情感极性关联度高的句子赋予较大的权重值,而对与情感极性不相关的句子赋予较小的权重值。本发明专利技术能有效的获得句子的特征表达,并具有较高的分类精度高,且算法的运行效率高,具有较强的实用性和有效性。

Sentence level emotion prediction method and system based on adaptive attention mechanism

【技术实现步骤摘要】
基于自适应注意力机制的句子级情感预测方法及系统
本专利技术涉及人工智能文本挖掘
,尤其涉及一种基于自适应注意力机制的句子级情感预测方法及系统。
技术介绍
本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。随着电子信息时代的发展,情感分类作为一门热门的研究课题,被广泛应用于电子商务系统和意见调查中的有用信息的提取,大大提高了情感分析的准确性。由于情感分类可以获得大量有价值的信息,如进行知识图谱中的知识发现和推理,以及电子商务中的服务推荐等,因此情感分类在自然语言处理领域得到了广泛的应用。然而,基于文本的情感分类却存在很多问题,比如文本较长时,信息挖掘的能力减弱造成文本信息缺失;或在分析文本时,无法结合上下文信息挖掘文本间的相互依赖关系。基于此,一方面,研究学者致力于利用长-短期记忆网络(LongShortTermMemory,LSTM)来解决长期依赖性问题,然而,这种记忆通常以整句或几个关键词作为输入,从而忽略了文本语义连接,导致重要信息的丢失。另一方面,LSTM也受到文本序列信息传播的限制,单向的本文档来自技高网...

【技术保护点】
1.一种基于自适应注意力机制的句子级情感预测方法,其特征在于,包括:/n对带预测文本的句子组成进行分词、去停处理;/n对句子的单词嵌入表达进行特征提取,得到每个句子的特征表达;/n抽取同一序列文本的前向及后向的信息传递,得到融合文本序列信息的句子特征表达;/n基于每个句子的查询向量与所有一致向量之间的相关性,确定目标句子特征向量与其他句子特征向量间相关性的权重,获得融合其他句子情感影响的句子特征表达;/n基于得到的句子特征进行情感极性预测。/n

【技术特征摘要】
1.一种基于自适应注意力机制的句子级情感预测方法,其特征在于,包括:
对带预测文本的句子组成进行分词、去停处理;
对句子的单词嵌入表达进行特征提取,得到每个句子的特征表达;
抽取同一序列文本的前向及后向的信息传递,得到融合文本序列信息的句子特征表达;
基于每个句子的查询向量与所有一致向量之间的相关性,确定目标句子特征向量与其他句子特征向量间相关性的权重,获得融合其他句子情感影响的句子特征表达;
基于得到的句子特征进行情感极性预测。


2.如权利要求1所述的一种基于自适应注意力机制的句子级情感预测方法,其特征在于,基于单向的LSTM网络对句子的单词嵌入表达进行特征提取,以得到每个句子的特征表达。


3.如权利要求1所述的一种基于自适应注意力机制的句子级情感预测方法,其特征在于,利用双向的LSTM网络处理每个句子的特征向量,抽取同一序列文本的前向及后向的信息传递,得到融合文本序列信息的句子特征表达。


4.如权利要求1所述的一种基于自适应注意力机制的句子级情感预测方法,其特征在于,每个句子的查询向量与所有一致向量之间的相关性的确定方法为:
计算文本中每个句子的一致向量;
采用双曲正切函数将句子对应的一致向量投影到(-1,+1)之间;
计算每个句子的查询向量,将上述得到的映射值分别与查询向量相乘;
基于所述乘积计算目标句子的特征向量与其他句子特征向量间相关性的权重。


5.如权利要求1所述的一种基于自适应注意力机制的句子级情感预测方法,其特征在于,获得融合其他句子情感影响的句子特征表达,具体为:



其中,αij表示第j个句子对第i个句子的情感影响值,表示第l-th个文本中第t个句子的特征表达,t=1,2,…,M。


6.如权利要求1所述的一种基于自适应注意力机制的句...

【专利技术属性】
技术研发人员:周风余刘美珍贺家凯孙鸿昌
申请(专利权)人:山东大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1