目标情感分析的方法、模型训练方法、介质和设备技术

技术编号:24683793 阅读:24 留言:0更新日期:2020-06-27 08:04
本公开涉及自然语言处理技术领域,提供了一种目标情感分析的方法及装置、目标情感分析模型训练方法及装置,以及计算机存储介质和电子设备。其中,目标情感分析的方法包括:对于待测语句中每个词,获取当前词的词向量、获取用于表示当前词的全局语义信息的文本向量,以及获取用于表示当前词在待测语句中位置信息的位置向量;对待测语句中的每个词的:词向量、文本向量和位置向量进行编码,得到待测语句的语义向量;获取待测语句中目标词对应的目标向量;根据语义向量和目标向量预测目标词的情感极性类别。本技术方案有利于提升对目标词的情感极性类别的预测准确度。

Methods, model training methods, media and equipment of target emotion analysis

【技术实现步骤摘要】
目标情感分析的方法、模型训练方法、介质和设备
本公开涉及自然语言处理
,具体而言,涉及一种目标情感分析(TargetedSentimentAnalysis,简称:TSA)的方法及装置、TSA模型训练方法及装置,以及计算机存储介质和电子设备。
技术介绍
TSA任务是确定语句中目标词的情感极性类别,例如,对于语句“这家餐厅的食品很好吃,但是服务比较差。”对于其中的目标词“食品”的情感极性类别为积极类型,对于另一个目标词“服务”的情感极性类别为消极类型。随着机器学习技术的发展,机器学习技术可被用于解决TSA任务。现有技术中,通过卷积神经网络对语句以及语句中的目标词进行特征提取,以通过提取到的特征实现对目标词的情感极性类别的预测。然而,相关技术提供的目标情感分析的方案的预测准确度有待提高。需要说明的是,上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解。
技术实现思路
本公开的目的在于提供一种TSA的方法及装置、TSA模型训练方法及装置,以及计算机存储介质和电子设备,进而至少在一定程度上提升对目标词的情感极性类别的预测准确度。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一个方面,提供一种目标情感分析的方法,包括:对于待测语句中每个词,获取当前词的词向量、获取用于表示上述当前词的全局语义信息的文本向量,以及获取用于表示上述当前词在上述待测语句中位置信息的位置向量;对上述待测语句中的每个词的:词向量、文本向量和位置向量进行编码,得到上述待测语句的语义向量;获取上述待测语句中目标词对应的目标向量;根据上述语义向量和上述目标向量预测上述目标词的情感极性类别。根据本公开的一个方面,提供一种目标情感分析的装置,包括:包括:第一向量获取模块、向量编码模块、第二向量获取模块,以及情感极性分类模块。其中:上述第一向量获取模块,被配置为:对于待测语句中每个词,获取当前词的词向量、获取用于表示上述当前词的全局语义信息的文本向量,以及获取用于表示上述当前词在上述待测语句中位置信息的位置向量;上述向量编码模块,被配置为:对上述待测语句中的每个词的:词向量、文本向量和位置向量进行编码,得到上述待测语句的语义向量;上述第二向量获取模块,被配置为:获取上述待测语句中目标词对应的目标向量;上述情感极性分类模块,被配置为:根据上述语义向量和上述目标向量预测上述目标词的情感极性类别。在本公开的一些实施例中,基于前述方案,上述待测语句中包含一个或多个目标词。在本公开的一些实施例中,基于前述方案,上述向量编码模块,包括:注意力机制处理单元、残差连接单元、标准化处理单元以及线性转换单元。其中:上述注意力机制处理单元,被配置为:通过注意力机制处理上述待测语句中的每个词的:词向量、文本向量和位置向量,得到第一处理向量;上述残差连接单元,被配置为:将上述待测语句中的每个词的:词向量、文本向量和位置向量,与上述第一处理向量进行残差连接,得到第二处理向量;上述标准化处理单元,被配置为:标准化处理上述第二处理向量,得到第三处理向量;上述线性转换单元,被配置为:对上述第三处理向量进行线性转换处理,得到上述待测语句的语义向量。在本公开的一些实施例中,基于前述方案,上述向量编码模块,具体被配置为:通过遮蔽语言模型方式和下一语句预测方式预训练深度学习模型;通过预训练后的深度学习模型对上述待测语句中的每个词的:词向量、文本向量和位置向量进行编码,得到上述待测语句的语义向量。在本公开的一些实施例中,基于前述方案,上述第二向量获取模块,具体被配置为:对上述待测语句中的目标词进行词嵌入处理,得到上述目标向量。在本公开的一些实施例中,基于前述方案,上述情感极性分类模块,包括:第一全连接处理单元、第二全连接处理单元和预测单元。其中:上述第一全连接处理单元,被配置为:对上述语义向量和上述目标向量进行第一全连接处理,得到全连接向量;上述第二全连接处理单元,被配置为:结合上述目标向量,对上述全连接向量进行第二全连接处理,以得到待测向量;上述预测单元,被配置为:根据上述待测向量预测上述目标词的情感极性类别。在本公开的一些实施例中,基于前述方案,上述第二全连接处理单元,具体被配置为:对第i次全连接处理之后的全连接向量和上述目标向量进行求和处理,并对求和处理之后的向量进行第i+1次全连接处理,其中,i取值为正整数。在本公开的一些实施例中,基于前述方案,上述预测单元,具体被配置为:对上述待测向量进行归一化处理,得到上述目标词的情感极性类别。在本公开的一些实施例中,基于前述方案,上述第一向量获取模块,被具体配置为:对上述待测语句中的当前词进行词嵌入处理,得到上述当前词的词向量。在本公开的一些实施例中,基于前述方案,上述情感极性类别,包括:积极、中立和消极。根据本公开的一个方面,提供一种目标情感分析模型的训练方法,该方法包括:对于样本语句中每个词,获取当前词的词向量、获取用于表示所述当前词的全局语义信息的文本向量,以及获取用于表示所述当前词在所述样本语句中位置信息的位置向量;对所述样本语句中的每个词的:词向量、文本向量和位置向量进行编码,得到所述样本语句的语义向量;获取所述样本语句中目标词对应的目标向量;以及将所述语义向量和所述目标向量输入目标情感分析模型,得到所述样本语句中目标词的预测情感极性,并基于所述预测情感极性和所述目标词的实际情感极性训练所述目标情感分析模型。根据本公开的一个方面,提供一种目标情感分析模型的训练装置,该装置包括:第三向量获取模块、向量编码模块、第四向量获取模块以及模型训练模块。其中:上述第三向量获取模块,被配置为:对于样本语句中每个词,获取当前词的词向量、获取用于表示上述当前词的全局语义信息的文本向量,以及获取用于表示上述当前词在上述样本语句中位置信息的位置向量;上述向量编码模块,被配置为:对上述样本语句中的每个词的:词向量、文本向量和位置向量进行编码,得到上述样本语句的语义向量;上述第四向量获取模块,被配置为:获取上述样本语句中目标词对应的目标向量;以及上述模型训练模块,被配置为:将上述语义向量和上述目标向量输入目标情感分析模型,得到上述样本语句中目标词的预测情感极性,并基于上述预测情感极性和上述目标词的实际情感极性训练上述目标情感分析模型根据本公开的一个方面,提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的目标情感分析的方法,或实现第三方面所述的目标情感分析模型的训练方法。根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述本文档来自技高网...

【技术保护点】
1.一种目标情感分析的方法,其特征在于,所述方法包括:/n对于待测语句中每个词,获取当前词的词向量、获取用于表示所述当前词的全局语义信息的文本向量,以及获取用于表示所述当前词在所述待测语句中位置信息的位置向量;/n对所述待测语句中的每个词的:词向量、文本向量和位置向量进行编码,得到所述待测语句的语义向量;/n获取所述待测语句中目标词对应的目标向量;/n根据所述语义向量和所述目标向量预测所述目标词的情感极性类别。/n

【技术特征摘要】
1.一种目标情感分析的方法,其特征在于,所述方法包括:
对于待测语句中每个词,获取当前词的词向量、获取用于表示所述当前词的全局语义信息的文本向量,以及获取用于表示所述当前词在所述待测语句中位置信息的位置向量;
对所述待测语句中的每个词的:词向量、文本向量和位置向量进行编码,得到所述待测语句的语义向量;
获取所述待测语句中目标词对应的目标向量;
根据所述语义向量和所述目标向量预测所述目标词的情感极性类别。


2.根据权利要求1所述的目标情感分析的方法,其特征在于,所述待测语句中包含一个或多个目标词。


3.根据权利要求1所述的目标情感分析的方法,其特征在于,所述对所述待测语句中的每个词的:词向量、文本向量和位置向量进行编码,得到所述待测语句的语义向量,包括:
通过注意力机制处理所述待测语句中的每个词的:词向量、文本向量和位置向量,得到第一处理向量;
将所述待测语句中的每个词的:词向量、文本向量和位置向量,与所述第一处理向量进行残差连接,得到第二处理向量;
标准化处理所述第二处理向量,得到第三处理向量;
对所述第三处理向量进行线性转换处理,得到所述待测语句的语义向量。


4.根据权利要求1所述的目标情感分析的方法,其特征在于,所述对所述待测语句中的每个词的:词向量、文本向量和位置向量进行编码,得到所述待测语句的语义向量,包括:
通过遮蔽语言模型方式和下一语句预测方式预训练深度学习模型;
通过预训练后的深度学习模型对所述待测语句中的每个词的:词向量、文本向量和位置向量进行编码,得到所述待测语句的语义向量。


5.根据权利要求1所述的目标情感分析的方法,其特征在于,所述获取所述待测语句中目标词对应的目标向量,包括:
对所述待测语句中的目标词进行词嵌入处理,得到所述目标向量。


6.根据权利要求1至5中任意一项所述的目标情感分析的方法,其特征在于,所述根据所述语义向量和所述目标向量预测所述目标词的情感极性类别,包括:
对所述语义向量和所述目标向量进行第一全连接处理,得到全连接向量;
结合所述目标向量,对所述全连接向量进行第二全连接处理,以得到待测向量;
根据所述待测向量预测所述目标词的情感极性类别。


7.根据权利要求6所述的目标情感分析的方法,其特征在于,所述结合所述目标向量,对所述全连接向量进行全连接处理,包括:
对第i次全连接处理之后的全连接向量和所述目标向量进行求和处理,并对求和处理之后的向量进行第i+1次全连接处理,其中,i取值为正整数。


8.根据权利要求6所述的目标情感分析的方法,其特征在于,所述根据所述待测向量预测所述目标词的情感极性类别,包括:
对所述待测向量进行归一化处理,得到所述目标词的情感极性类别。


9.根据权利要求6所述的目标情感分析的方法,其特征在于,所述获...

【专利技术属性】
技术研发人员:刘巍
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1