【技术实现步骤摘要】
一种基于注意力网络的跨模态情感分析方法
[0001]本专利技术涉及自然语言处理、计算机视觉领域及情感分析
,具体的说是涉及一种基于注意力网络的跨模态情感分析方法。
技术介绍
[0002]随着各类网络社交平台以及网络技术的发展,用户在网络上发表言论的方式更加多样化,越来越多的用户选择用视频、图片或者文章来表达自己的情感和观点。如何分析这些多模态信息当中蕴含的情感倾向、舆论导向成为情感分析领域所面临的挑战。然而,由于多模态数据的异构性和异步性,融合多模态信息并不容易。就异构性而言,不同模态存在不同的特征空间中。就异步性而言,不同模态的时间序列数据采样率不一致导致无法获得不同模态之间的最佳映射。现在已经有许多关于多模态分析的研究,具体方法可以归纳为以下两类:一种是采用跨模态注意力来提供不同模态之间的软映射,从而对多模式数据的异步性进行建模。然而,这类方法没有考虑多模态数据的异质性。另一类则考虑多模态数据异质性。这一类别中的方法将每个模态分为模态的共享部分和模态的私有部分,由不同的神经网络表示。这些方法的局限性在于它们没有考虑不同模式之间的异步性。
技术实现思路
[0003]为了解决多模态异构性和异质性的问题,本专利技术提出了一种基于注意力网络的跨模态情感分析方法,采用模态对齐模块以及模态更新模块,并利用注意力机制,进行跨模态交互,从而提高多模态情感分析的准确性。
[0004]为了达到上述目的,本专利技术是通过以下技术方案实现的:
[0005]本专利技术是一种基于注意力网络的跨模态情感分 ...
【技术保护点】
【技术特征摘要】
1.一种基于注意力网络的跨模态情感分析方法,其特征在于:所述跨模态情感分析方法包括以下步骤:步骤1:提取输入图片文本对应的图片特征,图片文本特征以及给定方面短语的方面特征;步骤2:提取的图片文本特征进入模态更新层,每个所述模态更新层包括一个用于对齐表示空间的模态对齐模块和两个模态更新模块,每个模态在所述模态对齐模块内对齐,对齐后进入所述模态更新模块,通过利用不同模态的相关性逐步补充,最终获得交互后的图片特征和文本特征;步骤3:将步骤2中所获得的交互后的图片特征和文本特征采用自注意力机制进行多模态融合,得到多模态特征;步骤4:将步骤1中的图片特征和图片文本特征与步骤3中的融合后的多模态特征进行concat操作,进行情感预测。2.根据权利要求书1所述的一种基于注意力网络的跨模态情感分析方法,其特征在于:所述步骤2具体包括如下步骤:步骤2.1:模态对齐模块在模态交互前对齐不同模态的特征空间,得到多模态信息;步骤2.2:对齐后的多模态信息进入模态更新模块,逐步增强每个模态,每个模态更新层包含两个模态更新模块和即文本更新模块和图片更新模块,在模态更新层的第一层采用了方面引导的注意力方法,具体过程如下:其中代表生成的目标模态的隐藏表征,I
A
代表方面特征向量,b
(1)
代表可学习参数,表示可变参数,表示模态向量;计算归一化注意权重:使用注意力权重对目标模态的特征向量进行加权平均,得到新的目标模态向量步骤2.3:为了捕捉不同模态间的双向交互,增强模态间的交互,模态更新模块引入了跨模态注意力机制以及自注意力机制,增强目标模态的具体过程如下:其中,*代表要增强的目标模态,α则代表补充模态,如果目标模态是文本,那补充模态则是图片,公式如下:则是图片,公式如下:
其中,SA
mul
,CMA
mul
和Att分表代表多头自注意力机制、多头跨模态注意力机制和归一化函数以及加性注意力机制,使用加性注意力机制,具体表示如下:函数以及加性注意力机制,使用加性注意力机制,具体表示如下:函数以及加性注意力机制,使用加性注意力机制,具体表示如下:其中G,W
c
,b
c
代表可学习参数,每个模态更新模块的权重都是通过加性注意力机制动态计算获得,从而达到两个模态间信息交互的目的,最终获得曾强后的多模态序列和3.根据权利要求书2所述的一种基于注意力网络的跨模态情感分析方法,其特征在于:所述步骤2.3中,为了学习多模态特征的深度抽象表征,采用GRU将交互注意力机制后的结果与当前层的输入结合起来,在第n层中首先使用跨模态注意力机制以及自注意力机制获得增强后的多模态序列,然后使用GRU获得新的文本和图片特征,具体过程如下:其中:SA
mul
代表多头自注意力机制,为目标模态向量,n代表层数。4.根据权利要求书1所述的一种基于注意力网络的跨模态情感分析方法,其特征在于:在所述步骤3,将步骤2中所获得的图片特征和文本特征采用自注意力机制进行多模态融合,具体表示如下:其中:均表示多模态序列,FC是融合多模态函数。5.根据权利要求书1所述的一种基于注意力网络的跨模态情感分析方法,其特征...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。