基于动态梯度和多视图协同注意力的多模态情感分析方法技术

技术编号：37764836 阅读：11 留言：0更新日期：2023-06-06 13:23

本发明专利技术涉及情感分析技术领域，具体公开了一种基于动态梯度和多视图协同注意力的多模态情感分析方法，包括：获取具有情感信息的多模态数据；将多模态数据输入至多模态情感分析模型，获得情感分析结果，其中多模态情感分析模型的训练包括：将训练集数据进行模态表示学习以获得浅层学习特征；将浅层学习特征进行特征融合处理获得深层融合特征，以及进行动态梯度调节处理以获得梯度调节参数；根据深层融合特征进行模型预测以获得训练结果；根据验证集数据以及测试集数据重复上述训练过程，以获得多模态情感分析模型。本发明专利技术提供的基于动态梯度和多视图协同注意力的多模态情感分析方法在进行情感分析时能够既关注模态之间交互又能关注模态之间的平衡。能关注模态之间的平衡。能关注模态之间的平衡。

全部详细技术资料下载

【技术实现步骤摘要】
基于动态梯度和多视图协同注意力的多模态情感分析方法

[0001]本专利技术涉及情感分析
，尤其涉及一种基于动态梯度和多视图协同注意力的多模态情感分析方法。

技术介绍

[0002]在大数据时代，数据能带来很多价值。通过对互联网中的数据进行情感分析，能够在很多领域发挥重要的作用。在电商领域中，对消费者的评论进行情感分析，可以快速的了解市场对商品的反馈，为商家的经营和政府的科学监管提供技术支持。在人机交互领域中，机器人通过理解人的情感和意图能够做出更适合的反应，让机器人更好的服务人类。
[0003]传统情感分析的研究对象主要是单模态数据，特别是文本数据。例如，现有技术中通过构建包含基础情感词，场景情感词的情感词典，有效的实现了文本的情感分类。再如，通过使用朴素贝叶斯，最大熵分类和支持向量机三种机器学习方法，在电影评论数据集的情感分类任务中准确率达到了82.9％。或者以长短期记忆神经网络(Long Short
‑
term Memory,LSTM)和卷积神经网络(CNN)作为基础模型，提出C
‑
LSTM模型，既能捕捉短语局部特征，也能捕捉句子的全局语义和时态语义，在文本情感分析任务中取得优异的性能。
[0004]但是随着大数据时代的到来，人们可以表达情感的形式也越来越多样。单模态情感分析相较多模态情感分析，局限性越来越明显。许多研究都证实单模态情感分析在情感识别的准确率上低于多模态情感分析，尤其复杂情感的识别。而多模态模型在联合训练策略下优化了所有模态的统一学习目标，在...

【技术保护点】

【技术特征摘要】
1.一种基于动态梯度和多视图协同注意力的多模态情感分析方法，其特征在于，包括：获取具有情感信息的多模态数据，所述多模态数据的形式包括文本、音频和视频；将所述多模态数据输入至多模态情感分析模型，获得情感分析结果，其中所述多模态情感分析模型的训练包括：将训练集数据进行模态表示学习以获得浅层学习特征；将所述浅层学习特征进行特征融合处理获得深层融合特征，以及进行动态梯度调节处理以获得梯度调节参数，其中所述梯度调节参数用于辅助所述模态表示学习以更新获得的浅层学习特征；根据所述深层融合特征进行模型预测以获得训练结果；根据验证集数据以及测试集数据重复上述训练过程，以获得多模态情感分析模型；其中所述训练集数据、验证集数据和测试集数据均包括具有情感信息的多模态数据。2.根据权利要求1所述的基于动态梯度和多视图协同注意力的多模态情感分析方法，其特征在于，将训练集数据进行模态表示学习以获得浅层学习特征，包括：将文本训练集数据通过预训练BERT模型进行特征提取，获得文本浅层学习特征；将音频训练集数据和视频训练集数据均通过sLSTM模型进行特征提取，获得音频浅层学习特征和视频浅层学习特征。3.根据权利要求2所述的基于动态梯度和多视图协同注意力的多模态情感分析方法，其特征在于，将所述浅层学习特征进行特征融合处理获得深层融合特征，以及进行动态梯度调节处理以获得梯度调节参数，包括：将所述浅层学习特征通过多视图协同注意力网络以及LSTM实现特征融合处理，获得深层融合特征；将所述浅层学习特征值通过动态梯度调节策略实现梯度调节，并获得梯度调节参数。4.根据权利要求3所述的基于动态梯度和多视图协同注意力的多模态情感分析方法，其特征在于，将所述浅层学习特征通过多视图协同注意力网络以及LSTM实现特征融合处理，获得深层融合特征，包括：将每两个模态的浅层学习特征均进行多视图协同注意力处理，获得该两个模态基于对方注意力的特征；根据每个模态基于其他模态注意力的特征以及该模态的浅层学习特征通过LSTM进行处理获得深层融合特征。5.根据权利要求4所述的基于动态梯度和多视图协同注意力的多模态情感分析方法，其特征在于，将每两个模态的浅层学习特征均进行多视图协同注意力处理，获得该两个模态基于对方注意力的特征，包括：将每两个模态中一个模态的浅层学习特征通过非线性投影层投影到三个编码空间；将每两个模态中另一个模态的浅层学习特征与三个编码空间进行交互，并计算每两个模态...

【专利技术属性】
技术研发人员：孙俊，王香，
申请(专利权)人：匀熵智能科技无锡有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人