一种混合特征融合和决策融合的多模态情感识别方法技术

技术编号：28463651 阅读：20 留言：0更新日期：2021-05-15 21:29

一种混合特征融合和决策融合的多模态情感识别方法，属于模式识别和情感识别领域。本发明专利技术实现方法为：一、使用卷积神经网络框架构建图像情感识别网络，获取图像特征以及图像情感状态；二、使用循环神经网络框架构建文本情感识别网络，获取文本特征以及文本情感状态；三、构建多模态信息融合情感识别网络，构建主分类器用于融合图像情感状态和文本情感状态并获取主情感分类，构建辅助分类器用于融合图像特征与文本特征并获取辅助情感分类，融合主情感分类与辅助情感分类获得最终情感分类。本发明专利技术利用多模态信息间的信息互补，避免单模态信息由于信息模糊或缺失等因素导致的情感识别准确率低问题，为多模态数据融合及情感识别提供新思路。提供新思路。提供新思路。

全部详细技术资料下载

【技术实现步骤摘要】
一种混合特征融合和决策融合的多模态情感识别方法

[0001]本专利技术涉及数据融合、神经网络、情感识别等领域，更具体地，涉及一种基于混合融合的多模态信息融合情感识别方法。

技术介绍

[0002]人类通过诸如表情、姿态、声音、语言等多种模态表达情感信息，情感行为是反映人类满意度的重要指标。随着人工智能技术的发展，情感识别是实现良好人机交互的重要手段。情感识别是通过提取情感信号的特征，获得情感的外在表象特征与内在情感状态的映射关系，从而识别被识别对象的内在情感类型。情感识别在机器服务、健康医疗、远程教育、无人驾驶等领域都有非常广阔的应用前景。
[0003]模态是一种表征信息的方式，如图像、文字、声音等。多模态即两个或者两个以上的模态的各种形式的组合。同一个对象具有不同模态的表述，不同模态信息之间既相互独立又具有潜在的关联性。目前，情感识别主要通过采集、分析单一模态情感信息，获取被测者的情感状态。由于单一模态信息抗干扰能力较弱，且易掺杂一些冗余信号或缺失部分信息，会造成分类识别的准确率低甚至分类错误。
[0004]人类的认知过程是多模态的，个体通过视觉、听觉乃至触觉等信号对场景进行感知，通过对信息的融合处理和语义理解获取情感等高维信息。多模态信息融合旨在模仿人类感知理解过程，通过建立能够处理、关联和推理来自多个模态信息的模型，利用模态信息间的互补性，捕捉不同模态信息间的潜在关联，实现剔除模态中冗余信息或者补充某一模态缺失信息的目的。
[0005]多模态融合根据融合的层次，主要分为三个方面：数据级融合...

【技术保护点】

【技术特征摘要】
1.一种混合特征融合和决策融合的多模态情感识别方法，其特征在于：包括步骤如下，步骤1：基于卷积神经网络(CNN)框架构建图像情感识别网络，通过堆叠的卷积结构对图像信息进行特征提取，具有捕捉多维度特征的能力，进而获取图像特征，并分类获取图像信息情感状态；步骤2：基于循环神经网络(RNN)框架构建文本情感识别网络。RNN将前一个节点的输出作为下一个节点的输入，实现了RNN的记忆功能，从而使模型能够更好的对长文本信息进行特征提取，并识别文本信息情感状态；步骤3：构建混合融合的多模态信息融合网络。使用主分类器对图像情感标签与文本情感标签进行决策级融合，获得融合后的主分类结果。使用辅助分类器对图像特征与文本特征进行特征级融合，获得辅助分类结果。融合主分类结果和辅助分类结果获取最终的情感状态。构建特征融合层与决策融合层，综合利用两种模态信息间的相关性与互补性，实现最终的情感识别与分类任务。2.如权利要求1所述的一种混合特征融合和决策融合的多模态情感识别方法，其特征在于：步骤1的实现方法为，使用卷积神经网络(CNN)构建一个图像情感识别网络，用于提取图像特征并获取情感分类。该部分可采用多种图像特征提取网络，如VGGnet、Resnet等。将图像数据以大小为(B,C,H,W)的格式，输入图像情感识别取网络，其中B为批次大小(Batch size)，即同时输入的图片信息张数；C为图像通道数，如彩色图像为RGB三通道，灰度图为单通道；H和W分别为图像的高度和宽度。网络提取图像特征I1，将I1送入全连接层并获取最终的图像信息情感状态I，I为[batch_size,num_class]维度的向量，num_class是预测的类别数。3.如权利要求1所述的一种混合特征融合和决策融合的多模态情感识别方法，其特征在于：步骤2的实现方法为，使用循环神经网络(RNN)构建一个文本情感识别网络，用于提取文本特征并获取情感分类。该部分可采用多种文本特征提取框架，如LSTM、BiLSTM等主流框架。对于文本数据，将文本中的每个单词输入至词嵌入层编码得到词向量，网络模型的输入维度为[batch_size,seq_len]，其中batch_size为批次文本的大小，seq_len为句子的长度。在经过指定词嵌入层后随机初始化，词向量维度为[batch_size,seq...

【专利技术属性】
技术研发人员：刘兴旺，廣田薰，程智鹏，李文龙，戴亚平，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人