【技术实现步骤摘要】
情绪识别模型的训练方法、情绪识别方法、设备及介质
[0001]本专利技术涉及图像处理领域,特别涉及一种情绪识别模型的训练方法、情绪识别方法、设备及介质。
技术介绍
[0002]现有情绪识别技术大多依赖预训练的卷积神经模型来提取视觉特征,这样模型的结构大都固定,并且对新数据集的适应性较差。
[0003]此外,目前情绪识别技术大部分依赖性图像/视频中的单一的人脸信息,大量其他信息被忽略。
[0004]由此,一方面采集的数据没有得到充分利用,另一方面训练出来的模型对情绪识别的准确度有限。
技术实现思路
[0005]本专利技术要解决的技术问题是为了克服现有技术中情绪识别技术所使用的模型结构较为固定,并且训练的过程中采集的数据所利用的信息较为单一,导致采集的数据没有得到充分利用,另一方面训练出来的模型对情绪识别的准确度有限缺陷,提供一种基于新的模型结构,并且利用多种信息对新的模型结构中不同模块进行训练,从而可以有效提高情绪识别的准确性的情绪识别模型的训练方法、情绪识别方法、设备及介质。
[0006]本专利技术是通过下述技术方案来解决上述技术问题:
[0007]本专利技术提供了一种情绪识别模型的训练方法,其特征在于,所述情绪识别模型的训练方法基于F
‑
Transformer结构实现,所述F
‑
Transformer结构包括内容编码器、两个特征编码结构及标签解码器,所述两个特征编码结构分别与所述内容编码器串联;两个图像数据分别从所述两个特征编码结构 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种情绪识别模型的训练方法,其特征在于,所述情绪识别模型的训练方法基于F
‑
Transformer结构实现,所述F
‑
Transformer结构包括内容编码器、两个特征编码结构及标签解码器,所述两个特征编码结构分别与所述内容编码器串联;两个图像数据分别从所述两个特征编码结构输入,所述两个特征编码结构用于分别对所述两个图像数据进行特征提取以得到两个特征编码信息,所述内容编码器用于对所述两个特征编码信息进行融合处理以得到融合特征信息;所述标签解码器用于将所述融合特征信息作为输入并将对应的预设情绪标签作为输出进行模型训练以得到情绪识别模型;所述训练方法包括以下步骤:获取目标对象的训练集,所述训练集包括若干图像样本;对于每一图像样本,获取第一图像信息及第二图像信息;将所述第一图像信息及所述第二图像信息分别作为所述的F
‑
Transformer结构的两个特征编码结构的输入,所述图像样本对应的预设情绪信息作为输出进行模型训练以获取情绪识别模型。2.如权利要求1所述的情绪识别模型的训练方法,其特征在于,所述F
‑
Transformer结构还包括与所述内容编码器串联的标签解码器,所述标签解码器用于对所述融合特征信息及所述预设情绪信息所对应的语义信息进行解码处理。3.如权利要求1所述的情绪识别模型的训练方法,其特征在于,所述特征编码结构包括串联的W
‑
MSA编码器及SW
‑
MSA编码器。4.如权利要求1所述的情绪识别模型的训练方法,其特征在于,所述第一图像信息为人物信息;所述获取第一图像信息的步骤包括以下步骤:将所述图像样本输入至人物检测模型中以获取所述人物信息;和/或,所述第二图像信息为场景信息。5.如权利要求4所述的情绪识别模型的训练方法,其特征在于,所述情绪识别模型的训练方法基于N个所述F
‑
Transformer结构实现,n=1,2
…
N,n表示第n个F
‑
Transformer结构,所述将所述第一图像信息及所述第二图像信息分别作为所述的F
‑
技术研发人员:王晓梅,
申请(专利权)人:华院计算技术上海股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。