一种图像识别模型训练方法和装置制造方法及图纸

技术编号:39167479 阅读:11 留言:0更新日期:2023-10-23 15:05
本申请涉及图像识别技术领域,提供了一种图像识别模型训练方法、装置、电子设备及计算机可读存储介质。该方法包括获取目标面部图像训练集;提取上述目标面部图像中的面部语义特征,上述面部语义特征包括原图特征和翻转特征;将上述原图特征和上述翻转特征输入至面部表情识别模型,以便获得面部表情分类结果;依据第一损失函数迭代更新上述面部表情识别模型的参数,直至达到预设的迭代终止条件,以便获得经训练的上述面部表情识别模型,其中上述第一损失函数由一致性损失函数和分类损失函数确定。本申请可有效解决噪声数据对表情识别精度影响,提升表情识别精度。提升表情识别精度。提升表情识别精度。

【技术实现步骤摘要】
一种图像识别模型训练方法和装置


[0001]本申请涉及图像识别
,尤其涉及一种图像识别模型训练方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]面部表情是人际交往中信息传递的重要途径,在察觉人物情绪和分析人物话语含义等方面起到了非常重要的作用。随着人工智能深度学习方法的完善和普及,现有面部表情识别算法在识别准确率等方面取得了一定提升,但仍旧存在较大改进空间。特别是现有表情识别数据集中包含的两类噪声样本,对表情识别算法精度造成很大的影响。
[0003]因此,如何解决噪声样本对表情识别精度的影响,特别是如何通过优化识别模型不去拟合噪声样本,以便提高表情识别算法精度,是亟待解决的技术问题。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种图像识别模型训练方法、装置、电子设备及计算机可读存储介质,以解决现有技术在噪声场景下面部表情识别方法精度不高的问题。
[0005]本申请实施例的第一方面,提供了一种图像识别模型训练方法,包括:获取目标面部图像训练集;提取所述目标面部图像中的面部语义特征,所述面部语义特征包括原图特征和翻转特征;将所述原图特征和所述翻转特征输入至面部表情识别模型,以便获得面部表情分类结果;依据第一损失函数迭代更新所述面部表情识别模型的参数,直至达到预设的迭代终止条件,以便获得经训练的所述面部表情识别模型;其中所述第一损失函数由一致性损失函数和分类损失函数确定。
[0006]本申请实施例的第二方面,提供了一种图像识别模型训练装置,适用于第一方面所述的图像识别模型训练方法,所述装置包括:训练集获取模块,能够获取目标面部图像训练集;面部特征提取模块,能够提取所述目标面部图像中的面部语义特征,所述面部语义特征包括原图特征和翻转特征;面部表情识别模块,能够将所述原图特征和所述翻转特征输入至面部表情识别模型,以便获得面部表情分类结果;面部表情识别模型训练模块,能够依据第一损失函数迭代更新所述面部表情识别模型的参数,直至达到预设的迭代终止条件,以便获得经训练的所述面部表情识别模型;其中所述第一损失函数由一致性损失函数和分类损失函数确定。
[0007]本申请实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现第一方面
所述方法的步骤。
[0008]本申请实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现第一方面所述方法的步骤。
[0009]本申请实施例与现有技术相比存在的有益效果至少包括:本申请实施例通过获取目标面部图像训练集;提取目标面部图像中的面部语义特征,面部语义特征包括原图特征和翻转特征;将原图特征和翻转特征输入至面部表情识别模型,以便获得面部表情分类结果;依据第一损失函数迭代更新面部表情识别模型的参数,直至达到预设的迭代终止条件,以便获得经训练的面部表情识别模型,其中第一损失函数由一致性损失函数和分类损失函数确定。本申请的方法通过提取高层语义特征,以及通过Loss来约束网络对噪声数据的拟合,从而让网络学习到更加整体的全局特征,从而有利于表情识别方法优化,可有效解决噪声数据对表情识别精度影响,提升表情识别精度。
附图说明
[0010]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0011]图1是本申请实施例提供的图像识别模型训练方法的流程示意图之一;图2是本申请实施例提供的图像识别模型训练方法的流程示意图之二;图3是本申请实施例提供的面部特征提取过程示意图;图4是本申请实施例提供的图像识别模型结构示意图;图5是本申请实施例提供的图像识别模型训练方法的流程示意图之三;图6是本申请实施例提供的本申请实施例中基于一致性约束的注意力机制工作过程示意图;图7是本申请实施例提供的图像识别模型训练装置的结构示意图;图8是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0012]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
[0013]下面将结合附图详细说明根据本申请实施例的一种图像识别模型训练方法、装置、电子设备和存储介质。
[0014]实施例一如
技术介绍
所述,目前图像分类与深度学习的关系密不可分,而面部表情识别又是图像分类的子任务,将基于深度学习的方法与面部表情识别结合,相较于传统的基于机器学习的表情识别方法有许多益处。首先,基于机器学习的面部表情识别方法中特征提取与特征分类是两个独立的步骤,需要分别进行独立研究,而在深度学习中特征提取与特征
分类是在同一个方法中进行设计与优化的,可以简化方法,降低方法的复杂度。其次,传统的机器学习方法中进行特征提取依赖于手动提取特征,这种手动方式不仅繁琐而且提取的特征也容易受人为因素的干扰,而在深度学习中是由对图像具有较好提取特征能力的神经网络自动提取特征,这使得基于深度学习的面部表情识别方法具有更好的特征表达能力。基于深度学习的面部表情识别方法中最常见的网络是卷积神经网络。
[0015]随着深度学习的进一步发展,基于卷积神经网络的面部表情识别方法已经有了很大的发展,特别是关注于如何设计一个有效的模型网络结构。为了更好的发挥深度学习在面部表情识别这项任务上的优势,在不改变网络模型本身架构的前提下对卷积神经网络进行了改进以提高网络的特征表达能力,其中较为合适的方法就是引入注意力机制或者使用改进的激活函数或损失函数。在图像分类中需要关注输入的特征图与上下文相关的特征,即注意力机制,可以用于解决面部表情识别中的姿势和遮挡问题。专利技术人在既有的公开资料中,检索到有的方法使用三个模块,即特征提取、自注意力和关系注意力模块,通过结合注意力机制以及关系网络,在姿势和遮挡变化的条件下实现了比较理想的性能。也有的公开方法提出了基于注意力机制的卷积神经网络,分别对原始图像和局部二值模式图像进行特征提取,然后利用注意力机制对特征进行二次处理,随后进行图像重构,最后对重构的图像进行表情分类任务。注意力机制可以使神经网络忽略无关信息而专注于有效信息,可以通过注意力机制提出了空间变换器模块,将图像的空间域信息变换到另一个相对应的空间,从而提取图像中的感兴趣区域。专利技术人检索到既有公开方法提出了卷积块注意力模块,将空间注意力和通道注意力进行有效结合的注意力机制模块;也有公开资料将卷积块注意力模块以解决网络特征提取能力不足的问题并验证了该方法的可行性与有效性。
[0016]对于卷本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型训练方法,其特征在于,包括:获取目标面部图像训练集;提取所述目标面部图像中的面部语义特征,所述面部语义特征包括原图特征和翻转特征;将所述原图特征和所述翻转特征输入至面部表情识别模型,以便获得面部表情分类结果;依据第一损失函数迭代更新所述面部表情识别模型的参数,直至达到预设的迭代终止条件,以便获得经训练的所述面部表情识别模型;其中所述第一损失函数由一致性损失函数和分类损失函数确定。2.根据权利要求1所述的方法,其特征在于,所述翻转特征包括水平翻转特征和垂直翻转特征;以及,提取所述目标面部图像中的面部语义特征的过程,包括:对所述目标面部图像分别进行水平翻转和垂直翻转,获得水平翻转图像和垂直翻转图像;分别输入所述目标面部图像、所述水平翻转图像和所述垂直翻转图像至同一深度学习神经网络,以获得对应的所述原图特征、所述水平翻转特征和所述垂直翻转特征,其中所述深度学习神经网络能够提取图像语义特征包括ResNet50。3.根据权利要求2所述的方法,其特征在于,所述面部表情识别模型包括注意力学习单元和分类识别单元;以及,将所述原图特征和所述翻转特征输入至面部表情识别模型,以便获得面部表情分类结果的过程,包括:分别输入所述原图特征、所述水平翻转特征和所述垂直翻转特征至所述注意力学习单元,对应获得原图增强特征图、水平增强特征图和垂直增强特征图;输入所述原图增强特征图至所述分类识别单元,获得所述目标面部图像的表情分类概率。4.根据权利要求3所述的方法,其特征在于,基于所述水平增强特征图和所述原图增强特征图,确定第一一致性损失函数;以及,基于所述垂直增强特征图和所述原图增强特征图,确定第二一致性损失函数;以及,基于所述表情分类概率,确定分类损失函数。5.根据权利要求3所述的方法,其特征在于,所述注意力学习单元依次包括全局平均池化层、全连接层和Sigmoid层;和/或,所述分类识别...

【专利技术属性】
技术研发人员:蒋召黄泽元
申请(专利权)人:深圳须弥云图空间科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1