表情识别模型的训练方法和装置制造方法及图纸

技术编号：40138103 阅读：8 留言：0更新日期：2024-01-23 23:11

本公开涉及图像表情识别技术领域，提供了一种表情识别模型的训练方法和装置。该方法包括：对训练图像进行水平翻转处理，得到对应的多个翻转后图像；将训练图像和翻转后图像进行一致性学习，得到一致性损失值；基于训练图像对应的图像识别结果和对应的标签，计算得到第一交叉熵损失值；基于翻转后图像对应的图像识别结果和对应的标签，计算得到第二交叉熵损失值；确定目标损失值，并根据目标损失值更新表情识别模型的参数；在目标损失值小于或等于预设值时，得到训练完成的表情识别模型，解决现有技术中表情识别数据集中的噪声标注数据降低表情识别模型的准确性的问题，提高模型的泛化性能。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及图像表情识别，尤其涉及一种表情识别模型的训练方法和装置。

技术介绍

1、随着互联网技术的快速发展，表情识别开始应用于众多领域中。表情识别是计算机理解人类情感的一个重要方向，也是实现人机交互的一个重要领域。表情识别可以指从静态照片或视频序列中确定出人物的表情状态，确定人物的表情类别，从而确定人物的情绪与心理变化。现有的表情识别模型的训练过程为利用表情识别训练集的监督训练过程，在训练之前，需要对表情识别训练集进行标注。现有的公开表情识别数据集中均存在噪声标注数据，在训练过程中，噪声标注数据会影响表情识别模型的准确性，可以导致训练得到的表情识别模型过拟合。但如果去除训练过程中的大损失样本，即过滤了部分难例样本，可能影响模型的泛化性能。

技术实现思路

1、有鉴于此，本公开实施例提供了一种表情识别模型的训练方法、装置、电子设备及可读存储介质，以解决现有技术中表情识别数据集中的噪声标注数据降低表情识别模型的准确性的问题。

2、本公开实施例的第一方面，提供了一种表情识别模型的训练方法，包括：获取表情识别训练集，表情识别训练集包括多张训练图像和训练图像对应的标签；对各个训练图像进行水平翻转处理，得到对应的多个翻转后图像；将各个训练图像和各个翻转后图像输入至表情识别模型，根据各个训练图像的特征向量和各个翻转后图像的特征向量进行一致性学习，得到一致性损失函数对应的各个一致性损失值；根据各个训练图像的特征向量，确定各个训练图像对应的图像识别结果；基于各个训练图像对应的图像识别结果和

3、本公开实施例的第二方面，提供了一种表情识别模型的训练装置，包括：获取模块，用于获取表情识别训练集，表情识别训练集包括多张训练图像和训练图像对应的标签；翻转模块，用于对各个训练图像进行水平翻转处理，得到对应的多个翻转后图像；一致性学习模块，用于将各个训练图像和各个翻转后图像输入至表情识别模型，根据各个训练图像的特征向量和各个翻转后图像的特征向量进行一致性学习，得到一致性损失函数对应的各个一致性损失值；第一确定模块，用于根据各个训练图像的特征向量，确定各个训练图像对应的图像识别结果；第一计算模块，用于基于各个训练图像对应的图像识别结果和各个训练图像对应的标签，计算得到交叉熵损失函数对应的各个第一交叉熵损失值；第二确定模块，用于根据各个翻转后图像的特征向量，确定各个翻转后图像对应的图像识别结果；第二计算模块，用于基于各个翻转后图像对应的图像识别结果和各个翻转后图像对应的标签，计算得到交叉熵损失函数对应的各个第二交叉熵损失值；更新模块，用于基于各个一致性损失值、各个第一交叉熵损失值和各个第二交叉熵损失值，确定各个目标损失值，并根据各个目标损失值更新表情识别模型的参数；结束模块，用于在目标损失值小于或等于预设值时，得到训练完成的表情识别模型。

4、本公开实施例的第三方面，提供了一种电子设备，包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述方法的步骤。

5、本公开实施例的第四方面，提供了一种可读存储介质，该可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述方法的步骤。

6、本公开实施例与现有技术相比存在的有益效果是：通过表情识别训练集对表情识别模型进行训练，将各个训练图像进行水平翻转，得到对应的多个翻转后图像，将各个训练图像和各个翻转后图像输入至表情识别模型，根据各个训练图像的特征向量和各个翻转后图像的特征向量进行一致性学习，得到一致性损失函数对应的各个一致性损失值，并结合各个训练图像对应的图像识别结果和各个训练图像对应的标签之间的各个第一交叉熵损失值以及各个翻转后图像对应的图像识别结果和各个翻转后图像对应的标签之间的各个第二交叉熵损失值，确定各个目标损失值，根据各个目标损失值进行反向传播，更新表情识别模型的参数。在训练过程中，将各个训练图像的特征向量和各个翻转后图像的特征向量之间的一致性损失作为重要监督信息，可以有效防止训练数据集中的噪声标签数据造成表情识别模型的过拟合，可以抑制噪声标签数据对训练过程中的影响，解决现有技术中表情识别数据集中的噪声标注数据降低表情识别模型的准确性的问题，提高模型的泛化性能。

本文档来自技高网...

【技术保护点】

1.一种表情识别模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述对各个所述训练图像进行水平翻转处理之前，还包括：

3.根据权利要求1所述的方法，其特征在于，所述根据各个所述训练图像的特征向量和各个所述翻转后图像的特征向量进行一致性学习，得到一致性损失函数对应的各个一致性损失值，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据各个所述训练图像的关键信息特征向量，确认各个所述训练图像的全局特征向量，包括：

5.根据权利要求1所述的方法，所述根据各个所述训练图像的特征向量，确定各个所述训练图像对应的图像识别结果，包括：

6.根据权利要求1所述的方法，所述根据各个所述翻转后图像的特征向量，确定各个所述翻转后图像对应的图像识别结果，包括：

7.根据权利要求1所述的方法，其特征在于，所述在所述目标损失值小于或等于预设值时，得到训练完成的表情识别模型之后，还包括：

8.一种表情识别模型的训练装置，其特征在于，包括：

9.一种电子设备，包括存储器、处理器以及

10.一种可读存储介质，所述可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。

...

【技术特征摘要】

1.一种表情识别模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述对各个所述训练图像进行水平翻转处理之前，还包括：

4.根据权利要求3所述的方法，其特征在于，所述根据各个所述训练图像的关键信息特征向量，确认各个所述训练图像的全局特征向量，包括：

5.根据权利要求1所述的方法，所述根据各个所述训练图像的特征向量，确定各个所述训练图像对应的图像识别结果，包括：

6.根据权利要求1所述...

【专利技术属性】
技术研发人员：金毅勐，蒋召，胡文骏，
申请(专利权)人：深圳须弥云图空间科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人