模型训练方法及相关装置制造方法及图纸

技术编号：40866359 阅读：3 留言：0更新日期：2024-04-08 16:31

本申请实施例公开了一种模型训练方法及相关装置，方法包括：获取输入数据；对所述输入数据进行数据处理，得到所述输入数据对应的面部图像数据和所述面部图像数据对应的关键点；对所述面部图像数据进行所述数据增强处理，得到增强图像数据；根据所述关键点，归一化处理所述面部图像数据，得到目标面部图像数据；将所述目标面部图像数据和所述增强图像数据，输入到目标模型中迭代训练，得到所述面部图像数据对应的注视点坐标和目标模型的目标损失函数。如此，目标模型通过采用自监督学习方法解决注视点估计中数据标注不足的问题，同时，知识蒸馏过程能够有效地减小网络规模并且保证注视点坐标预测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，具体涉及一种模型训练方法及相关装置。

技术介绍

1、随着深度学习算法在计算机视觉、语音处理、自动驾驶等领域的广泛应用，网络模型结构被设计得越来越庞大以满足复杂应用、高精度、多任务等等应用场景。目前，在多任务人脸特征学习框架下的数据集往往没有所有特征的数据标注。例如：一个人脸检测数据集不一定会有关键点或者注视点的标注，这样，在实际训练的过程中往往面临着数据集不足的问题，导致深度学习网络无法训练。另外，在边缘设备或者移动式平台这种对功率、延迟、内存等资源有较高限制的设备上有人脸特征分析的任务需要部署时，通常希望深度学习网络能够在良好精度的保证下完成更多的分析任务，同时具有较小的部署规模。

2、因此，未解决以上问题，本申请提出一种模型训练方法及相关装置。

技术实现思路

1、本申请实施例提供了一种模型训练方法及相关装置，有利于解决多任务人脸特征学习框架下注视点估计中数据标注不足的问题，进而提高深度学习网络的鲁棒性和泛化性。通过知识蒸馏能够在有效地减小网络规模的前提下保证精度在可接受的范围内。

2、第一方面，本申请实施例提供了一种模型训练方法，所述方法包括：

3、获取输入数据；

4、对所述输入数据进行数据处理，得到所述输入数据对应的面部图像数据和所述面部图像数据对应的关键点；

5、对所述面部图像数据进行所述数据增强处理，得到增强图像数据；

6、根据所述关键点，归一化处理所述面部图像数据，得到目标面部图像数据；

7、将所述目标面部图像数据和所述增强图像数据，输入到目标模型中迭代训练，得到输出结果，其中，所述输出结果包括所述面部图像数据对应的注视点坐标和所述目标模型的目标损失函数。

8、第二方面，本申请实施例提供了一种模型训练装置，所述装置包括：获取单元、处理单元和训练单元，其中，

9、所述获取单元，用于获取输入数据；

10、所述处理单元，用于对所述输入数据进行数据处理，得到所述输入数据对应的面部图像数据和所述面部图像数据对应的关键点；

11、所述处理单元，还用于对所述面部图像数据进行所述数据增强处理，得到增强图像数据；

12、所述处理单元，还用于根据所述关键点，归一化处理所述面部图像数据，得到目标面部图像数据；

13、所述训练单元，用于将所述目标面部图像数据和所述增强图像数据，输入到目标模型中迭代训练，得到输出结果，其中，所述输出结果包括所述面部图像数据对应的注视点坐标和所述目标模型的目标损失函数。

14、第三方面，本申请实施例提供了一种电子设备，包括处理器、存储器、通信接口以及一个或多个程序，其中，上述一个或多个程序被存储在上述存储器中，并且被配置由上述处理器执行，上述程序包括用于执行本申请实施例第一方面任一方法中的步骤的指令。

15、第四方面，本申请实施例提供了一种计算机可读存储介质，其中，上述计算机可读存储介质存储用于电子数据交换的计算机程序，其中，上述计算机程序使得计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。

16、第五方面，本申请实施例提供了一种计算机程序产品，其中，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，上述计算机程序可操作来使计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

17、可以看出，本申请实施例中，通过获取输入数据；对所述输入数据进行数据处理，得到所述输入数据对应的面部图像数据和所述面部图像数据对应的关键点；对所述面部图像数据进行所述数据增强处理，得到增强图像数据；根据所述关键点，归一化处理所述面部图像数据，得到目标面部图像数据；将所述目标面部图像数据和所述增强图像数据，输入到目标模型中迭代训练，得到所述面部图像数据对应的注视点坐标和所述目标模型的目标损失函数。如此，通过目标模型采用自监督学习方法解决注视点估计中数据标注不足的问题，提高目标模型的鲁棒性和泛化性，同时，知识蒸馏过程能够在有效地减小网络规模的前提下保证注视点坐标预测的准确性。

本文档来自技高网...

【技术保护点】

1.一种模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述输入数据包括至少一张原始图像；

3.根据权利要求2所述的方法，其特征在于，所述根据所述关键点，归一化处理所述面部图像数据，得到目标面部图像数据，包括：

4.根据权利要求3所述的方法，其特征在于，所述多任务模型包括预训练模型和第一模型；

5.根据权利要求4所述的方法，其特征在于，所述第一模型包括：第一编码器模块、第一映射器模块和预测模块；

6.根据权利要求5所述的方法，其特征在于，所述多任务模型还包括第二模型，所述第二模型包括：第二编码器模块和第二映射器模块；

7.根据权利要求4-6任一项所述的方法，其特征在于，所述方法包括：

8.一种模型训练装置，其特征在于，所述装置包括获取单元、处理单元和训练单元，其中，

9.一种电子设备，其特征在于，包括处理器、存储器、通信接口，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行如权利要求1-7中任一项所述的方法中的步骤的指令。

10.一种计算机可读存储介质，其特征在于，存储用于电子数据交换的计算机程序，其中，所述计算机程序使得计算机执行如权利要求1-7中任一项所述的方法。

...

【技术特征摘要】

1.一种模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述输入数据包括至少一张原始图像；

3.根据权利要求2所述的方法，其特征在于，所述根据所述关键点，归一化处理所述面部图像数据，得到目标面部图像数据，包括：

4.根据权利要求3所述的方法，其特征在于，所述多任务模型包括预训练模型和第一模型；

5.根据权利要求4所述的方法，其特征在于，所述第一模型包括：第一编码器模块、第一映射器模块和预测模块；

6.根据权利要求5所述的方法，其特征在于，所述多任务模型还包括第二模型，所述第二模型包括：第二编码器模...

【专利技术属性】
技术研发人员：张环宇，
申请(专利权)人：哲库科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人