模型训练方法及相关装置制造方法及图纸

技术编号：40149901 阅读：5 留言：0更新日期：2024-01-26 22:51

本申请实施例提供了一种模型训练方法及相关装置，包括：使用目标检测模型对第一训练图像进行处理，得到第一图像特征集合；使用第一教师检测模型对第一训练图像进行处理，得到第二图像特征集合，第一教师检测模型的参数量大于目标检测模型的参数量或第一教师检测模型的网络结构复杂度高于目标检测模型的网络结构复杂度；使用第二教师检测模型对第二训练图像进行处理，得到第三图像特征集合，第二训练图像的分辨率高于第一训练图像的分辨率；根据第一图像特征集合、第二图像特征集合和第三图像特征集合确定目标损失函数；根据目标损失函数对目标检测模型的网络参数进行调整。有利于在降低检测模型部署难度的同时保证检测模型的推理速度和检测精度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于数据处理领域，具体涉及一种模型训练方法及相关装置。

技术介绍

1、目前，随着计算机技术的发展，越来越多的用户使用检测模型来进行目标物体的检测，用户对检测模型的检测精度和推理速度的要求也越来越高，如何训练出易于部署且推理速度和检测精度较高的检测模型成为亟需解决的问题。

技术实现思路

1、本申请实施例提供了一种模型训练方法及相关装置，以期有利于在降低检测模型部署难度的同时保证检测模型的推理速度和检测精度。

2、第一方面，本申请实施例提供了一种模型训练方法，包括：

3、使用目标检测模型对第一训练图像进行处理，得到第一图像特征集合，所述目标检测模型用于进行对象检测；

4、使用第一教师检测模型对所述第一训练图像进行处理，得到第二图像特征集合，所述第一教师检测模型的参数量大于所述目标检测模型的参数量或所述第一教师检测模型的网络结构复杂度高于所述目标检测模型的网络结构复杂度；

5、使用第二教师检测模型对第二训练图像进行处理，得到第三图像特征集合，所述第二训练图像的分辨率高于所述第一训练图像的分辨率；

6、根据所述第一图像特征集合、所述第二图像特征集合和所述第三图像特征集合确定目标损失函数；

7、根据所述目标损失函数对所述目标检测模型的网络参数进行调整。

8、第二方面，本申请实施例提供了一种手势检测方法，包括：

9、获取待检测的目标图像，所述目标图像中包括待检测手势；

10、将所述

11、第三方面，本申请实施例提供了一种模型训练装置，包括：

12、第一处理单元，用于使用目标检测模型对第一训练图像进行处理，得到第一图像特征集合，所述目标检测模型用于进行对象检测；

13、第二处理单元，用于使用第一教师检测模型对所述第一训练图像进行处理，得到第二图像特征集合，所述第一教师检测模型的参数量大于所述目标检测模型的参数量或所述第一教师检测模型的网络结构复杂度高于所述目标检测模型；

14、第三处理单元，用于使用第二教师检测模型对第二训练图像进行处理，得到第三图像特征集合，所述第二训练图像的分辨率高于所述第一训练图像的分辨率；

15、确定单元，用于根据所述第一图像特征集合、所述第二图像特征集合和所述第三图像特征集合确定目标损失函数；

16、调整单元，用于根据所述目标损失函数对所述目标检测模型的网络参数进行调整。

17、第四方面，本申请实施例提供了一种手势检测装置，包括：

18、获取单元，用于获取待检测的目标图像，所述目标图像中包括待检测手势；

19、检测单元，用于将所述目标图像输入训练好的目标检测模型，得到检测结果，所述检测结果用于指示所述待检测手势的手势类型，所述训练好的目标检测模型的网络参数是根据目标损失函数进行调整得到的，所述目标损失函数是根据第一图像特征集合、第二图像特征集合和第三图像特征集合确定的，所述第一图像特征集合是使用目标检测模型对第一训练图像进行处理得到的，所述第二图像特征集合是使用第一教师检测模型对所述第一训练图像进行处理得到的，所述第三图像特征集合是使用第二教师检测模型对第二训练图像进行处理得到的，所述第一教师检测模型的参数量大于所述目标检测模型的参数量或所述第一教师检测模型的网络结构复杂度高于所述目标检测模型的网络结构复杂度，所述第二训练图像的分辨率高于所述第一训练图像的分辨率。

20、第五方面，本申请实施例提供了一种电子设备，包括处理器、存储器、通信接口，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行本申请实施例第一方面或第二方面中的步骤的指令。

21、第六方面，本申请实施例提供了一种计算机存储介质，其上存储有计算机程序/指令，该计算机程序/指令被处理器执行实现上述第一方面或第二方面所述的步骤。

22、第七方面，本申请实施例提供了一种芯片，该芯片包括处理器，用于从存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行如上述第一方面或第二方面所述的步骤。

23、第八方面，本申请实施例提供了一种计算机程序产品，其中，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，上述计算机程序可操作来使计算机执行如本申请实施例第一方面或第二方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

24、可以看出，本申请实施例中，分别使用目标检测模型第一教师检测模型对第一训练图像进行处理，得到第一图像特征集合和第二图像特征集合，并通过第二教师检测模型对第二训练图像进行处理，得到第三图像特征集合，再根据第一图像特征集合、第二图像特征集合和第三图像特征集合确定目标损失函数，然后根据目标损失函数对目标检测模型的网络参数进行调整。由于第一教师检测模型的参数量大于目标检测模型的参数量或第一教师检测模型的网络结构复杂度高于目标检测模型的网络结构复杂度，且输入第二教师模型的第二训练图像的分辨率高于输入目标检测模型的第一训练图像，使得输入低分辨率图像且网络结构复杂度较低的目标检测模型也能学习到输入高分辨率图像和网络结构较复杂的教师模型的表征能力，从而有利于在降低目标检测模型部署难度的同时，保证检测模型的推理速度和检测精度。

本文档来自技高网...

【技术保护点】

1.一种模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一图像特征集合、所述第二图像特征集合和所述第三图像特征集合确定目标损失函数，包括：

3.根据权利要求2所述的方法，其特征在于，所述第一图像特征集合包括：对所述第一训练图像进行N级采样得到的N个第一特征图像，将第N级采样得到的第N个第一特征图像输入第一预测头得到的用于表征对象检测结果的M个第一目标特征图像；所述第二图像特征集合包括：对所述第一训练图像进行N级采样得到的N个第二特征图像，将第N级采样得到的第N个第二特征图像输入第二预测头得到的用于表征对象检测结果的M个第二目标特征图像，M和N为正整数；

4.根据权利要求2所述的方法，其特征在于，所述第一图像特征集合包括：对所述第一训练图像进行N级采样得到的N个第一特征图像，将第N级采样得到的第N个第一特征图像输入第一预测头得到的用于表征对象检测结果的M个第一目标特征图像；所述第三图像特征集合包括：对所述第二训练图像进行N级采样得到的N个第三特征图像，将第N级采样得到的第N个第三特征图像输入第三预测头得到

5.根据权利要求4所述的方法，其特征在于，所述第三训练图像的图像尺寸为所述第一训练图像的图像尺寸的L倍，对所述第三训练图像进行第K级采样的卷积步长为对所述第一训练图像进行第K级采样的卷积步长的L倍，L为正整数，K为不大于N的正整数。

6.根据权利要求3所述的方法，其特征在于，所述分别根据所述N个第一特征图像和所述N个第二特征图像中属于相同采样层级的特征图像，得到N个第一参数，包括：

7.根据权利要求4所述的方法，其特征在于，所述分别根据所述N个第一特征图像和所述N个第三特征图像中属于相同采样层级的特征图像，得到N个第三参数，包括：

8.根据权利要求3或4所述的方法，其特征在于，所述目标检测模型用于进行手势检测，所述目标特征图像包括：用于表征手势类别的特征图像、用于表征手部宽高的特征图像和用于表征手部中心点坐标的特征图像。

9.根据权利要求1所述的方法，其特征在于，所述根据所述目标损失函数对所述目标检测模型的网络参数进行调整之后，所述方法还包括：

10.一种手势检测方法，其特征在于，包括：

11.一种模型训练装置，其特征在于，包括：

12.一种手势检测装置，其特征在于，包括：

13.一种电子设备，其特征在于，包括处理器、存储器，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行如权利要求1-10任一项所述的方法中的步骤的指令。

14.一种计算机可读存储介质，其上存储有计算机程序/指令，其特征在于，该计算机程序/指令被处理器执行实现权利要求1-10任一项所述方法的步骤。

15.一种芯片，其特征在于，所述芯片包括处理器，用于从存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行如权利要求1-10任一项所述方法的步骤。

...

【技术特征摘要】

1.一种模型训练方法，其特征在于，包括：

3.根据权利要求2所述的方法，其特征在于，所述第一图像特征集合包括：对所述第一训练图像进行n级采样得到的n个第一特征图像，将第n级采样得到的第n个第一特征图像输入第一预测头得到的用于表征对象检测结果的m个第一目标特征图像；所述第二图像特征集合包括：对所述第一训练图像进行n级采样得到的n个第二特征图像，将第n级采样得到的第n个第二特征图像输入第二预测头得到的用于表征对象检测结果的m个第二目标特征图像，m和n为正整数；

4.根据权利要求2所述的方法，其特征在于，所述第一图像特征集合包括：对所述第一训练图像进行n级采样得到的n个第一特征图像，将第n级采样得到的第n个第一特征图像输入第一预测头得到的用于表征对象检测结果的m个第一目标特征图像；所述第三图像特征集合包括：对所述第二训练图像进行n级采样得到的n个第三特征图像，将第n级采样得到的第n个第三特征图像输入第三预测头得到的用于表征对象检测结果的m个第三目标特征图像，m和n为正整数；

5.根据权利要求4所述的方法，其特征在于，所述第三训练图像的图像尺寸为所述第一训练图像的图像尺寸的l倍，对所述第三训练图像进行第k级采样的卷积步长为对所述第一训练图像进行第k级采样的卷积步长的l倍，l为正整数，k为不大于n的正整数。

6.根据权利要求3所述的方法...

【专利技术属性】
技术研发人员：刘松，
申请(专利权)人：OPPO广东移动通信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人