图像识别模型的训练方法和装置、存储介质及电子设备制造方法及图纸

技术编号：39241834 阅读：10 留言：0更新日期：2023-10-30 11:54

本公开提供了一种图像识别模型的训练方法和装置、存储介质及电子设备。其中，该方法包括：获取样本图像集合，样本图像集合中包括第一样本图像和第二样本图像，第一样本图像为携带强标签的样本图像，第二样本图像包括携带弱标签的样本图像和无标签样本图像，强标签用于指示第一样本图像中包括的图像对象的全部对象属性信息，弱标签用于指示样本图像中包括的图像对象的部分对象属性信息；将样本图像集合中包括的样本图像输入包括第一特征识别网络和第二特征识别网络的老师识别模型，并获取老师识别模型输出的辅助识别结果；利用样本图像集合和辅助识别结果对学生识别模型进行训练。本公开解决了相关训练方法得到对精确的标注数据依赖度高的技术问题。数据依赖度高的技术问题。数据依赖度高的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别模型的训练方法和装置、存储介质及电子设备

[0001]本专利技术涉及计算机领域，具体而言，涉及一种图像识别模型的训练方法和装置、存储介质及电子设备。

技术介绍

[0002]在计算机视觉任务中，包括多种对图像中包括的对象进行识别和检测的任务类型，例如目标检测任务，可以用于检测图像中包括的对象的对象位置和对象类别，又如语义分割任务，可以用于图像像素按照表达的语义含义的不同进行分组或分割。
[0003]在训练神经网络模型执行上述任务的过程中，通常需要大量的标注数据对模型进行训练，在标注数据的数据量较少或者标注数据不准确的情况下，对模型的训练结果较差。也就是说，现有的图像识别模型的训练方法存在对精确的标注数据的依赖度高的技术问题。
[0004]针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种图像识别模型的训练方法和装置、存储介质及电子设备，以至少解决训练方法训练得到的图像识别模型的识别准确率较低的技术问题。
[0006]根据本专利技术实施例的一个方面，提供了一种图像识别模型的训练方法，包括：获取样本图像集合，其中，上述样本图像集合中包括第一样本图像和第二样本图像，上述第一样本图像为携带强标签的样本图像，上述第二样本图像包括携带弱标签的样本图像和无标签样本图像，上述强标签用于指示上述第一样本图像中包括的图像对象的全部对象属性信息，上述弱标签用于指示上述样本图像中包括的图像对象的部分对象属性信息；将上述样本图像集合中包括的样本图像输...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型的训练方法，其特征在于，包括：获取样本图像集合，其中，所述样本图像集合中包括第一样本图像和第二样本图像，所述第一样本图像为携带强标签的样本图像，所述第二样本图像包括携带弱标签的样本图像和无标签样本图像，所述强标签用于指示所述第一样本图像中包括的图像对象的全部对象属性信息，所述弱标签用于指示所述样本图像中包括的图像对象的部分对象属性信息；将所述样本图像集合中包括的样本图像输入老师识别模型，并获取所述老师识别模型输出的辅助识别结果，其中，在输入的所述样本图像为所述第二样本图像的情况下，所述辅助识别结果包括所述老师识别模型中的第一特征识别网络为所述第二样本图像预测的第一对象属性标签，以及所述老师识别模型中的第二特征识别网络为所述第二样本图像预测的第二对象属性标签，所述第一特征识别网络与所述第二特征识别网络为利用不同样本图像训练得到的特征识别网络；利用所述样本图像集合和所述辅助识别结果对学生识别模型进行训练，将满足收敛条件的所述学生识别模型确定为目标图像识别模型，其中，所述学生识别模型用于识别图像内图像对象的显示信息。2.根据权利要求1所述的方法，其特征在于，在输入的所述样本图像为所述第二样本图像的情况下，将所述样本图像集合中包括的样本图像输入老师识别模型，并获取所述老师识别模型输出的辅助识别结果包括：在所述第二样本图像为携带所述弱标签的样本图像的情况下，所述辅助识别结果包括所述第一特征识别网络为所述第二样本图像预测的第一对象位置标签，其中，所述弱标签用于指示所述样本图像中包括的图像对象的对象类别；在所述第二样本图像为所述无标签样本图像的情况下，所述辅助识别结果包括所述第一特征识别网络为所述第二样本图像预测的第二对象类别标签和第二对象位置标签，以及所述第二特征识别网络为所述第二样本图像预测的第三对象类别标签和第三对象位置标签；其中，所述第一对象属性标签包括所述第一对象位置标签、所述第二对象类别标签和所述第二对象位置标签，所述第二对象属性标签包括所述第三对象类别标签和所述第三对象位置标签。3.根据权利要求2所述的方法，其特征在于，在所述第二样本图像为携带所述弱标签的样本图像的情况下，所述利用所述样本图像集合和所述辅助识别结果对学生识别模型进行训练包括：将所述第二样本图像输入所述学生识别模型，得到所述学生识别模型输出的第一参考对象类别和第一参考对象位置；根据所述弱标签指示的所述图像对象的所述对象类别，与所述学生识别模型输出的所述第一参考对象类别之间的差异获取第一训练损失；根据所述辅助识别结果中包括的所述第一对象位置标签所指示的预测对象位置，与所述学生识别模型输出的所述第一参考对象位置之间的差异获取第二训练损失；在所述第一训练损失和所述第二训练损失的加权求和结果指示所述学生识别模型未满足收敛条件的情况下，调整所述学生识别模型中的模型参数。4.根据权利要求2所述的方法，其特征在于，在所述第二样本图像为所述无标签样本图
像的情况下，所述利用所述样本图像集合和所述辅助识别结果对学生识别模型进行训练包括：将所述第二样本图像输入所述学生识别模型，得到所述学生识别模型输出的第二参考对象类别和第二参考对象位置；根据所述辅助识别结果中包括的所述第二对象类别标签所指示的预测对象类别，与所述学生识别模型输出的所述第二参考对象类别之间的差异获取第三训练损失；根据所述辅助识别结果中包括的所述第二对象位置标签所指示的预测对象位置，与所述学生识别模型输出的所述第二参考对象位置之间的差异获取第四训练损失；根据所述辅助识别结果中包括的所述第三对象类别标签所指示的预测对象类别，与所述学生识别模型输出的所述第二参考对象类别之间的差异获取第五训练损失；根据所述辅助识别结果中包括的所述第三对象位置标签所指示的预测对象位置，与所述学生识别模型输出的所述第二参考对象位置之间的差异获取第六训练损失；在根据第三训练损失、所述第四训练损失、所述第五训练损失和所述第六训练损失确定所述学生识别模型未满足收敛条件的情况下，调整所述学生识别模型中的模型参数。5.根据权利要求3所述的方法，其特征在于，在所述第二样本图像为携带所述弱标签的样本图像的情况下，所述获取所述老师识别模型输出的辅助识别结果之后，还包括：获取所述老师识别模型中的第二特征识别网络为所述第二样本图像预测的第二参考对象类别和第二参考对象位置；根据所述弱标签指示的所述图像对象的所述对象类别与所述第二参考对象类别之间的差异获取第一网络训练损失；根据所述辅助识别结果中包括的所述第一对象位置标签所指示的预测对象位置，与所述第二参考对象位置之间的差异获取第二网络训练损失；在所述第一网络训练损失和所述第二网络训练损失的加权求和结果指示所述第二特征识别网络未满足收敛条件的情况下，调整所述第二特征识别网络中的模型参数；在所述第一网络训练损失和所述第二网络训练损失的加权求和结果指示所述第二特征识别网络满足收敛条件的情况下，确定所述第二特征识别网络为训练完成的所述第二特征识别网络。6.根据权利要求1所述的方法，其特征在于，所述利用所述样本图像集合和所述辅助识别结果对学生识别模型进行训练包括：从所述样本图像集合中获取所述第一样本图像，其中，所述第一样本图像携带的所述强标签指示的所述对象属性信息为所述第一样本图像中包括的图像对象的对象类别和对象位置；将所述第一样本图像输入所述学生识别模型，得到所述学生识别模型输出的第三参考对象类别和第三参考对象位置；根据强标签指示的所述图像对象的对象类别，与所述学生识别模型输出的所述第三参考对象类别之间的差异获取第七训练损失；根据所述强标签指示的所述图像对象的对象位置，与所述学生识别模型输出的所述第三参考对象位置之间的差异获取第八训练损失；
在所述第七训练损失和所述第八训练损失的加权求和结果指示所述学生识别模型未满足收敛条件的情况下，调整所述学生识别模型中的模型参数。7.根据权利要求6所述的方法，其特征在于，所述从所述样本图像集合中获取所述第一样本图像之后，还包括：获取所述老师识别模型中的第一特征识别网络为所述第一样本图像预测的第三参考对象类别和第三参考对象位置；根据所述强标签指示的所述图像对象的所述对象类别与所述第三参考对象类别之间的差异获取第三网络训练损失；根据所述强标签指示的所述图像对象的所述对象位置与所述第三参考对象位置之间的差异获取第四网络训练损失；在所述第三网络训练损失和所述第四网络训练损失的加权求和结果指示所述第一特征识别网络未满足收敛条件的情况下，调整所述第一特征识别网络中的模型参数；在所述第三网络训练损失和所述第四网络训练损失的加权求和结果指示所述第一特征识别网络满足收敛条件的情况下，确定所述第一特征识别网络为训练完成的所述第一特征识别网络。8.根据权利要求1至7任一项中所述的...

【专利技术属性】
技术研发人员：沈云航，林明宝，傅朝友，吴桐，李珂，任博，纪荣嵘，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人