图像识别模型的训练方法和装置、存储介质及电子设备制造方法及图纸

技术编号:39241834 阅读:10 留言:0更新日期:2023-10-30 11:54
本公开提供了一种图像识别模型的训练方法和装置、存储介质及电子设备。其中,该方法包括:获取样本图像集合,样本图像集合中包括第一样本图像和第二样本图像,第一样本图像为携带强标签的样本图像,第二样本图像包括携带弱标签的样本图像和无标签样本图像,强标签用于指示第一样本图像中包括的图像对象的全部对象属性信息,弱标签用于指示样本图像中包括的图像对象的部分对象属性信息;将样本图像集合中包括的样本图像输入包括第一特征识别网络和第二特征识别网络的老师识别模型,并获取老师识别模型输出的辅助识别结果;利用样本图像集合和辅助识别结果对学生识别模型进行训练。本公开解决了相关训练方法得到对精确的标注数据依赖度高的技术问题。数据依赖度高的技术问题。数据依赖度高的技术问题。

【技术实现步骤摘要】
图像识别模型的训练方法和装置、存储介质及电子设备


[0001]本专利技术涉及计算机领域,具体而言,涉及一种图像识别模型的训练方法和装置、存储介质及电子设备。

技术介绍

[0002]在计算机视觉任务中,包括多种对图像中包括的对象进行识别和检测的任务类型,例如目标检测任务,可以用于检测图像中包括的对象的对象位置和对象类别,又如语义分割任务,可以用于图像像素按照表达的语义含义的不同进行分组或分割。
[0003]在训练神经网络模型执行上述任务的过程中,通常需要大量的标注数据对模型进行训练,在标注数据的数据量较少或者标注数据不准确的情况下,对模型的训练结果较差。也就是说,现有的图像识别模型的训练方法存在对精确的标注数据的依赖度高的技术问题。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种图像识别模型的训练方法和装置、存储介质及电子设备,以至少解决训练方法训练得到的图像识别模型的识别准确率较低的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种图像识别模型的训练方法,包括:获取样本图像集合,其中,上述样本图像集合中包括第一样本图像和第二样本图像,上述第一样本图像为携带强标签的样本图像,上述第二样本图像包括携带弱标签的样本图像和无标签样本图像,上述强标签用于指示上述第一样本图像中包括的图像对象的全部对象属性信息,上述弱标签用于指示上述样本图像中包括的图像对象的部分对象属性信息;将上述样本图像集合中包括的样本图像输入老师识别模型,并获取上述老师识别模型输出的辅助识别结果,其中,在输入的上述样本图像为上述第二样本图像的情况下,上述辅助识别结果包括上述老师识别模型中的第一特征识别网络为上述第二样本图像预测的第一对象属性标签,以及上述老师识别模型中的第二特征识别网络为上述第二样本图像预测的第二对象属性标签,上述第一特征识别网络与上述第二特征识别网络为利用不同样本图像训练得到的特征识别网络;利用上述样本图像集合和上述辅助识别结果对学生识别模型进行训练,将满足收敛条件的上述学生识别模型确定为目标图像识别模型,其中,上述学生识别模型用于识别图像内图像对象的显示信息。
[0007]根据本专利技术实施例的另一个方面,提供了一种图像识别方法,包括:获取待识别的目标图像;通过目标图像识别模型中的特征提取网络获取上述目标图像的图像特征,其中,上述第一图像特征用于指示上述样本图像中包括的图像对象的对象特征,上述目标图像识别模型为根据样本图像集合和老师识别模型输出的辅助识别结果,对学生识别模型进行训练得到的图像识别模型,上述辅助识别结果为老师识别模型根据上述样本图像集合输出的识别结果;通过上述目标图像识别模型中的特征识别网络根据上述图像特征确定目标图像
识别结果,其中,上述目标图像识别结果用于指示上述目标图像中包括的图像对象的对象位置和对象类别。
[0008]根据本专利技术实施例的又一方面,还提供了一种图像识别模型的训练装置,包括:第一获取单元,用于获取样本图像集合,其中,上述样本图像集合中包括第一样本图像和第二样本图像,上述第一样本图像为携带强标签的样本图像,上述第二样本图像包括携带弱标签的样本图像和无标签样本图像,上述强标签用于指示上述第一样本图像中包括的图像对象的全部对象属性信息,上述弱标签用于指示上述样本图像中包括的图像对象的部分对象属性信息;第二获取单元,用于将上述样本图像集合中包括的样本图像输入老师识别模型,并获取上述老师识别模型输出的辅助识别结果,其中,在输入的上述样本图像为上述第二样本图像的情况下,上述辅助识别结果包括上述老师识别模型中的第一特征识别网络为上述第二样本图像预测的第一对象属性标签,以及上述老师识别模型中的第二特征识别网络为上述第二样本图像预测的第二对象属性标签,上述第一特征识别网络与上述第二特征识别网络为利用不同样本图像训练得到的特征识别网络;训练单元,用于利用上述样本图像集合和上述辅助识别结果对学生识别模型进行训练,将满足收敛条件的上述学生识别模型确定为目标图像识别模型,其中,上述学生识别模型用于识别图像内图像对象的显示信息。
[0009]根据本专利技术实施例的又一方面,还提供了一种图像识别装置,包括:第一获取单元,用于获取待识别的目标图像;第二获取单元,用于通过目标图像识别模型中的特征提取网络获取上述目标图像的图像特征,其中,上述第一图像特征用于指示上述样本图像中包括的图像对象的对象特征,上述目标图像识别模型为根据样本图像集合和老师识别模型输出的辅助识别结果,对学生识别模型进行训练得到的图像识别模型,上述辅助识别结果为老师识别模型根据上述样本图像集合输出的识别结果;识别单元,用于通过上述目标图像识别模型中的特征识别网络根据上述图像特征确定目标图像识别结果,其中,上述目标图像识别结果用于指示上述目标图像中包括的图像对象的对象位置和对象类别。
[0010]根据本专利技术实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述图像识别模型的训练方法或图像识别方法。
[0011]根据本申请实施例的又一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上图像识别模型的训练方法或图像识别方法。
[0012]根据本专利技术实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过上述计算机程序执行上述的图像识别模型的训练方法或图像识别方法。
[0013]在本专利技术实施例中,采用获取样本图像集合;将样本图像集合中包括的样本图像输入老师识别模型,并获取老师识别模型输出的辅助识别结果,其中,在输入的样本图像为第二样本图像的情况下,辅助识别结果包括老师识别模型中的第一特征识别网络为第二样本图像预测的第一对象属性标签,以及老师识别模型中的第二特征识别网络为第二样本图像预测的第二对象属性标签,第一特征识别网络与第二特征识别网络为利用不同样本图像训练得到的特征识别网络;利用样本图像集合和辅助识别结果对学生识别模型进行训练,
将满足收敛条件的学生识别模型确定为目标图像识别模型,其中,学生识别模型用于识别图像内图像对象的显示信息,从而实现了对图像识别模型的训练。
[0014]在上述训练方法中,先获取包括了全标记数据和部分标记数据的样本图像集合,并通过老师识别模型对获取的部分标记数据进行优化,通过老师识别模型中包括的两个不同的特征识别网络分别输出不同类别的辅助识别结果,进而根据辅助识别结果和样本图像集合对学生识别模型进行训练,避免了对高精度标注数据的高度依赖,通过各种类型的标注数据对图像模型进行混合训练,提高了训练过程对标注数据类型的适应性,实现了适应于不同类型的标注数据对图像识别模型的高精度训练,解决了现有图像识别模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型的训练方法,其特征在于,包括:获取样本图像集合,其中,所述样本图像集合中包括第一样本图像和第二样本图像,所述第一样本图像为携带强标签的样本图像,所述第二样本图像包括携带弱标签的样本图像和无标签样本图像,所述强标签用于指示所述第一样本图像中包括的图像对象的全部对象属性信息,所述弱标签用于指示所述样本图像中包括的图像对象的部分对象属性信息;将所述样本图像集合中包括的样本图像输入老师识别模型,并获取所述老师识别模型输出的辅助识别结果,其中,在输入的所述样本图像为所述第二样本图像的情况下,所述辅助识别结果包括所述老师识别模型中的第一特征识别网络为所述第二样本图像预测的第一对象属性标签,以及所述老师识别模型中的第二特征识别网络为所述第二样本图像预测的第二对象属性标签,所述第一特征识别网络与所述第二特征识别网络为利用不同样本图像训练得到的特征识别网络;利用所述样本图像集合和所述辅助识别结果对学生识别模型进行训练,将满足收敛条件的所述学生识别模型确定为目标图像识别模型,其中,所述学生识别模型用于识别图像内图像对象的显示信息。2.根据权利要求1所述的方法,其特征在于,在输入的所述样本图像为所述第二样本图像的情况下,将所述样本图像集合中包括的样本图像输入老师识别模型,并获取所述老师识别模型输出的辅助识别结果包括:在所述第二样本图像为携带所述弱标签的样本图像的情况下,所述辅助识别结果包括所述第一特征识别网络为所述第二样本图像预测的第一对象位置标签,其中,所述弱标签用于指示所述样本图像中包括的图像对象的对象类别;在所述第二样本图像为所述无标签样本图像的情况下,所述辅助识别结果包括所述第一特征识别网络为所述第二样本图像预测的第二对象类别标签和第二对象位置标签,以及所述第二特征识别网络为所述第二样本图像预测的第三对象类别标签和第三对象位置标签;其中,所述第一对象属性标签包括所述第一对象位置标签、所述第二对象类别标签和所述第二对象位置标签,所述第二对象属性标签包括所述第三对象类别标签和所述第三对象位置标签。3.根据权利要求2所述的方法,其特征在于,在所述第二样本图像为携带所述弱标签的样本图像的情况下,所述利用所述样本图像集合和所述辅助识别结果对学生识别模型进行训练包括:将所述第二样本图像输入所述学生识别模型,得到所述学生识别模型输出的第一参考对象类别和第一参考对象位置;根据所述弱标签指示的所述图像对象的所述对象类别,与所述学生识别模型输出的所述第一参考对象类别之间的差异获取第一训练损失;根据所述辅助识别结果中包括的所述第一对象位置标签所指示的预测对象位置,与所述学生识别模型输出的所述第一参考对象位置之间的差异获取第二训练损失;在所述第一训练损失和所述第二训练损失的加权求和结果指示所述学生识别模型未满足收敛条件的情况下,调整所述学生识别模型中的模型参数。4.根据权利要求2所述的方法,其特征在于,在所述第二样本图像为所述无标签样本图
像的情况下,所述利用所述样本图像集合和所述辅助识别结果对学生识别模型进行训练包括:将所述第二样本图像输入所述学生识别模型,得到所述学生识别模型输出的第二参考对象类别和第二参考对象位置;根据所述辅助识别结果中包括的所述第二对象类别标签所指示的预测对象类别,与所述学生识别模型输出的所述第二参考对象类别之间的差异获取第三训练损失;根据所述辅助识别结果中包括的所述第二对象位置标签所指示的预测对象位置,与所述学生识别模型输出的所述第二参考对象位置之间的差异获取第四训练损失;根据所述辅助识别结果中包括的所述第三对象类别标签所指示的预测对象类别,与所述学生识别模型输出的所述第二参考对象类别之间的差异获取第五训练损失;根据所述辅助识别结果中包括的所述第三对象位置标签所指示的预测对象位置,与所述学生识别模型输出的所述第二参考对象位置之间的差异获取第六训练损失;在根据第三训练损失、所述第四训练损失、所述第五训练损失和所述第六训练损失确定所述学生识别模型未满足收敛条件的情况下,调整所述学生识别模型中的模型参数。5.根据权利要求3所述的方法,其特征在于,在所述第二样本图像为携带所述弱标签的样本图像的情况下,所述获取所述老师识别模型输出的辅助识别结果之后,还包括:获取所述老师识别模型中的第二特征识别网络为所述第二样本图像预测的第二参考对象类别和第二参考对象位置;根据所述弱标签指示的所述图像对象的所述对象类别与所述第二参考对象类别之间的差异获取第一网络训练损失;根据所述辅助识别结果中包括的所述第一对象位置标签所指示的预测对象位置,与所述第二参考对象位置之间的差异获取第二网络训练损失;在所述第一网络训练损失和所述第二网络训练损失的加权求和结果指示所述第二特征识别网络未满足收敛条件的情况下,调整所述第二特征识别网络中的模型参数;在所述第一网络训练损失和所述第二网络训练损失的加权求和结果指示所述第二特征识别网络满足收敛条件的情况下,确定所述第二特征识别网络为训练完成的所述第二特征识别网络。6.根据权利要求1所述的方法,其特征在于,所述利用所述样本图像集合和所述辅助识别结果对学生识别模型进行训练包括:从所述样本图像集合中获取所述第一样本图像,其中,所述第一样本图像携带的所述强标签指示的所述对象属性信息为所述第一样本图像中包括的图像对象的对象类别和对象位置;将所述第一样本图像输入所述学生识别模型,得到所述学生识别模型输出的第三参考对象类别和第三参考对象位置;根据强标签指示的所述图像对象的对象类别,与所述学生识别模型输出的所述第三参考对象类别之间的差异获取第七训练损失;根据所述强标签指示的所述图像对象的对象位置,与所述学生识别模型输出的所述第三参考对象位置之间的差异获取第八训练损失;
在所述第七训练损失和所述第八训练损失的加权求和结果指示所述学生识别模型未满足收敛条件的情况下,调整所述学生识别模型中的模型参数。7.根据权利要求6所述的方法,其特征在于,所述从所述样本图像集合中获取所述第一样本图像之后,还包括:获取所述老师识别模型中的第一特征识别网络为所述第一样本图像预测的第三参考对象类别和第三参考对象位置;根据所述强标签指示的所述图像对象的所述对象类别与所述第三参考对象类别之间的差异获取第三网络训练损失;根据所述强标签指示的所述图像对象的所述对象位置与所述第三参考对象位置之间的差异获取第四网络训练损失;在所述第三网络训练损失和所述第四网络训练损失的加权求和结果指示所述第一特征识别网络未满足收敛条件的情况下,调整所述第一特征识别网络中的模型参数;在所述第三网络训练损失和所述第四网络训练损失的加权求和结果指示所述第一特征识别网络满足收敛条件的情况下,确定所述第一特征识别网络为训练完成的所述第一特征识别网络。8.根据权利要求1至7任一项中所述的...

【专利技术属性】
技术研发人员:沈云航林明宝傅朝友吴桐李珂任博纪荣嵘
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1