知识蒸馏方法、装置、电子设备及计算机存储介质制造方法及图纸

技术编号:46561803 阅读:0 留言:0更新日期:2025-10-10 21:14
本发明专利技术涉及图像处理技术,提供一种知识蒸馏方法、装置、电子设备及计算机存储介质,所述方法包括:获取样本图像;将样本图像分别输入预先构建的学生模型和训练后的教师模型,得到中间特征图、第一和第二预测结果,中间特征图是学生模型进行特征提取得到的,第一预测结果是学生模型的学生输出头输出,第二预测结果是教师模型的教师输出头输出;将中间特征图输入和学生输出头的结构容量一致的辅助输出头,得到辅助预测结果;基于第一预测结果、并以第二预测结果作为辅助预测结果的软标签,对学生模型进行知识蒸馏,得到训练后的学生模型。本发明专利技术既能规避知识蒸馏中教师模型和学生模型特征图的差异性,又能保证知识蒸馏的效果。

【技术实现步骤摘要】

本专利技术涉及图像处理,具体而言,涉及一种知识蒸馏方法、装置、电子设备及计算机存储介质


技术介绍

1、在图像处理
,为了提高图像处理模型的训练效率,通常利用一个训练后的满足预期处理效果的模型作为教师模型,将待训练的模型作为学生模型,利用知识蒸馏的方法对学生模型进行训练,以提高学生模型的性能。

2、由于教师模型和学生模型的结构和参数容量存在较大差异,导致教师模型和学生模型的特征图在特征的维度、语义和幅值方面存在较大的差异,影响知识蒸馏的效果,进而影响训练后的学生模型的处理效果。


技术实现思路

1、本专利技术目的在于提供一种知识蒸馏方法、装置、电子设备及计算机存储介质,其在规避知识蒸馏中教师模型和学生模型特征图的差异性的同时,又能保证知识蒸馏的效果,使得利用训练后的学生模型进行图像处理时,同时保证处理效率和处理效果。

2、本专利技术的实施例可以这样实现:

3、第一方面,本专利技术提供一种知识蒸馏方法,所述方法包括:

4、获取样本图像;p>

5、将所述本文档来自技高网...

【技术保护点】

1.一种知识蒸馏方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一预测结果、并以所述第二预测结果作为所述辅助预测结果的软标签,对所述学生模型进行知识蒸馏,得到训练后的学生模型的步骤包括:

3.根据权利要求2所述的方法,其特征在于,所述学生输出头用于进行掩码分割任务,所述根据所述软标签和所述辅助预测结果,计算蒸馏损失的步骤包括:

4.根据权利要求2所述的方法,其特征在于,所述学生输出头用于进行分类任务,所述根据所述软标签和所述辅助预测结果,计算蒸馏损失的步骤包括:

5.根据权利要求2所述的方法,其特征...

【技术特征摘要】

1.一种知识蒸馏方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一预测结果、并以所述第二预测结果作为所述辅助预测结果的软标签,对所述学生模型进行知识蒸馏,得到训练后的学生模型的步骤包括:

3.根据权利要求2所述的方法,其特征在于,所述学生输出头用于进行掩码分割任务,所述根据所述软标签和所述辅助预测结果,计算蒸馏损失的步骤包括:

4.根据权利要求2所述的方法,其特征在于,所述学生输出头用于进行分类任务,所述根据所述软标签和所述辅助预测结果,计算蒸馏损失的步骤包括:

5.根据权利要求2所述的方法,其特征在于,所述学生输出头用于进行定位任务,所述根据所述软标签和所述辅助预测结果,计算蒸馏损失的步骤包括:

...

【专利技术属性】
技术研发人员:张宇杨伟强吴庆耀梁浩张泽鸿刘东剑
申请(专利权)人:深圳金三立视频科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1