【技术实现步骤摘要】
图处理网络模型的训练方法、装置、电子设备和存储介质
[0001]本公开涉及计算机
,具体涉及深度学习、计算机视觉等人工智能
,尤其涉及一种图处理网络模型的训练方法、装置、电子设备和存储介质。
技术介绍
[0002]随着计算机技术的发展,深度学习在各个领域取得了卓越的突破,由于人工神经网络具有强大的自学习能力,其在模式识别、智能机器人、自动控制、生物、医学和经济等领域应用越来越广泛。不过,越先进的网络模型所需的模型参数越多,占用的存储空间和计算资源也越大,由此,知识蒸馏(也称为教师
‑
学生网络)应运而生。在使用教师网络训练学生网络时,如何提高学生网络的效果,成为目前亟待解决的问题。
技术实现思路
[0003]本公开提供了一种图处理网络模型的训练方法、装置、电子设备和存储介质。
[0004]本公开一方面,提供了一种图处理网络模型的训练方法,包括:
[0005]将训练样本分别输入学生网络和教师网络,以获取所述学生网络的第i层输出的第一特征图和所述教师网络的第i层输出的第二特征图,其中,i为大于或等于1且小于或等于N的整数,其中,N为所述学生网络及所述教师网络中包含的网络层的数量;
[0006]根据所述第一特征图与所述第二特征图间的差异,确定所述学生网络对应的第一修正梯度;
[0007]获取所述学生网络输出的第一软标签及所述教师网络输出的第二软标签;
[0008]根据所述第一软标签与所述第二软标签的差异,确定所述学生网络中对应的第二修正梯度 ...
【技术保护点】
【技术特征摘要】
1.一种图处理网络模型的训练方法,包括:将训练样本分别输入学生网络和教师网络,以获取所述学生网络的第i层输出的第一特征图和所述教师网络的第i层输出的第二特征图,其中,i为大于或等于1且小于或等于N的整数,其中,N为所述学生网络及所述教师网络中包含的网络层的数量;根据所述第一特征图与所述第二特征图间的差异,确定所述学生网络对应的第一修正梯度;获取所述学生网络输出的第一软标签及所述教师网络输出的第二软标签;根据所述第一软标签与所述第二软标签的差异,确定所述学生网络对应的第二修正梯度;基于所述第一修正梯度及所述第二修正梯度,对所述学生网络进行修正。2.如权利要求1所述的方法,其中,在所述获取所述学生网络的第i层输出的第一特征图和所述教师网络的第i层输出的第二特征图之后,还包括:将所述第一特征图输入判别网络,以获取所述判别网络输出的判别结果;根据所述判别网络输出的判别结果,确定所述学生网络对应的第三修正梯度;所述基于所述第一修正梯度及所述第二修正梯度,对所述学生网络进行修正,包括:基于所述第一修正梯度、所述第二修正梯度及所述第三修正梯度,对所述学生网络进行修正。3.如权利要求2所述的方法,其中,所述根据所述判别网络输出的判别结果,确定所述学生网络对应的第三修正梯度,包括:在所述判别网络输出的判别结果指示所述第一特征图为所述学生网络生成的情况下,根据所述判别结果的置信度确定所述第三修正梯度。4.如权利要求2所述的方法,其中,所述根据所述判别网络输出的判别结果,确定所述学生网络对应的第三修正梯度,包括:在所述判别网络输出的判别结果指示所述第一特征图为所述教师网络生成的情况下,确定所述第三修正梯度为零。5.如权利要求1
‑
4任一所述的方法,其中,所述根据所述第一特征图与所述第二特征图间的差异,确定所述学生网络对应的第一修正梯度,包括:根据所述第一特征图中每个像素点与所述第二特征图中对应的像素点间的欧氏距离,确定所述学生网络对应的第一修正梯度。6.如权利要求1
‑
4任一所述的方法,其中,所述基于所述第一修正梯度及所述第二修正梯度,对所述学生网络进行修正,包括:基于所述第二修正梯度及所述第一修正梯度,对所述学生网络中的第i层的网络参数进行修正;基于所述第二修正梯度,对所述学生网络中的其余各层的网络参数进行修正。7.如权利要求1
‑
4任一所述的方法,其中,所述基于所述第一修正梯度及所述第二修正梯度,对所述学生网络进行修正,包括:基于所述第二修正梯度及所述第一修正梯度,对所述学生网络中的第i层及所述第i层至输入层间的各个网络层的网络参数进行修正;基于所述第二修正梯度,对所述学生网络中的第i+1层至输出层间的各个网络层的网
络参数进行修正。8.一种图处理网络模型的训练装置,包括:第一获取模块,用于将训练样本分别输入学生网络和教师网络,以获取所述学生网络的第i层输出的第一特征图和所述教师网络的第i层输...
【专利技术属性】
技术研发人员:杨喜鹏,蒋旻悦,谭啸,孙昊,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。