用于目标检测的神经网络训练方法、装置、设备、介质制造方法及图纸

技术编号:22168323 阅读:15 留言:0更新日期:2019-09-21 11:11
本发明专利技术提供用于目标检测的神经网络训练方法、装置、设备、介质,该方法包括:S1:将检测目标图像输入teacher网络、student网络;S2:将所述teacher网络中第四层的第一特征值、所述student网络中的第四层的第二特征值,进行比较,得到比对结果;S3:利用所述比对结果,对所述student网络进行调整,并进入步骤S2,直到得到的比对结果小于预设阈值,以得到训练后的student网络;其中,所述teacher网络与所述student网络的总体构架相同;所述teacher网络处于前向预测模式,所述student网络处于训练模式;所述teacher网络的通道数比所述student网络的通道数多;所述检测目标图像,设有检测目标的矩形框以及所述检测目标的标签类别。本发明专利技术针对检测目标图像,占用计算资源小。

Neural Network Training Method, Device, Equipment and Media for Target Detection

【技术实现步骤摘要】
用于目标检测的神经网络训练方法、装置、设备、介质
本专利技术实施例涉及图像处理
,具体涉及一种用于目标检测的神经网络训练方法、装置、设备、介质。
技术介绍
神经网络在人工智能(AI)领域快速发展,推动了图像分类、目标检测等各领域的进步。但深度神经网络的准确度提高的同时,深度在不断加深,网络参数也在不断增多,随之带来的便是模型变大,算法执行速度变慢,从而不便于在某些场景下应用,比如:资源受限场景(手机、嵌入式设备),需要实时分析的场景(实时监控),成本受限的场景(GPU资源有限)等等。因此,如何在目标检测的过程中,在对目标进行识别的同时,能够减少对计算资源的需求,是本领域技术人员亟待解决的技术问题。
技术实现思路
为此,本专利技术实施例提供一种用于目标检测的神经网络训练方法、装置、设备、介质,在目标检测的过程中,在对目标进行识别的同时,能够减少对计算资源的需求。为了实现上述目的,本专利技术实施例提供如下技术方案:第一方面,本专利技术提供一种用于目标检测的神经网络训练方法,该方法包括:S1:将检测目标图像输入teacher网络、student网络;S2:将所述teacher网络中第四层的第一特征值、所述student网络中的第四层的第二特征值,进行比较,得到比对结果;S3:利用所述比对结果,对所述student网络进行调整,并进入步骤S2,直到得到的比对结果小于预设阈值,以得到训练后的student网络;其中,所述teacher网络与所述student网络的总体构架相同;所述teacher网络处于前向预测模式,所述student网络处于训练模式;所述teacher网络的通道数比所述student网络的通道数多;所述检测目标图像,设有检测目标的矩形框以及所述检测目标的标签类别。优选地,在所述步骤S2:将所述teacher网络中第四层的第一特征值、所述student网络中的第四层的第二特征值,进行比较,得到比对结果的同时,还包括:将所述student网络的RPN网络接入所述检测目标图像的所述矩形框以及对应的检测类别;利用所述RPN网络的FasterRCNN标准Loss函数对所述RPN网络进行反向传播训练,得到训练后的RPN网络。优选地,在所述步骤S2:将所述teacher网络中第四层的第一特征值、所述student网络中的第四层的第二特征值,进行比较,得到比对结果的同时,还包括:将所述student网络的RPN网络、FasterRCNN头部网络接入所述检测目标图像的所述矩形框以及对应的检测类别;利用所述FasterRCNN头部网络的FasterRCNN标准Loss函数对所述FasterRCNN头部网络进行反向传播训练,得到训练后的FasterRCNN头部网络。优选地,所述S2:将所述teacher网络中第四层的第一特征值、所述student网络中的第四层的第二特征值,进行比较,得到比对结果,包括:将所述student网络第四层的通道数量扩充到与所述teacher网络第四层的通道数量相同;所述teacher网络中第四层的第一特征值、所述student网络中的第四层的扩充后的第二特征值输入到L2Loss函数;将所述L2Loss函数的结果确定为比对结果,以便对student网络进行反向传播训练;其中,所述L2Loss函数为:s为teacher网络中第四层的第一特征值;t为student网络中的第四层的第二特征值;r(t)为student网络中的第四层的扩充后的第二特征值;所述N为s-r(t)的元素个数。第二方面,本专利技术提供一种用于目标检测的神经网络训练装置,该装置,包括:目标图像输入模块,用于实现步骤S1:将检测目标图像输入teacher网络、student网络;特征比较模块,用于实现步骤S2:将所述teacher网络中第四层的第一特征值、所述student网络中的第四层的第二特征值,进行比较,得到比对结果;网络调整模块,用于实现步骤S3:利用所述比对结果,对所述student网络进行调整,并进入步骤S2,直到得到的比对结果小于预设阈值,以得到训练后的student网络;其中,所述teacher网络与所述student网络的总体构架相同;所述teacher网络处于前向预测模式,所述student网络处于训练模式;所述teacher网络的通道数比所述student网络的通道数多;所述检测目标图像,设有检测目标的矩形框以及所述检测目标的标签类别。优选地,还包括:RPN网络接入模块,用于将所述student网络的RPN网络接入所述检测目标图像的所述矩形框以及对应的检测类别;RPN网络训练模块,用于利用所述RPN网络的FasterRCNN标准Loss函数对所述RPN网络进行反向传播训练,得到训练后的RPN网络。优选地,还包括:FasterRCNN网络接入模块,用于将所述student网络的RPN网络、FasterRCNN头部网络接入所述检测目标图像的所述矩形框以及对应的检测类别;FasterRCNN网络训练模块,用于利用所述FasterRCNN头部网络的FasterRCNN标准Loss函数对所述FasterRCNN头部网络进行反向传播训练,得到训练后的FasterRCNN头部网络。优选地,所述特征比较模块,包括:通道调整单元,用于将所述student网络第四层的通道数量扩充到与所述teacher网络第四层的通道数量相同;特征值输入单元,用于所述teacher网络中第四层的第一特征值、所述student网络中的第四层的扩充后的第二特征值输入到L2Loss函数;比对结果确定单元,用于将所述L2Loss函数的结果确定为比对结果,以便对student网络进行反向传播训练;其中,所述L2Loss函数为:s为teacher网络中第四层的第一特征值;t为student网络中的第四层的第二特征值;r(t)为student网络中的第四层的扩充后的第二特征值;所述N为s-r(t)的元素个数。第三方面,本专利技术提供一种用于目标检测的神经网络训练设备,该设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上述第一方面任一种所述用于目标检测的神经网络训练方法的步骤。第四方面,本专利技术提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面任一种所述用于目标检测的神经网络训练方法的步骤。本专利技术提供一种用于目标检测的神经网络训练方法,该方法包括:S1:将检测目标图像输入teacher网络、student网络;S2:将所述teacher网络中第四层的第一特征值、所述student网络中的第四层的第二特征值,进行比较,得到比对结果;S3:利用所述比对结果,对所述student网络进行调整,并进入步骤S2,直到得到的比对结果小于预设阈值,以得到训练后的student网络;其中,所述teacher网络与所述student网络的总体构架相同;所述teacher网络处于前向预测模式,所述student网络处于训练模式;所述teacher网络的通道数比所述student网络的通道数多;所述检测目标图像,设有检测目标的矩形框以及所述检测目标的标签类别。本专利技术针对检测目标图像,将teach本文档来自技高网...

【技术保护点】
1.一种用于目标检测的神经网络训练方法,其特征在于,包括:S1:将检测目标图像输入teacher网络、student网络;S2:将所述teacher网络中第四层的第一特征值、所述student网络中的第四层的第二特征值,进行比较,得到比对结果;S3:利用所述比对结果,对所述student网络进行调整,并进入步骤S2,直到得到的比对结果小于预设阈值,以得到训练后的student网络;其中,所述teacher网络与所述student网络的总体构架相同;所述teacher网络处于前向预测模式,所述student网络处于训练模式;所述teacher网络的通道数比所述student网络的通道数多;所述检测目标图像,设有检测目标的矩形框以及所述检测目标的标签类别。

【技术特征摘要】
1.一种用于目标检测的神经网络训练方法,其特征在于,包括:S1:将检测目标图像输入teacher网络、student网络;S2:将所述teacher网络中第四层的第一特征值、所述student网络中的第四层的第二特征值,进行比较,得到比对结果;S3:利用所述比对结果,对所述student网络进行调整,并进入步骤S2,直到得到的比对结果小于预设阈值,以得到训练后的student网络;其中,所述teacher网络与所述student网络的总体构架相同;所述teacher网络处于前向预测模式,所述student网络处于训练模式;所述teacher网络的通道数比所述student网络的通道数多;所述检测目标图像,设有检测目标的矩形框以及所述检测目标的标签类别。2.根据权利要求1所述的神经网络训练方法,其特征在于,在所述步骤S2:将所述teacher网络中第四层的第一特征值、所述student网络中的第四层的第二特征值,进行比较,得到比对结果的同时,还包括:将所述student网络的RPN网络接入所述检测目标图像的所述矩形框以及对应的检测类别;利用所述RPN网络的FasterRCNN标准Loss函数对所述RPN网络进行反向传播训练,得到训练后的RPN网络。3.根据权利要求1所述的神经网络训练方法,其特征在于,在所述步骤S2:将所述teacher网络中第四层的第一特征值、所述student网络中的第四层的第二特征值,进行比较,得到比对结果的同时,还包括:将所述student网络的RPN网络、FasterRCNN头部网络接入所述检测目标图像的所述矩形框以及对应的检测类别;利用所述FasterRCNN头部网络的FasterRCNN标准Loss函数对所述FasterRCNN头部网络进行反向传播训练,得到训练后的FasterRCNN头部网络。4.根据权利要求1至3任一项所述的神经网络训练方法,其特征在于,所述S2:将所述teacher网络中第四层的第一特征值、所述student网络中的第四层的第二特征值,进行比较,得到比对结果,包括:将所述student网络第四层的通道数量扩充到与所述teacher网络第四层的通道数量相同;所述teacher网络中第四层的第一特征值、所述student网络中的第四层的扩充后的第二特征值输入到L2Loss函数;将所述L2Loss函数的结果确定为比对结果,以便对student网络进行反向传播训练;其中,所述L2Loss函数为:s为teacher网络中第四层的第一特征值;t为student网络中的第四层的第二特征值;r(t)为student网络中的第四层的扩充后的第二特征值;所述N为s-r(t)的元素个数。5.一种用于目标检测的神经网络训练装置,其特征在于,包括:目标图像输入模块,用于实现步骤S1:将检测目标图像输入teache...

【专利技术属性】
技术研发人员:宋波
申请(专利权)人:北京影谱科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1