【技术实现步骤摘要】
深度学习模型的训练方法、目标检测方法及装置
[0001]本申请涉及人工智能
,尤其涉及计算机视觉、深度学习
,具体地涉及一种深度学习模型的训练方法、目标检测方法及装置。
技术介绍
[0002]由于受限于资源容量,深度学习模型很难部署在资源受限的设备上,例如:嵌入式设备或移动设备。为了解决该问题,目前可以利用知识蒸馏技术,从大型的教师模型中学习到小型的学生模型。
技术实现思路
[0003]本申请提供了一种第一深度学习模型的训练方法、目标检测方法及装置。
[0004]根据本申请的一方面,提供了一种第一深度学习模型的训练方法,包括:利用第一深度学习模型对样本图像进行处理,得到第一图像特征;并根据初始位置分布特征图和第一图像特征,得到第一特征图,初始位置分布特征图表征目标对象在像素坐标空间内任一位置的分布概率。利用第二深度学习模型对样本图像进行处理,得到第二图像特征;并根据初始位置分布特征图和第二图像特征,得到第二特征图;其中,第二深度学习模型的各卷积层与第一深度学习模型的各卷积层一一对应。利用第 ...
【技术保护点】
【技术特征摘要】
1.一种深度学习模型的训练方法,包括:利用第一深度学习模型对样本图像进行处理,得到第一图像特征,并根据初始位置分布特征图和所述第一图像特征,得到第一特征图,所述初始位置分布特征图表征目标对象在像素坐标空间内任一位置的分布概率;利用第二深度学习模型对所述样本图像进行处理,得到第二图像特征,并根据所述初始位置分布特征图和所述第二图像特征,得到第二特征图;其中,所述第二深度学习模型的各卷积层与所述第一深度学习模型的各卷积层一一对应;利用所述第一深度学习模型对所述样本图像进行目标检测,得到第一检测结果;以及基于目标损失函数,根据所述第一检测结果、所述第一特征图和所述第二特征图,调整所述第一深度学习模型的模型参数和所述初始位置分布特征图,得到与所述样本图像对应的目标位置分布特征图和经训练的第一深度学习模型。2.根据权利要求1所述的方法,其中,所述目标损失函数包括真值损失函数和蒸馏损失函数;所述基于目标损失函数,根据所述第一检测结果、所述第一特征图和所述第二特征图,调整所述第一深度学习模型的模型参数和所述初始位置分布特征图,得到与所述样本图像对应的目标位置分布特征图和经训练的第一深度学习模型,包括:基于所述蒸馏损失函数,根据所述第一特征图和所述第二特征图,得到蒸馏损失;基于所述真值损失函数,根据所述第一检测结果和所述样本图像的标签,得到检测结果损失;以及基于所述蒸馏损失和所述检测结果损失,调整所述第一深度学习模型的模型参数和所述初始位置分布特征图,得到经训练的第一深度学习模型和所述目标位置分布特征图。3.根据权利要求2所述的方法,其中,基于所述蒸馏损失和所述检测结果损失,调整所述第一深度学习模型的模型参数和所述初始位置分布特征图,得到经训练的第一深度学习模型和所述目标位置分布特征图,包括:基于所述蒸馏损失和所述检测结果损失,调整所述第一深度学习模型的模型参数和所述初始位置分布特征图,得到经训练的第一深度学习模型,并从位置分布特征图集中得到所述目标位置分布特征图。4.根据权利要求3所述的方法,其中,所述位置分布特征图集包括S个位置分布特征图,S为大于1的整数;所述基于所述蒸馏损失和所述检测结果损失,调整所述第一深度学习模型的模型参数和所述初始位置分布特征图,得到经训练的第一深度学习模型,并从位置分布特征图集中得到所述目标位置分布特征图,包括:针对第s个位置分布特征图,利用所述第二深度学习模型对所述第一深度学习模型进行第s轮训练,得到第s个蒸馏损失和第s个检测结果损失,其中,s为大于等于1且小于S的整数;根据所述第s个蒸馏损失和所述第s个检测结果损失,得到第s个目标损失;在确定所述第s个目标损失大于预定阈值的情况下,调整所述第一深度学习模型的模型参数,并递增s,返回执行所述利用所述第二深度学习模型对所述第一深度学习模型进行第s轮训练的操作;以及在确定所述第s个目标损失小于等于所述预定阈值的情况下,得到所述经训练的第一深度学习模型,并将所述第s个位置分布特征图确定为所述目标位置分布特征图。
5.根据权利要求1所述的方法,其中,所述利用第一深度学习模型对样本图像进行处理,得到第一图像特征,包括:对所述样本图像进行数据增强处理,得到第一增强样本图像;以及利用所述第一深度学习模型对所述第一增强样本图像进行处理,得到所述第一图像特征。6.根据权利要求5所述的方法,其中,所述对所述样本图像进行数据增强处理,得到第一增强样本图像,包括:对所述样本图像进行几何变换处理,得到多个第一样本图像;以及对所述多个第一样本图像进行归一化处理,得到所述第一增强样本图像。7.根据权利要求5所述的方法,其中,所述对所述样本图像进行数据增强处理,得到第一增强样本图像,包括:对所述样本图像进行像素重分布处理,得到多个第二样本图像;以及对所述多个第二样本图像进行归一化处理,得到所述第一增强样本图像。8.根据权利要求1所述的方法,其中,所述根据初始位置分布特征图和所述第一图像特征,得到第一特征图,包括:根据所述初始位置分布特征图,确定初始检测位置特征;根据所述初始检测位置特征,从所述第一图像特征中得到第一目标图像特征;以及根据所述第一目标图像特征,生成所述第一特征图。9.根据权利要求1所述的方法,其中,所述利用第二深度学习模型对所述样本图像进行处理,得到第二图像特征,包括:对所述样本图像进行数据增强处理,得到第二增强样本图像;其中,所述第二增强样本图像与利用第一深度学习模型对所述样本图像进行数据增强处理得到的第一增强样本图像相同;以及利用所述第二深度学习模型对所述第二增强样本图像进行处理,得到所述第二图像特征。10.根据权利要求1所述的方法,其中,所述根据所述初始位置分布特征图和所述第二图像特征,得到第二特征图,包括:根据所述初始位置分布特征图,确定初始检测位置特征;根据所述初始检测位置特征,从所述第二图像特征中得到第二目标图像特征;以及根据所述第二目标图像特征,生成所述第二特征图。11.根据权利要求1所述的方法,其中,所述第一深度学习模型包括卷积层和全连接层,所述卷积层包括特征提取层和特征筛选层,所述全连接层包括类别回归层和位置回归层,所述特征筛选层的输入端与所述特征提取层的输出端连接,所述特征筛选层的输出端分别与所述类别回归层的输入端、所述位置回归层的输入端连接,所述利用所述第一深度学习模型对所述样本图像进行目标检测,得到第一检测结果,包括:利用所述特征提取层对所述样本图像进行处理,得到所述第一图像特征;利用所述特征筛选层根据所述第一深度学习模型的预定位置特征分布图和所述第一图像特征,得到第三特征图;以及利用所述类别回归层和所述位置回归层分别对所述第三特征图进行处理,得到所述第
一检测结果。12.根据权利要求11所述的方法,其中,所述利用所述类别回归层和所述位置回归层分别对所述第三特征图进行处理,得到所述第一检测结果,包括:利用所述类别回归层对所述第三特征图进行处理,得到第一类别检测结果;利用所述位置回归层对所述第三特征图进行处理,得到第一位置检测结果;以及根据所述第一类别检测结果和所述第一位置检测结果,得到所述第一检测结果。13.一种目标检测方法,包括:获取待检测图像;利用第一深度学习模型对所述待检测图像进行处理,得到目标检测结果,其中,所述第一深度学习模型是利用权利要求1~12任一项所述的训练方法训练得到的。14.根据权利要求13所述的目标检测方法,其中,所述第一深度学习模型包括卷积层和全连接层,所述卷积层包括特征提取层和特征筛选层,所述全连接层包括类别回归层和位置回归层,所述特征筛选层的输入端与所述特征提取层的输出端连接,所述特征筛选层的输出端分别与所述类别回归层的输入端、所述位置回归层的输入端连接,所述利用第一深度学习模型对待检测图像进行处理,得到目标检测结果,包括:利用所述特征提取层对所述待检测图像进行处理,得到待检测的图像特征;根据所述待检测图像,确定目标位置分布特征图;利用所述特征筛选层,根据所述目标位置分布特征图和所述待检测的图像特征,得到待检测的特征图;以及利用所述类别回归层和所述位置回归层分别对所述待检测的特征图进行处理,得到目标检测结果。15.根据权利要求14所述的方法,其中,所述利用所述特征提取层对所述待检测图像进行处理,得到待检测的图像特征,包括:对所述待检测图像进行数据增强处理,得到特征增强的待检测图像;以及利用所述特征提取层对所述特征增强的待检测图像进行处理,得到所述待检测的图像特征。16.根据权利要求15所述的方法,其中,所述对待检测图像进行数据增强处理,得到特征增强的待检测图像,包括:对所述对待检测图像按照不同比例进行几何变换处理,得到多个第一待检测图像;以及对所述多个第一待检测图像进行归一化处理,得到所述特征增强的待检测图像。17.根据权利要求15所述的方法,其中,所述对待检测图像进行数据增强处理,得到特征增强的待检测图像,包括:对所述对待检测图像进行像素重分布处理,得到多个第二待检测图像;以及对所述多个第二待检测图像进行归一化处理,得到所述特征增强的待检测图像。18.根据权利要求14所述的方法,其中,所述利用所述特征筛选层,根据所述目标位置分布特征图和所述待检测的图像特征,得到待检测的特征图,包括:根据所述目标位置分布特征图,确定目标位置特征;利用所述特征筛选层,根据所述目标位置特征,从所述待检测的图像特征中得到待检
测的目标图像特征,以及根据所述待检测的目标图像特征,生成所述待检测的特征图。19.根据权利要求14所述的方法,其中,所述利用所述类别回归层和所述位置回归层对所述待检测的特征图进行处理,得到目标检测结果,包括:利用所述类别回归层对所述待检测的特征图进行处理,得到第一类别检测结果;利用所述位置回归层对所述待检测的特征图进行处理,得到第一位置检测结果;以及根据所述第一类别检测结果和所述第一位置检测结果,得到所述目标检测结果。20.一种深度学习模型的训练装置,包括:第一处理模块,用于利用第一深度学习模型对样本图像进行处理,得到第一图像特征;并根据初始位置分布特征图和所述第一图像特征...
【专利技术属性】
技术研发人员:汪瑜,王海峰,吴甜,王井东,丁二锐,张刚,冯浩城,韩钧宇,李鑫,温圣召,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。