神经网络模型的处理方法及装置、电子设备、存储介质制造方法及图纸

技术编号:22330850 阅读:49 留言:0更新日期:2019-10-19 12:24
本申请公开了一种神经网络模型的处理方法及装置、电子设备,所述方法包括:获取第一神经网络模型;获取第一样本图像,所述第一样本图像的采集视角为第一视角;基于所述第一样本图像,对所述第一神经网络模型进行训练,得到训练好的所述第一神经网络模型。

【技术实现步骤摘要】
神经网络模型的处理方法及装置、电子设备、存储介质
本申请涉及计算机视觉技术,尤其涉及一种神经网络模型的处理方法及装置、电子设备、存储介质。
技术介绍
近年来,计算机视觉技术发展迅速,现在人们已经可以使用训练好的神经网络模型完成各种视觉任务,如图像分类、物体追踪、人脸识别等。依靠技术的发展,训练和使用这些神经网络模型的成本越来越低,支持深度学习框架与一些特殊硬件的平台可以加载以及使用这样的神经网络模型,如机器人。机器人可搭载视觉传感器获取视觉信号输入,并且支持深度学习框架。但是,机器人的视角为仰视视角,使得传感器的输入有视角限制,神经网络模型不能直接迁移到机器人上。
技术实现思路
本申请实施例提供了一种神经网络模型的处理方法及装置、电子设备、计算机程序及存储介质。本申请实施例提供的神经网络模型的处理方法,包括:获取第一神经网络模型;获取第一样本图像,所述第一样本图像的采集视角为第一视角;基于所述第一样本图像,对所述第一神经网络模型进行训练,得到训练好的所述第一神经网络模型。上述技术方案,采用具有第一视角的第一样本图像来训练第一神经网络模型,训练好的所述第一神经网络模型可以适用于具有第一视角的图像的标签预测。在本申请一可选实施方式中,所述方法还包括:获取所述第一样本图像后,对所述第一样本图像进行以下至少一种处理操作:翻转、旋转、剪裁、平移、亮度调节,得到至少一张处理后的第一样本图像;所述基于所述第一样本图像,对所述第一神经网络模型进行训练,包括:基于所述第一样本图像和所述至少一张处理后的第一样本图像,对所述第一神经网络模型进行训练。上述技术方案,获取到具有第一视角的第一样本图像后,对该第一样本图像采用翻转、旋转、剪裁、平移、亮度调节等任意一种或多种操作进行处理,可以实现数据扩充,增加数据丰富性,有利于提高对第一神经网络模型的训练效果。在本申请一可选实施方式中,所述获取第一神经网络模型,包括:获取待处理模型;获取第二样本图像,所述第二样本图像的采集视角为第二视角;基于所述第二样本图像,对所述待处理模型进行训练,得到所述第一神经网络模型。上述技术方案,具有第二视角的第二样本图像和具有第一视角的第一样本图像在视角上有差别,在特征上基本一致,通过具有第二视角的第二样本图像对待处理模型进行训练,得到的第一神经网络模型在特征提取部分预先达到了优化,有利于提高第一神经网络模型的训练效率。在本申请一可选实施方式中,所述方法还包括:获取所要执行的视觉任务;根据所要执行的视觉任务,选择所述视觉任务对应的待处理模型。上述技术方案,不同的视觉任务对应不同的处理模型,获取所要执行的视觉任务;根据所要执行的视觉任务,选择所述视觉任务对应的待处理模型,使得待处理模型符合电子设备的任务需求。在本申请一可选实施方式中,所述方法还包括:对训练好的所述第一神经网络模型进行压缩,得到第二神经网络模型。上述技术方案,通过对训练好的所述第一神经网络模型进行压缩,得到简化的第二神经网络模型在处理速度上得到大大提高,另一方面,简化的第二神经网络模型能够适用于处理能力较低的电子设备,降低了电子设备的硬件要求。在本申请一可选实施方式中,所述对训练好的所述第一神经网络模型进行压缩,得到第二神经网络模型,包括:对训练好的所述第一神经网络模型进行剪裁,或者对训练好的所述第一神经网络模型进行剪裁并重训练,得到第二神经网络模型。在本申请一可选实施方式中,所述对训练好的所述第一神经网络模型进行剪裁,包括:从训练好的所述第一神经网络模型中确定出待剪裁的目标对象,所述目标对象至少包括网络层和神经元中的一种;从训练好的所述第一神经网络模型中删除所述目标对象。上述技术方案,通过剪裁,或者剪裁加重训练的方式来压缩训练好的所述第一神经网络模型,得到的第二神经网络模型中的参数被大大压缩,简化的第二神经网络模型在处理速度上得到大大提高,另一方面,简化的第二神经网络模型能够适用于处理能力较低的电子设备,降低了电子设备的硬件要求。在本申请一可选实施方式中,所述对训练好的所述第一神经网络模型进行压缩,得到第二神经网络模型,包括:获取目标神经网络模型,所述目标神经网络模型为训练好的所述第一神经网络模型的简化模型;利用训练好的所述第一神经网络模型,计算第三样本图像的第一预测标签;所述第三样本图像标注有第三真实标签;基于所述第三样本图像,所述第一预测标签以及所述第三真实标签,训练所述目标神经网络模型;其中,训练好的所述目标神经网络模型为所述第二神经网络。在本申请一可选实施方式中,所述基于所述第三样本图像,所述第一预测标签以及所述第三真实标签,训练所述目标神经网络,包括:利用所述目标神经网络,计算所述第三样本图像的第二预测标签和第三预测标签;计算所述第一预测标签和所述第二预测标签的第一损失值,以及所述第三预测标签和所述第三真实标签的第二损失值;基于所述第一损失值和所述第二损失值,计算目标损失值;基于所述目标损失值,更新所述目标神经网络的参数。在本申请一可选实施方式中,所述基于所述第一损失值和所述第二损失值,计算目标损失值,包括:基于第一加权系数和第二加权系数,计算所述第一损失值和所述第二损失值的加权平均值,得到目标损失值;其中,所述第一加权系数是所述第一损失值对应的加权系数,所述第二加权系数是所述第二损失值对应的加权系数。上述技术方案,通过知识蒸馏的方式来压缩训练好的所述第一神经网络模型,具体地,将训练好的所述第一神经网络模型作为大模型,将目标神经网络模型作为小模型,通过大模型的预测结果来辅助小模型的训练,有利于提高小模型的训练效率。训练好的小模型即为简化的第二神经网络模型,简化的第二神经网络模型在处理速度上得到大大提高,另一方面,简化的第二神经网络模型能够适用于处理能力较低的电子设备,降低了电子设备的硬件要求。在本申请一可选实施方式中,所述第三样本图像的采集视角为所述第一视角。在本申请一可选实施方式中,所述方法还包括:将所述第二神经网络模型加载到电子设备上,所述电子设备具有图像采集设备,所述图像采集设备的采集视角为所述第一视角。上述技术方案,将第二神经网络模型加载在电子设备中,电子设备的采集视角为第一视角的情况下,该第二神经网络模型可以适用于处理第一视角的图像,从而拓展了电子设备所支持的神经网络模型,丰富了电子设备的视觉处理功能。在本申请一可选实施方式中,所述方法还包括:控制所述电子设备对所述第二神经网络模型进行模型测试。上述技术方案,将第二神经网络模型在电子设备上试运行(即测试),测试结果满足要求后,即可将第二神经网络模型在电子设备上正式使用。测试结果不满足要求的情况下,可以根据测试结果重新训练第二神经网络模型,从而保障电子设备上正式使用的第二神经网络模型满足电子设备的需求。本申请实施例提供的神经网络模型的处理装置,包括:第一获取单元,用于获取第一神经网络模型;第二获取单元,用于获取第一样本图像,所述第一样本图像的采集视角为第一视角;训练单元,用于基于所述第一样本图像,对所述第一神经网络模型进行训练,得到训练好的所述第一神经网络模型。上述技术方案,采用具有第一视角的第一样本图像来训练第一神经网络模型,训练好的所述第一神经网络模型可以适用于具有第一视角的图像的标签预测。在本申请一可选实本文档来自技高网...

【技术保护点】
1.一种神经网络模型的处理方法,其特征在于,所述方法包括:获取第一神经网络模型;获取第一样本图像,所述第一样本图像的采集视角为第一视角;基于所述第一样本图像,对所述第一神经网络模型进行训练,得到训练好的所述第一神经网络模型。

【技术特征摘要】
1.一种神经网络模型的处理方法,其特征在于,所述方法包括:获取第一神经网络模型;获取第一样本图像,所述第一样本图像的采集视角为第一视角;基于所述第一样本图像,对所述第一神经网络模型进行训练,得到训练好的所述第一神经网络模型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述第一样本图像后,对所述第一样本图像进行以下至少一种处理操作:翻转、旋转、剪裁、平移、亮度调节,得到至少一张处理后的第一样本图像;所述基于所述第一样本图像,对所述第一神经网络模型进行训练,包括:基于所述第一样本图像和所述至少一张处理后的第一样本图像,对所述第一神经网络模型进行训练。3.根据权利要求1或2所述的方法,其特征在于,所述获取第一神经网络模型,包括:获取待处理模型;获取第二样本图像,所述第二样本图像的采集视角为第二视角;基于所述第二样本图像,对所述待处理模型进行训练,得到所述第一神经网络模型。4.根据权利要求3所述的方法,其特征在于,所述获取待处理模型包括:获取所要执行的视觉任务;根据所要执行的视觉任务,选择所述视觉任务对应的待处理模型。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:对训练好的所述第一神经网络模型进...

【专利技术属性】
技术研发人员:张军伟李诚梁逸清
申请(专利权)人:上海商汤智能科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1