检测框确定方法、装置、电子设备和存储介质制造方法及图纸

技术编号：37508957 阅读：15 留言：0更新日期：2023-05-07 09:48

本公开涉及图像处理技术领域，尤其涉及一种检测框确定方法、装置、电子设备和存储介质。其中，该检测框确定方法，包括：采用全卷积神经网络中的轻量化神经网络shuffnet对输入图像进行特征提取，获取输入图像对应的特征集合；采用全卷积神经网络中的特征金字塔对特征集合进行多尺寸特征提取，得到至少一个特征子集；采用全卷积神经网络中的共享检测头对至少一个特征子集中任一特征子集进行特征检测，输出输入图像对应的3D目标检测框集合。采用本公开降低网络复杂度，缓解内存和带宽的压力，降低对部署硬件的要求，适用范围广。适用范围广。适用范围广。

全部详细技术资料下载

【技术实现步骤摘要】
检测框确定方法、装置、电子设备和存储介质

[0001]本公开涉及图像处理
，尤其涉及一种检测框确定方法、装置、电子设备和存储介质。

技术介绍

[0002]三维目标检测的检测精度较高，在自动驾驶等多个领域被广泛应用。其中，基于单目相机的3D检测技术由于成本较低和便于推广使用，在自动驾驶领域中得到应用。
[0003]相关技术中，基于单目相机的3D检测中，需要基于单个相机的图像结合相机的标定，预测得到行人、机动车、非机动车等目标的三维检测框。其中，由于3D检测任务的高复杂性，在单目相机3D检测算法中需要运用神经网络，并依赖神经网络强大的特征提取能力，提升单目3D检测的精度。同时，神经网络的预测精度与模型的大小息息相关，并且当模型更大时的网络准确度会更高。基于此，大多数基于神经网络的单目相机3D检测方法会将神经网络设计的十分复杂，以追求更高的精度。但是，复杂度高的神经网络存在太多人为控制的因素，无法实现端到端的训练并推广使用，且复杂的神经网络需要消耗更大的内存和带宽，对硬件要求较高。

技术实现思路

[0004]本公开提供一种检测框确定方法、装置、电子设备和存储介质，以至少解决相关技术中神经网络复杂度高，无法实现端到端的训练与推广，内存和带宽消耗较大的问题。本公开的技术方案如下：
[0005]根据本公开实施例的第一方面，提供一种检测框确定方法，包括：
[0006]采用全卷积神经网络中的轻量化神经网络shuffnet对输入图像进行特征提取，获取所述输入图像对应的特征集合；
[...

【技术保护点】

【技术特征摘要】
1.一种检测框确定方法，包括：采用全卷积神经网络中的轻量化神经网络shuffnet对输入图像进行特征提取，获取所述输入图像对应的特征集合；采用所述全卷积神经网络中的特征金字塔对所述特征集合进行多尺寸特征提取，得到至少一个特征子集；采用所述全卷积神经网络中的共享检测头对所述至少一个特征子集中任一特征子集进行特征检测，输出所述输入图像对应的3D目标检测框集合。2.根据权利要求1所述的方法，其中，在所述输出所述输入图像对应的3D目标检测框集合之前，还包括：获取所述输入图像对应的初始3D目标检测框集合；获取所述初始3D目标检测框集合中任一初始3D目标检测框与中心位置的距离信息，其中，所述中心位置为所述输入图像的中心位置；获取所述任一初始3D目标检测框对应的类别信息；根据所述距离信息和所述类别信息，确定所述任一初始3D目标检测框对应的分数；在所述分数大于分数阈值的情况下，将所述任一初始3D目标检测框添加至3D目标检测框集合。3.根据权利要求2所述的方法，其中，所述输出所述输入图像对应的3D目标检测框集合，包括：根据所述输入图像对应的3D目标检测框集合中至少一个3D目标检测框的分数，输出所述3D目标检测框集合。4.根据权利要求1所述的方法，其中，所述采用所述全卷积神经网络中的特征金字塔模型对所述特征集合进行多尺寸特征提取，得到至少一个特征子集，包括：获取所述全卷积神经网络中的特征金字塔模型对应的至少一个检测层，其中，不同的检测层用于预测不同尺寸的目标；按照所述至少一个检测层对应的检测顺序，对所述特征集合进行多尺寸特征提取，得到至少一个特征子集。5.根据权利要求1所述的方法，其中，所述方法还包括：在所述全卷...

【专利技术属性】
技术研发人员：刘建伟，
申请(专利权)人：爱芯元智半导体上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人