一种多目标检测方法、装置、系统、设备及可读存储介质制造方法及图纸

技术编号：26259963 阅读：23 留言：0更新日期：2020-11-06 17:55

本发明专利技术公开了一种多目标检测方法、装置、系统、设备及可读存储介质，其中，该多目标检测方法包括：获取输入图像在多个尺度下的特征图；将多个尺度的特征图输入多尺度特征融合层进行融合，分别得到输入图像在多个尺度下的各目标对应的预测位置和预测类别；将各目标对应的预测位置和预测类别进行合并，得到目标位置和目标类别。通过实施本发明专利技术，提升了尺度范围较大时的多目标检测能力，无需进行复杂的特征提取操作，保证了目标检测的实时性。

全部详细技术资料下载

【技术实现步骤摘要】
一种多目标检测方法、装置、系统、设备及可读存储介质
本专利技术涉及自动驾驶
，具体涉及一种多目标检测方法、装置、系统、设备及可读存储介质。
技术介绍
目标检测是自动驾驶领域的一个重要任务。主要检测的目标分为两类：静止目标和运动目标。静止目标如交通灯、交通标识等，运动目标如车辆、行人、非机动车等。目标检测的精度和速度缺一不可，较低的检测精度或者过大的计算延迟都会造成致命的危险。基于yolo系列的实时检测算法兼具较好的检测实时性和准确度，因此被广泛采用和改进。然而，该网络是一个端到端的全卷积结构，使用大量的跳层连接可以实现较深的网络层次，在实时目标检测方面取得了一定的成就，但其检测精度不足；虽然通过增大输入图像的分辨率可以提高检测精度，但同时会导致计算量大幅增加，无法满足实时性。而在实际的应用中，需要同时对多类目标进行检测，且类别之间目标的像素尺度差异较大，对于像素尺度范围较大的复杂场景，现有检测算法无法同时满足检测精度和实时性的需求。
技术实现思路
因此，本专利技术要解决的技术问题在于克服现有技术中的检测算法无法兼顾检测精度和实时性的缺陷，从而提供一种多目标检测方法、装置、系统、设备及可读存储介质。根据第一方面，本专利技术实施例提供一种多目标检测方法，包括：获取输入图像在多个尺度下的特征图；将所述多个尺度的特征图输入多尺度特征融合层进行融合，分别得到所述输入图像在多个尺度下的各目标对应的预测位置和预测类别；将所述各目标对应的预测位置和预测类别进行合并，得到目标位置和目标类别。<...

【技术保护点】
1.一种多目标检测方法，其特征在于，包括：/n获取输入图像在多个尺度下的特征图；/n将所述多个尺度的特征图输入多尺度特征融合层进行融合，分别得到所述输入图像在多个尺度下的各目标对应的预测位置和预测类别；/n将所述各目标对应的预测位置和预测类别进行合并，得到目标位置和目标类别。/n

【技术特征摘要】
1.一种多目标检测方法，其特征在于，包括：
获取输入图像在多个尺度下的特征图；
将所述多个尺度的特征图输入多尺度特征融合层进行融合，分别得到所述输入图像在多个尺度下的各目标对应的预测位置和预测类别；
将所述各目标对应的预测位置和预测类别进行合并，得到目标位置和目标类别。

2.根据权利要求1所述的方法，其特征在于，所述获取输入图像在多个尺度下的特征图，包括：
将所述输入图像输入至卷积神经网络，提取所述输入图像的图像浅层特征数据，将所述图像浅层特征数据嵌入到高维度特征空间中，得到对应的第一特征；
将所述第一特征输入至残差神经网络，对第一特征进行不同次数的下采样处理和深层嵌入处理，得到多个不同尺度的特征图。

3.根据权利要求2所述的方法，其特征在于，所述将所述第一特征输入至残差神经网络，对第一特征进行不同次数的下采样处理和深层嵌入处理，得到多个不同尺度的特征图，包括：
将所述第一特征输入至第一残差神经网络，对第一特征进行第一预设次数的下采样处理和深层非线性嵌入处理，得到第一特征图；
将所述第一特征图输入至第二残差神经网络，对第一特征图进行第二预设次数的下采样处理和深层嵌入处理，得到第二特征图，所述第二特征图的尺度大于所述第一特征图的尺度；
将所述第二特征图输入至第三残差神经网络，对第二特征图进行第三预设次数的下采样处理和深层嵌入处理，得到第三特征图，所述第三特征图的尺度大于所述第二特征图的尺度。

4.根据权利要求3所述的方法，其特征在于，所述将所述多个尺度的特征图输入多尺度特征融合层进行融合，分别得到所述输入图像在多个尺度下的各目标对应的预测位置和预测类别，包括：
分别将所述第一特征图、所述第二特征图和所述第三特征图输入至第一多尺度特征融合层、第二多尺度特征融合层和第三多尺度特征融合层进行多尺度特征融合，对应得到第一融合图、第二融合图和第三融合图；
将所述第一融合图、所述第二融合图和所述第三融合图分别输入至第一卷积组合神经网络、第二卷积组合神经网络和第三卷积组合神经网络进行高维非线性嵌入，得到所述第一融合图对应的第一预测位置和第一预测类别、所述第二融合图对应的第二预测位置和第二预测类别和所述第三融合图对应的第三预测位置和第三预测类别。

5.根据权利要求4所述的方法，其特征在于，在将所述第二特征图输入至第二多尺度特征融合层进行融合之前，还包括：
将所述第三融合图与所述第二残差神经网络输出的所述第二特征图进行第一拼接，生成第一拼接图，将所述第一拼接图作为第二多尺度特征融合层的输入。

6.根据权利要求5所述的方法，其特征在于，在将所述第一特征图输入至第一多尺度特征融合层进行融合之前，还包括：
将所述第二融合图与所述第一残差神经网络输出的所述第一特征图进行第二拼接，生成第二拼接图，将所述第二拼接图作为第一多尺度特征融合...

【专利技术属性】
技术研发人员：赵盼，李军，林昱，张庆，温悦，
申请(专利权)人：国汽北京智能网联汽车研究院有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人