System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种应用于复杂交通场景的实时目标检测系统及方法技术方案_技高网

一种应用于复杂交通场景的实时目标检测系统及方法技术方案

技术编号:40398474 阅读:6 留言:0更新日期:2024-02-20 22:25
本发明专利技术属于人工智能中的智能交通目标检测领域,公开了一种应用于复杂交通场景的实时目标检测系统及方法,包括基础锚框匹配模块和双向多池化注意力模块,其特征在于:上述模块在目标检测过程中充分提取图像的各个尺度的特征,以低模型复杂度完成目标的识别分类。所述基础锚框匹配模块中,首先随机生成N个大小、尺寸都随机初始化的锚框,然后根据设置的距离生成算法计算样本中真实框与N个框之间的距离,并且实时调整N个框的大小,最后迭代1000轮,生成适合预测目标的锚框。所述距离生成算法采用宽高比、IOU,利用相关数ω1、ω2来控制IOU、宽高比对于候选锚框和真实框的影响程度,重新刻画的锚框与真实框的距离。

【技术实现步骤摘要】

本专利技术属于人工智能中的智能交通目标检测领域,其目的在于提供一种适用于遮挡、弱光等复杂交通场景的道路目标检测方法。


技术介绍

1、在道路目标检测领域中,首先会使用摄像头、雷达传感器等器件获取道路的实时交通状况信息,然后通过机器学习或者是深度学习的方法来构建模型,从而识别到图像中的道路目标(例如车辆、行人、交通灯等)信息。通过这种方法获取到的信息常作为自动驾驶、智能交通领域中的重要参考信息。

2、在自动驾驶和智能交通等领域中,由于车载嵌入式设备、无人机、移动终端等的计算资源有限,道路目标检测模型的运算效率通常会受到设备处理性能的限制,因此,需要构建一种轻量化的、实用于复杂交通场景的实时目标检测方法。目前,对于道路目标检测模型简化采用的常用方法是降低计算和存储开销,以达到优化检测模型的目的,如网络剪枝、参数量化等方法。这些方法对道路目标检测具有一定的效果,然而,面对复杂的交通场景和交通工具的快速运行,现有的这些道路目标检测模型面临很多困难,具体体现在:(1)复杂的交通场景需要目标检测模型具有快速的检测和识别能力;(2)交通工具的快速运行需要目标检测模型实现快速定位、判断和决策能力:(3)针对光线不充足的场景,现有的道路目标检测方法是对图像进行数据增强,提高分辨率,以达到对暗光图像进行增强的效果。这种方式虽然能一定程度提高目标检测的准确度,但加大了模型的参数量和复杂度,这对于低算度的道路交通设备是负担不起的;(4)针对光线不充足的场景,强行提高亮度也许会解决光线不足的问题,但是也会带来图像失真的问题,这会影响模型的整体识别的准确度。另外,对于检测过程中存在遮挡物的问题,现有的研究常采用三维信息融合的方式来解决遮挡问题。这种方法虽然能一定程度改善此问题,但三维数据需要特殊的设备进行采集,增加了硬件成本,而且,处理额外的三维信息也会增加本身的复杂度,使识别速度大幅度下降。

3、针对上述问题,在遵循现有的传感器图像获取、图像信息传输、处理器结果分析的基础上,我们将采用一种新的兼顾实时性和轻量化的道路目标检测方法。通过此方法,可以对传感器传输的图片进行智能识别分析。


技术实现思路

1、为了解决现有技术中存在的上述技术问题,本专利技术目的在于:在目标检测模型中,构建了:(1)基础锚框匹配模块(2)双向多池化注意力模块。这两个模块适用于绝大多数的单阶段和双阶段的目标检测方法,达到即插即用、增强模型性能的作用。通过这两个模块,在目标检测的过程中充分提取图像的各个尺度的特征并且以较低的模型复杂度完成目标的识别分类。

2、为了解决上述问题,在本专利技术的基础锚框匹配模块中,首先随机生成n个大小、尺寸都随机初始化的锚框,然后根据设置的距离生成算法计算样本中真实框与n个框之间的距离,并且实时调整n个框的大小,最后迭代1000轮,生成适合预测目标的锚框。在这个过程中,设置的距离生成算法的好坏决定了最后生成的锚框预测的准确度。在这个模块中,将宽高比、iou都纳入了计算的范畴,用ω1、ω2来控制iou、宽高比对于候选锚框和真实框的影响程度,重新刻画的锚框与真实框的距离。采取这种距离生成算法,可以避免在实际应用场景中生成的预测框与物体应有的框体产生较大的偏差,这些偏差往往是由观察距离、可视角度等因素引起的。

3、为了解决上述问题,在本专利技术的双向多池化注意力模块中,首先,对于输入的特征层,在其二维的x轴和y轴两个方向上进行四次池化操作(包括全局平均池化和全局最大池化),与此同时,将原始的输入特征层直接加入到最后的运算过程用于辅助运算;然后,将各个池化小模块的输出进行连接、激活、卷积,拆分后连同前面的原始输入特征共同连接,形成一个一个新的特征层。本专利技术的双向多池化注意力模块的优势在于只增加了很小一部分额外参数的同时,提高了模型的检测和泛化能力,使得模型能够在关注背景信息的同时也关注特征的纹理信息,从而达到更好地捕获特征信息的效果。

4、本专利技术的用于复杂交通场景的实时目标检测方法具有以下优点及其效果:

5、1.采用了基础锚框匹配模块

6、考虑到在目标检测的模型推断过程中,不同目标在图像中可能具有不同的尺度,如果不能生成尺寸适合的锚框,会造成在检测过程中锚框定位不准确、尺度适应性差、多重匹配等问题。在本模块中,首先获取训练集中每张图像标注框的位置和类别信息,然后结合真实框与目标框宽高比的相似程度以及真实框到聚类中心的距离,引入相关数(ω1、ω2),计算并生成尺寸合适的锚框。采用这种算法计算锚框,重新定义了候选锚框到聚类中心的距离,筛选出了最适合用于预测目标的锚框尺寸,使得整体的目标检测模型能够高效地进行多目标检测。锚框生成过程中的覆盖不完全和多重匹配问题是由于锚框覆盖面积与真实框相比太大或是太小造成的,在该模块中使用(ω1、ω2)两个参数来限制交并比和宽高参数对于锚框生成过程的影响,选择合适的参数可以生成尺寸相对合适的锚框。

7、2.采用了双向多池化注意力模块

8、传统的目标检测模型通常是由常规的卷积、bn层、激活函数搭建起来的,这样的模型通常无法关注到图像中那些较为重要或显著凸显目标特征的部分,并且会使用大量的计算资源去计算处理图像中那些无关紧要的区域。在目标检测模型中引入注意力机制模块可以解决这个问题,但引入一般的注意力模块会引起模型的参数增加、推断速度下降等问题。在本模块中,首先会对输入的特征层进行四次线性变换(包括在宽高方向上的全局平均池化和全局最大池化),通过四次线性变换,使模型在关注背景信息的同时也关注特征的纹理信息,进而使得模型能够更好地捕获特征信息。然后将四个线性特征通过连接、卷积、激活等过程后,与原来的恒等映射相结合,形成新的特征图并传输到后续的模块中。采用本模块,可以在尽可能少的损失图像的空间信息的同时减少模型的参数量并提高模型的推理速度。

9、3.轻量化和实时性

10、在道路目标检测领域,承担计算处理的设备通常是一些嵌入式设备(比如移动设备或是专用集成电路等),这些设备具有存储空间小、计算能力受限等特点。另外,道路目标检测对模型的实时性有较高的要求,例如自动驾驶中的智能目标识别、障碍物检测等。本方法提出的基础锚框匹配模块中的锚框生成算法,并不会参与到模型实时场景推断过程中去,具备单次部署,随处运行的特点。在提高了目标检测的平均精度的同时,对模型的参数量、推理速度并不会产生影响。在本方法提出的双向多池化注意力模块中,使用新的注意力计算方法,在提高模型检测性能的同时只是略微增加了一些参数量,相比于传统的注意力机制可以极大的加快模型的推理速度。综上,在本方法提出的两个模块可以在增强模型的表示能力和推理能力的同时满足道路目标检测对于模型轻量化和实时性的要求。

11、4.良好的可扩展性

12、对于本方法提出的基础锚框匹配模块,在模型训练前就可以生成锚框的尺寸,锚框生成算法的计算过程并不会参与到训练、验证以及部署后的推理过程,对于用到锚框的单阶段和多阶段目标检测模型均具备完美的适应性。对于本方法提出本文档来自技高网...

【技术保护点】

1.一种应用于复杂交通场景的实时目标检测系统,包括基础锚框匹配模块和双向多池化注意力模块,其特征在于:上述模块在目标检测过程中充分提取图像的各个尺度的特征,以低模型复杂度完成目标的识别分类。

2.如权利要求1所述的应用于复杂交通场景的实时目标检测系统,其特征在于:所述基础锚框匹配模块中,首先随机生成N个大小、尺寸都随机初始化的锚框,然后根据设置的距离生成算法计算样本中真实框与N个框之间的距离,并且实时调整N个框的大小,最后迭代1000轮,生成适合预测目标的锚框。

3.如权利要求2所述的应用于复杂交通场景的实时目标检测系统,其特征在于:所述距离生成算法采用宽高比、IOU,利用相关数ω1、ω2来控制IOU、宽高比对于候选锚框和真实框的影响程度,重新刻画的锚框与真实框的距离。

4.如权利要求1所述的应用于复杂交通场景的实时目标检测系统,其特征在于:在所述双向多池化注意力模块中,首先,对于输入的特征层,在其二维的x轴和y轴两个方向上进行四次池化操作,包括全局平均池化和全局最大池化,同时,将原始的输入特征层直接加入到最后的运算过程用于辅助运算;然后,将各个池化小模块的输出进行连接、激活、卷积,拆分后连同前面的原始输入特征共同连接,形成新的特征层。

5.一种应用于复杂交通场景的实时目标检测方法,其特征在于包括如下步骤:

...

【技术特征摘要】

1.一种应用于复杂交通场景的实时目标检测系统,包括基础锚框匹配模块和双向多池化注意力模块,其特征在于:上述模块在目标检测过程中充分提取图像的各个尺度的特征,以低模型复杂度完成目标的识别分类。

2.如权利要求1所述的应用于复杂交通场景的实时目标检测系统,其特征在于:所述基础锚框匹配模块中,首先随机生成n个大小、尺寸都随机初始化的锚框,然后根据设置的距离生成算法计算样本中真实框与n个框之间的距离,并且实时调整n个框的大小,最后迭代1000轮,生成适合预测目标的锚框。

3.如权利要求2所述的应用于复杂交通场景的实时目标检测系统,其特征在于:所述距离生成算法采用宽...

【专利技术属性】
技术研发人员:李运发李辉颜成刚殷海兵
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1