一种多目标检测处理方法及装置制造方法及图纸

技术编号:32080578 阅读:29 留言:0更新日期:2022-01-29 17:57
本发明专利技术提供了一种多目标检测处理方法及装置,其中,该方法包括:提取目标图像的特征信息;根据空间金字塔池化SPP对所述特征信息进行空间特征池化处理,得到有效目标特征,并通过特征金字塔FPN对所述有效目标特征进行多尺度处理,得到多个尺寸的输出目标特征信息;根据所述有效目标特征以及所述特征信息确定所述目标图像中所述目标对象的目标检测框,从而可以解决相关技术中通过Dakrnet53网络在对大车的特征提取时存在表示不充分的问题,提升检测网络在大车目标上的检测召回率和精度。测网络在大车目标上的检测召回率和精度。测网络在大车目标上的检测召回率和精度。

【技术实现步骤摘要】
一种多目标检测处理方法及装置


[0001]本专利技术涉及图像处理领域,具体而言,涉及一种多目标检测处理方法及装置。

技术介绍

[0002]随着城市道路、高速、隧道和车辆急剧增多,使得对交通道路上摄像头产生的图像处理工作量增大,以致超出人工负荷。为解决这一问题,各种目标检测算法应运而生,并很快取得了大范围的应用。目前的目标检测算法可主要分为两类,即基于传统手工特征的目标检测算法和基于深度学习的目标检测算法。
[0003]基于传统手工特征的目标检测算法,如DPM(Deformable Parts Model),与HOG算法思路一致,可以视作HOG的一种扩展方法,然而这些手工特征无法充分提取图像中的目标特征,使得最终获得的特征表示矢量存在着一定的表达缺陷。
[0004]基于深度学习的目标检测算法是起步较晚的一种目标检测算法,发展至今已形成了双步的Faster-RCNN、Mask-RCNN检测算法和单步的SSD、YOLOV3检测算法。然而,双步的检测策略使得网络的复杂度变高和推理速度变慢从而无法满足实际应用中实时的需求;单步的检测算法虽本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多目标检测处理方法,其特征在于,包括:提取目标图像的特征信息;根据空间金字塔池化SPP对所述特征信息进行空间特征池化处理,得到有效目标特征,并通过特征金字塔FPN对所述有效目标特征进行多尺度处理,得到多个尺寸的输出目标特征信息;根据所述多个尺寸的输出目标特征信息确定所述目标图像中所述目标对象的目标检测框。2.根据权利要求1所述的方法,其特征在于,根据所述多个尺寸的输出目标特征信息确定所述目标图像中所述目标对象的目标检测框包括:根据所述多个尺寸的输出目标特征信息确定所述目标图像中目标对象的预测边框以及所述预测边框的置信度;根据所述预测边框的交并比及置信度确定所述目标图像中所述目标对象的目标检测框。3.根据权利要求2所述的方法,其特征在于,提取目标图像的特征信息包括:将所述目标图像输入预先训练好的目标检测轻量型DenseNet网络模型中,得到所述目标检测轻量型DenseNet网络模型输出的特征信息,其中,所述特征信息包括:所述目标轻量型DenseNet网络模型输出的目标特征、所述目标检测轻量型DenseNet网络模型的第一个Transition Layer中卷积层输出的第一特征以及第三个Transition Layer中卷积层输出的第二特征,所述目标检测轻量型DenseNet网络模型为卷积层、最大池化层、4个级联的Dense Block与第一个Transition Layer、8个Dense Block与第二个Transition Layer、10个Dense Block与第三个Transition Layer以及8个Dense Block级联之后构成的网络,所述Dense Block的输入特征与所述Dense Block的输出特征组合之后作为一个Dense Block的输出特征,所述Dense Block由两个卷积层组成,所述Transition Layer由卷积层和最大池化层组成。4.根据权利要求3所述的方法,其特征在于,根据特征金字塔FPN对所述有效目标特征进行多尺度处理,得到多个尺寸的输出目标特征信息包括:将所述目标轻量型DenseNet网络模型输出的所述目标特征作为所述目标图像中大尺寸目标的第一输出目标特征信息;将所述第一输出目标特征信息进行2倍上采样后与所述目标轻量型DenseNet网络模型输出的所述第二特征进行通道级别的连接,作为所述目标图像中中尺寸目标的第二输出目标特征信息;将所述第二输出目标特征信息进行2倍上采样后,通过一个卷积层,并将所述卷积层的输出特征再进行2倍上采样后,与所述第一特征进行通道级别的连接,作为所述目标图像中小尺寸目标的第三输出目标特征信息;其中,所述多个尺寸的输出目标特征信息包括所述第一输出目标特征信息、所述第二输出目标特征信息以及所述第三输出目标特征信息。5.根据权利要求4所述的方法,其特征在于,根据所述多个尺寸的输出目标特征信息确定所述目标图像中目标对象的预测边框以及所述预测边框的置信度包括:将所述第一输出目标特征信息输入到训练好的目标识别与边框回归卷积模型中,得到
所述目标识别与边框回归卷积模型输出的所述目标图像中大尺寸目标的中心点相对于预先确定的锚框中3个大尺寸聚类边框的中心点的水平偏移量和垂直偏移量、所述目标图像中大尺寸目标对应所述3个大尺寸聚类边框的宽缩放比、高缩放比;根据所述目标图像中大尺寸目标的中心点坐标、所述水平偏移量以及所述垂直偏移量确定所述图标图像中大尺寸目标的预测边框中心;根据所述宽缩放比、所述高缩放比以及所述3个大尺寸聚类边框的宽度、高度确定所述目标图像中大尺寸目标对应的3个预测边框,并获取所述目标识别与边框回归卷积模型输出的所述3个预测边框对应的目标类型以及所述3个预测边框对应目标类别的置信度;将所述第二输出目标特征信息输入到预先训练好的目标识别与边框回归卷积模型中,得到所述目标识别与边框回归卷积模型输出的所述目标图像中中尺寸目标的中心点相对于预先确定的锚框中的3个中尺寸聚类边框的中心点的水平偏移量和垂直偏移量、所述目标图像中中尺寸目标对应所述3个中尺寸聚类边框的宽缩放比、高缩放比;根据所述目标图像中中尺寸目标的中心点坐标、所述水平偏移量以及所述垂直偏移量确定所述图标图像中中尺寸目标的预测边框中心;根据所述宽缩放比、所述高缩放比以及所述3个中尺寸聚类边框的宽度、高度确定所述目标图像中中尺寸目标对应的3个预测边框,并获取所述目标识别与边框回归卷积模型输出的所述3个预测边框对应的目标类型以及所述3个预测边框对应目标类别的置信度;将所述第三输出目标特征信息输入到预先训练好的目标识别与边框回归卷积模型中,得到所述目标识别与边框回归卷积模型输出的所述目标图像中小尺寸目标的中心点相对于预先确定的锚框中的3个小尺寸聚类边框的中心点的水平偏移量和垂直偏移量、所述目标图像中小尺寸目标对应所述3个小尺寸聚类边框的宽缩放比、高缩放比;根据所述目标图像中小尺寸目标的中心点坐标、所述水平偏移量以及所述垂直偏移量确定所述图标图像中小尺寸目标的预...

【专利技术属性】
技术研发人员:李松
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1