视频图像的目标检测方法、装置、设备及介质制造方法及图纸

技术编号:33125162 阅读:52 留言:0更新日期:2022-04-17 00:33
本申请公开了一种视频图像的目标检测方法、装置、设备及介质,获取待检测图像并输入至基于YOLOv5改进的目标检测网络;对待检测图像进行第一特征提取,得到第一特征图;基于第一特征图进行第一特征融合、第二特征融合与第三特征融合,得到第一融合特征图、第二融合特征图与第三融合特征图,对第一融合特征图、第二融合特征图、第三融合特征图进行第二特征提取,得到第一目标特征图、第二目标特征图与第三目标特征图;基于第一目标特征图、第二目标特征图、第三目标特征图生成第一检测结果、第二检测结果、第三检测结果;对第一检测结果、第二检测结果、第三检测结果进行后处理,得到目标检测结果。本申请可提高视频图像中目标检测的精度。的精度。的精度。

【技术实现步骤摘要】
视频图像的目标检测方法、装置、设备及介质


[0001]本申请涉及计算机视觉目标检测
,尤其涉及一种视频图像的目标检测方法、装置、设备及介质。

技术介绍

[0002]目标检测是计算机视觉和数字图像处理领域非常热门的一个方向,在机器人巡航、自动驾驶、工业监控、智慧安防等诸多领域,均有广泛应用,可以为公司减少一定的人力成本。目前基于深度学习的目标检测技术研究热点主要围绕以FasterRCNN为主的两阶段目标检测;以YOLO(You Only Look Once)系列、SSD系列、RetinaNet为主的一阶段目标检测;以CenterNet为主的AnchorFree思想及以Swin Transformer为主的注意力思想等技术展开。基于算法部署成本考虑,一阶段的目标检测算法,往往在工业界更受欢迎,得到了广泛的应用。而最新的YOLOv5算法,在精度和速度上均达到了SOTA的水平,受到了工业界目标检测领域的一致好评。但是,经研究发现,即使是最新的YOLOv5算法,由于其算法模型精度仍存在不足,导致当前基于YOLOv5进行目标检测时精确度较低。

技术实现思路

[0003]本申请的主要目的在于提供一种视频图像的目标检测方法、装置、设备及介质,旨在解决当前进行目标检测时精确度较低的技术问题。
[0004]为实现上述目的,本申请实施例提供一种视频图像的目标检测方法,所述视频图像的目标检测方法包括:
[0005]获取待检测图像,将所述待检测图像输入至基于YOLOv5改进的目标检测网络;
[0006]基于所述目标检测网络对所述待检测图像进行第一特征提取,得到第一特征图;
[0007]基于所述第一特征图进行第一特征融合,得到第一融合特征图,对所述第一融合特征图进行第二特征提取,得到第一目标特征图,并基于所述第一目标特征图生成第一检测结果;
[0008]基于所述第一特征图与所述第一目标特征图进行第二特征融合,得到第二融合特征图,对所述第二融合特征图进行所述第二特征提取,得到第二目标特征图,并基于所述第二目标特征图生成第二检测结果;
[0009]基于所述第一特征图与所述第二目标特征图进行第三特征融合,得到第三融合特征图,对所述第三融合特征图进行所述第二特征提取,得到第三目标特征图,并基于所述第三目标特征图生成第三检测结果;
[0010]对所述第一检测结果、所述第二检测结果、所述第三检测结果进行后处理,得到目标检测结果。
[0011]优选地,所述基于所述第一特征图与所述第一目标特征图进行第二特征融合,得到第二融合特征图的步骤包括:
[0012]对所述第一特征图进行第三特征提取,得到第二特征图;
[0013]对所述第一目标特征图进行第四特征提取,得到第三特征图;
[0014]对所述第二特征图、所述第三特征图与所述第一目标特征图进行第二特征融合,得到第二融合特征图。
[0015]优选地,所述基于所述第一特征图进行第一特征融合,得到第一融合特征图的步骤包括:
[0016]对所述第一特征图进行第五特征提取,得到第四特征图;
[0017]对所述第一特征图与所述第四特征图进行第一特征融合,得到第一融合特征图。
[0018]优选地,所述对所述第一特征图进行第五特征提取,得到第四特征图的步骤包括:
[0019]对所述第一特征图进行第三特征提取,得到第五特征图;
[0020]对所述第五特征图进行第六特征提取,得到第六特征图;
[0021]对所述第五特征图与所述第六特征图进行第四特征融合,得到第四融合特征图;
[0022]对所述第四融合特征图进行第七特征提取,得到第四特征图。
[0023]优选地,所述基于所述第一特征图与所述第二目标特征图进行第三特征融合,得到第三融合特征图的步骤包括:
[0024]对所述第二目标特征图进行第四特征提取,得到第七特征图;
[0025]对所述第一特征图进行第八特征提取,得到第八特征图;
[0026]对所述第七特征图与所述第八特征图进行第三特征融合,得到第三融合特征图。
[0027]优选地,所述第一特征提取、所述第二特征提取、所述第三特征提取、所述第四特征提取、所述第五特征提取、所述第六特征提取、所述第七特征提取与所述第八特征提取分别包括不同的特征提取操作。
[0028]优选地,所述将所述待检测图像输入至基于YOLOv5改进的目标检测网络的步骤之前,还包括:
[0029]获取初始视频图像作为训练数据;
[0030]针对基于YOLOv5改进的初始检测网络,通过所述训练数据进行基于运动模糊的预训练,得到目标检测网络。
[0031]为实现上述目的,本申请还提供一种视频图像的目标检测装置,所述视频图像的目标检测装置包括:
[0032]获取模块,用于获取待检测图像,将所述待检测图像输入至基于YOLOv5改进的目标检测网络;
[0033]特征提取模块,用于基于所述目标检测网络对所述待检测图像进行第一特征提取,得到第一特征图;
[0034]第一特征融合模块,用于基于所述第一特征图进行第一特征融合,得到第一融合特征图,对所述第一融合特征图进行第二特征提取,得到第一目标特征图,并基于所述第一目标特征图生成第一检测结果;
[0035]第二特征融合模块,用于基于所述第一特征图与所述第一目标特征图进行第二特征融合,得到第二融合特征图,对所述第二融合特征图进行所述第二特征提取,得到第二目标特征图,并基于所述第二目标特征图生成第二检测结果;
[0036]第三特征融合模块,用于基于所述第一特征图与所述第二目标特征图进行第三特征融合,得到第三融合特征图,对所述第三融合特征图进行所述第二特征提取,得到第三目
标特征图,并基于所述第三目标特征图生成第三检测结果;
[0037]后处理模块,用于对所述第一检测结果、所述第二检测结果、所述第三检测结果进行后处理,得到目标检测结果。
[0038]进一步地,为实现上述目的,本申请还提供一种视频图像的目标检测设备,所述视频图像的目标检测设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的视频图像的目标检测程序,所述视频图像的目标检测程序被所述处理器执行时实现上述的视频图像的目标检测方法的步骤。
[0039]进一步地,为实现上述目的,本申请还提供一种介质,所述介质为计算机可读存储介质,所述计算机可读存储介质上存储有视频图像的目标检测程序,所述视频图像的目标检测程序被处理器执行时实现上述的视频图像的目标检测方法的步骤。
[0040]进一步地,为实现上述目的,本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述的视频图像的目标检测方法的步骤。
[0041]本申请实施例提供一种视频图像的目标检测方法、装置、设备及介质,获取待检测视频图像,将所述待检测视频图像输入至基于YOLOv5改进的目标检测网络;基于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频图像的目标检测方法,其特征在于,所述视频图像的目标检测方法包括:获取待检测图像,将所述待检测图像输入至基于YOLOv5改进的目标检测网络;基于所述目标检测网络对所述待检测图像进行第一特征提取,得到第一特征图;基于所述第一特征图进行第一特征融合,得到第一融合特征图,对所述第一融合特征图进行第二特征提取,得到第一目标特征图,并基于所述第一目标特征图生成第一检测结果;基于所述第一特征图与所述第一目标特征图进行第二特征融合,得到第二融合特征图,对所述第二融合特征图进行所述第二特征提取,得到第二目标特征图,并基于所述第二目标特征图生成第二检测结果;基于所述第一特征图与所述第二目标特征图进行第三特征融合,得到第三融合特征图,对所述第三融合特征图进行所述第二特征提取,得到第三目标特征图,并基于所述第三目标特征图生成第三检测结果;对所述第一检测结果、所述第二检测结果、所述第三检测结果进行后处理,得到目标检测结果。2.如权利要求1所述的视频图像的目标检测方法,其特征在于,所述基于所述第一特征图与所述第一目标特征图进行第二特征融合,得到第二融合特征图的步骤包括:对所述第一特征图进行第三特征提取,得到第二特征图;对所述第一目标特征图进行第四特征提取,得到第三特征图;对所述第二特征图、所述第三特征图与所述第一目标特征图进行第二特征融合,得到第二融合特征图。3.如权利要求1所述的视频图像的目标检测方法,其特征在于,所述基于所述第一特征图进行第一特征融合,得到第一融合特征图的步骤包括:对所述第一特征图进行第五特征提取,得到第四特征图;对所述第一特征图与所述第四特征图进行第一特征融合,得到第一融合特征图。4.如权利要求3所述的视频图像的目标检测方法,其特征在于,所述对所述第一特征图进行第五特征提取,得到第四特征图的步骤包括:对所述第一特征图进行第三特征提取,得到第五特征图;对所述第五特征图进行第六特征提取,得到第六特征图;对所述第五特征图与所述第六特征图进行第四特征融合,得到第四融合特征图;对所述第四融合特征图进行第七特征提取,得到第四特征图。5.如权利要求1所述的视频图像的目标检测方法,其特征在于,所述基于所述第一特征图与所述第二目标特征图进行第三特征融合,得到第三融合特征图的步骤包括:对所述第二目标特征图进行第四特征提取,得到第七特征图;对所述第一特征图进行第八特征提取,得到第八特征图;对所述第七特征图与所述第八特征图进行第三特征融合...

【专利技术属性】
技术研发人员:刘凯徐明李杉杉谢子平俞俊程
申请(专利权)人:深圳力维智联技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1