目标检测方法、装置、设备及可读存储介质制造方法及图纸

技术编号:37149212 阅读:35 留言:0更新日期:2023-04-06 22:03
本申请公开了一种目标检测方法、装置、设备及可读存储介质,该方法包括获取视频帧以及目标检测模型,目标检测模型包括Backbone模块、Rep

【技术实现步骤摘要】
目标检测方法、装置、设备及可读存储介质


[0001]本申请涉及互联网
,更具体地说,涉及一种目标检测方法、装置、设备及可读存储介质。

技术介绍

[0002]目标检测是计算机视觉领域的最基本的问题,其任务是找出图像或视频中需要重点关注的目标对象,确定目标对象的类别和位置。由于其基础性质,目标检测在无人驾驶汽车、医学成像、城市安防、身份验证、机器人导航、运动分析等各个领域都有大量应用。
[0003]近年来,新提出了YOLOv6网络用于实现目标检测。YOLOv6网络由骨干特征提取EfficientRep Backbone模块、特征融合Rep

PAN Neck模块以及预测Head模块组成。在COCO数据集上,YOLOv6在精度和速度方面均超越其他同体量算法。但尽管YOLOv6网络在目标检测上比同系列YOLO网络表现出色,但由于YOLOv6网络的捕捉能力不高,造成YOLOv6网络目标检测的准确度仍不够高,即,目标检测网络在进行目标检测时的准确度仍不够高。

技术实现思路

[0004]有鉴于此,本申请提供了一本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种目标检测方法,其特征在于,包括:获取视频帧以及目标检测模型,所述目标检测模型包括骨干Backbone模块、特征融合Rep

PAN Neck模块以及预测Head模块,所述Backbone模块为在stem模块后添加了动态图消息传递DGMN模块的骨干特征提取EfficientRep Backbone模块;利用所述Backbone模块预测所述视频帧的每个特征节点的动态过滤器和亲和关系的变换矩阵,并基于所述变换矩阵进行随机游走采样,以提取细节特征以及重点特征;利用所述Rep

PAN Neck模块,对所述细节特征以及重点特征进行融合,得到融合数据;利用所述Head模块,分析所述融合数据,生成所述视频帧对应的检测结果,所述检测结果为空集或者标记有目标对象所处区域以及类别的视频帧,所述目标对象为在视频帧所对应的场景中需要关注的对象。2.根据权利要求1所述的目标检测方法,其特征在于,所述利用所述Backbone模块预测所述视频帧的每个特征节点的动态过滤器和亲和关系的变换矩阵,包括:利用所述stem模块对所述视频帧进行下采样,得到采样特征图;利用所述DGMN模块,基于所述采样特征图,预测各个所述特征节点之间的动态关联,并基于各个特征节点之间的动态关联,联合预测每个特征节点的动态过滤器和亲和关系的变换矩阵。3.根据权利要求2所述的目标检测方法,其特征在于,所述DGMN模块包括均匀漫步采样器和随机漫步采样器;所述利用所述DGMN模块,基于所述采样特征图,预测各个所述特征节点之间的动态关联,包括:利用所述DGMN模块基于所述均匀漫步采样器以及所述随机漫步采样器对所述采样特征图进行特征节点采样,并返回节点索引;基于自注意力机制以及所述节点索引,预测各个特征节点之间的动态关联。4.根据权利要求1所述的目标检测方法,其特征在于,所述获取目标检测模型,包括:获取各个场景下的多个训练视频帧以及初始目标检测模型;在每个所述训练视频帧中标记该训练视频帧对应的训练对象所处的区域,并标记所述训练对象对应的训练类别,得到所述初始目标检测模型对应的训练图像,所述训练图像为包含标记标签的训练视频帧;利用各个所述训练图像,对所述初始目标检测模型进行迭代训练,得到训练后的初始目标检测模型,所述训练后的初始目标检测模型为最新的目标检测模型。5.根据权利要求4所述的目标检测方法,其特征在于,在每个所述训练视频帧中标记该训练视频帧对应的训练对象所处的区域,并标记所述训练对象对应的训练类别,得到所述初始目标检测模型对应的训练图像,包括:根据每个训练视频帧对应的场景,确定所述训练视频帧需要关注的训练类别,并在所述训练视频帧中查找与所述训练类别对应的训练对象;在存在所述训练对象的训练视频帧上标记所述训练对象的训练类别以及所述训练对象所处的区域,得到所述初始目标检测模型对应的...

【专利技术属性】
技术研发人员:谢志强卜昌浩张继东赵子颖黄毓铭邓琛丁家文邹京辰
申请(专利权)人:天翼数字生活科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1