目标检测、轨迹跟踪方法、模型及其电子设备技术

技术编号:29205536 阅读:45 留言:0更新日期:2021-07-10 00:41
本发明专利技术提供一种目标检测、轨迹跟踪方法、模型及其电子设备,该方法通过改进目标检测模型的结构,增加空洞编码模块使得模型检测到的目标可覆盖更多的感受野,进而提高小尺寸目标或者低分辨特征图中目标的检测效率,且通过头部预测模块改善目标检测的误报率,提高视频中目标检测的精度,可特别应用于视频中小目标的检测。检测。检测。

【技术实现步骤摘要】
目标检测、轨迹跟踪方法、模型及其电子设备


[0001]本专利技术涉及目标检测领域,特别涉及一种目标检测、轨迹跟踪方法、模型及其电子设备。

技术介绍

[0002]计算机视觉在人们的生活中逐渐变得越发重要,它广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域,通过计算机视觉可减少对人力资本的消耗,具有重要的现实意义。而在计算机视觉中,目标检测和目标跟踪计算机视觉和数字图像处理的一个热门方向,也是智能监控系统的核心部分,通过对智能监控图像进行目标检测和目标跟踪可实现各种实际场景的监控需求。
[0003]目标检测是指利用计算机视觉技术从图像中准确地检测到需求目标,然而目前应用于计算机视觉领域的目标检测的方式主要存在以下问题:1.在对多帧视频帧进行目标检测时,经常会出现目标检测误报的情况,也就是说目前的卷积神经网络难以抑制来自较差识别位置的误报。而造成误报的原因主要有:

视频中检测的目标尺寸过小,

在主干卷积神经网络中提取的特征不太丰富;

在网络预测模块预测结果没有更好的精本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种目标检测方法,其特征在于,包括以下步骤:获取待处理视频帧,提取所述待处理视频帧的第一特征图;所述第一特征图作为空洞编码模块中的输入,通过所述空洞编码模块的投影层进行卷积处理获得第二特征图,其中所述第二特征图的特征通道数被降低;将所述第二特征图通过堆叠所述空洞编码模块的不同扩张因子的多个残差块生成具有多感受野的第三特征图,其中每一所述残差块包括一个用于减少特征通道的1*1卷积核、一个用于增大感受野的3*3空洞卷积核和一个用于扩充特征通道数的1*1卷积核,经每个所述残差块处理后的特征通道数不变,且每一所述残差块中的3*3空洞卷积核的空洞率不同;所述第三特征图作为对应的预测网络的输入,输出预测结果。2.根据权利要求1所述的目标检测方法,其特征在于,“将所述第一特征图通过投影层进行卷积处理获得第二特征图”中,所述投影层对所述第一特征图进行降维后再卷积,提取所述第一特征图的上下语义信息,所述投影层包括依次相连的1*1卷积和3*3卷积。3.根据权利要求1所述的目标检测方法,其特征在于,“将所述第二特征图通过堆叠所述空洞编码模块的不同扩张因子的多个残差块生成具有多感受野的第三特征图,”中,不同扩张因子的多个所述残差块依次堆叠,且所述残差块的空洞卷积的空洞率依次序增加。4.根据权利要求1所述的目标检测方法,其特征在于,“所述第三特征图作为对应的预测网络的输入,输出预测结果”中,所述预测网络包括分类子网络和边框子网络,所述回归子网络生成目标框及目标性预测得分,所述目标性预测得分乘以所述分类子网络的输出得到所述目标框的分类得分。5.根据权利要求1所述的目标检测方法,其特征在于,包括多层空洞编码模块和预测网络,位于上层的空洞编码模块输出的输出特征图作为位于神经网络下层的空洞编码模块的输入特征图,对应每层的预测网络输出对应的预测结果,所述预测结果包括至少一目标框,多层预测网络的预测结果通过非极大值抑制选出和标签损失最小的目标框。6.根据权利要求5所述的目标检测方法,其特征在于,“多层预测网络的预测结果通过非极大值抑制选出和标签损失最小的目标预测框”包括:根据不同尺寸的目标在每层所述预测网络的所述第三特征图上进行单元格划分,根据当前数据聚类结果进行候选框的分配,如果所述当前数据聚类结果显示大尺寸的目标数据多,在所述第三特征图上分配大于标准数量的所述候选框,在所述第三特征图上逐所述单元格去遍历所述第三特征图,最终得到所述目标框。7.一种目标轨迹跟踪方法,其特征在于,包括以下步骤:获取待处理视频帧,提取所述待处理视频帧的第一特征图;所述第一特征图作为空洞编码模块中的输入,通过所述空洞编码模块的投影层进行卷积处理获得第二特征图,其中所述第二特征图的特征通道数被降低;将所述第二特征图通过堆叠所述空洞编码模块的不同扩张因子的多个残差块生成具有多感受野的第三特征图,其中每一所述残差块包括一个用于减少特征通道的1*1卷积核、一个用于增大感受野的3*3空洞卷积核和一个用于扩充特征通道数的1*1卷积核,经每个残差块处理后的特征通道数,且每一所述残差块中的3*3空洞卷积核的空洞率不同;将所述第三特征图输入LSTM模块中,标记跟踪目标得到对应的第四特征图;将所述第四特征图输入预测网络中输出预测结果,其中所述预测结果至少包括目标运
动轨迹。8.一种目标检测模型,其特征在于,包括:特征提取网络,以及依次连接的空洞编码模块和头部预测模块;其中所述特征提取网络提取输入的视频帧得到第一特...

【专利技术属性】
技术研发人员:李圣权毛云青盛小娟张香伟王国梁
申请(专利权)人:城云科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1