一种对象检测方法、装置、电子设备和存储介质制造方法及图纸

技术编号:33145962 阅读:19 留言:0更新日期:2022-04-22 13:57
本申请涉及图像处理技术领域,尤其涉及一种对象检测方法、装置、电子设备和存储介质,用以提高对象检测的准确度。其中,方法包括:获取待检测视频中初始视频帧对应的目标区域图像,以及待处理视频帧对应的搜索区域图像;分别提取目标区域图像和搜索区域图像,各自对应的多维度目标特征信息;基于目标区域图像对应的多维度目标特征信息,与搜索区域图像对应的多维度目标特征信息中,相同维度的目标特征信息,获得搜索区域图像对应的对象检测结果;基于对象检测结果,确定目标对象在待处理视频帧中的目标状态信息。由于本申请通过对图像进行多维度特征提取,可以同时保留图像的空间细节信息和语义信息,有效了提高对象检测的准确性。有效了提高对象检测的准确性。有效了提高对象检测的准确性。

【技术实现步骤摘要】
一种对象检测方法、装置、电子设备和存储介质


[0001]本申请涉及图像处理
,尤其涉及一种对象检测方法、装置、电子设备和存储介质。

技术介绍

[0002]随着人工智能的迅速发展,目标的检测与跟踪成为计算机视觉研究领域的热点之一,并得到广泛应用。其中,单目标跟踪是信息融合方法的一个重要组成部分,被广泛应用于视频监控、虚拟现实、人机交互、无人驾驶等诸多领域。具体地,通过在视频初始视频帧中给定待跟踪的目标,基于单目标跟踪算法,可以在视频的后续帧中持续对目标进行准确的定位。
[0003]具体地,单目标跟踪算法主要基于相关滤波技术或孪生网络结构实现。其中,孪生网络(Siamese Network)是一种用于度量学习的监督模型。相关技术中,给出了一种以Alexnet五层网络作为孪生网络中主干网络的目标跟踪方法,由于网络层数太浅而不足以提取到有效的特征,当目标处于较为复杂的场景中时,如背景杂乱、局部遮挡等,该方法不能准确地判别出目标与背景;另外,该方法仅仅找到了目标位置,并没有考虑目标的尺度问题,而真实场景中目标的尺度、姿态变化是很常见的问题。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种对象检测方法,其特征在于,该方法包括:获取待检测视频中初始视频帧对应的目标区域图像,以及待处理视频帧对应的搜索区域图像;提取所述目标区域图像对应的多维度目标特征信息,和所述搜索区域图像对应的多维度目标特征信息;所述多维度目标特征信息包括:基于不同维度的至少两个目标特征信息;基于所述目标区域图像对应的多维度目标特征信息,与所述搜索区域图像对应的多维度目标特征信息中,相同维度的目标特征信息,获得所述搜索区域图像对应的对象检测结果;基于所述对象检测结果,确定所述目标对象在所述待处理视频帧中的目标状态信息。2.如权利要求1所述的方法,其特征在于,所述搜索区域图像的尺寸与所述目标区域图像的尺寸为预设比例;若所述待处理视频帧与所述初始视频帧相邻,则所述搜索区域图像的中心位置是:基于所述目标对象在所述初始视频帧中的位置确定的;若所述待处理视频帧与所述初始视频帧不相邻,则所述搜索区域图像的中心位置是:基于所述目标对象在所述待处理视频帧的上一视频帧中的位置确定的。3.如权利要求1所述的方法,其特征在于,所述提取所述目标区域图像对应的多维度目标特征信息,和所述搜索区域图像对应的多维度目标特征信息,包括:基于已训练的区域推荐模型中的模板分支,提取所述目标区域图像对应的多维度目标特征信息,所述目标区域图像对应的各维度目标特征信息相对于所述目标区域图像的步长相同;以及基于所述已训练的区域推荐模型中的搜索分支,提取所述搜索区域图像对应的多维度目标特征信息,所述搜索区域图像对应的各维度目标特征信息相对于所述搜索区域图像的步长相同。4.如权利要求3所述的方法,其特征在于,不同维度目标特征信息是基于不同层级的卷积处理获得的;所述基于已训练的区域推荐模型中的模板分支,提取所述目标区域图像对应的多维度目标特征信息,包括:将所述目标区域图像输入所述模板分支;基于所述模板分支中的第一卷积模块,对所述目标区域图像进行自底向上的多层级卷积处理,获得所述第一卷积模块中最后N个层级输出的第一浅层前馈特征信息,N为大于1的正整数;基于所述模板分支中的第一特征融合模块,对各个第一浅层前馈特征信息进行自顶向下的卷积和同层横向连接处理,获得各个第一浅层前馈特征信息各自对应的第一中间特征信息;分别对所述各个第一中间特征信息进行卷积处理,获得所述各个第一中间特征信息各自对应的目标特征信息。5.如权利要求3所述的方法,其特征在于,不同维度目标特征信息是基于不同层级的卷积处理获得的;所述基于所述已训练的区域推荐模型中的搜索分支,提取所述搜索区域图像对应的多维度目标特征信息,包括:将所述搜索区域图像输入所述搜索分支;
基于所述搜索分支中的第二卷积模块,对所述目标区域图像进行自底向上的多层级卷积处理,获得所述第二卷积模块中最后N个层级输出的第二浅层前馈特征信息,N为大于1的正整数;基于所述搜索分支中的第二特征融合模块,对各个第二浅层前馈特征信息进行自顶向下的卷积和同层横向连接处理,获得各个第二浅层前馈特征信息各自对应的第二中间特征信息;分别对所述各个第二中间特征信息进行卷积处理,获得所述各个第二中间特征信息各自对应的目标特征信息。6.如权利要求1所述的方法,其特征在于,所述基于所述目标区域图像对应的多维度目标特征信息,与所述搜索区域图像对应的多维度目标特征信息中,相同层级的目标特征信息,获得所述搜索区域图像对应的对象检测结果,包括:分别将所述目标区域图像和所述搜索区域图像中,相同层级的目标特征信息,输入已训练的区域推荐模型中的同层级的区域推荐模块;分...

【专利技术属性】
技术研发人员:张杨殷俊朱树磊李平生
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1