【技术实现步骤摘要】
本专利技术涉及对象检测的领域,更具体地,本专利技术涉及一种对象检测方法和对象检测装置。
技术介绍
随着监控视频的普及和对安全问题的日益关注,对于智能的分析监控视频数据中的特定对象,例如行人或车辆,有着紧迫的需求。以行人检测为例,在一种行人检测方法中,对视频场景进行分块(blob)处理,然后以块为单位进行行人跟踪。这种方法往往对行人密集程度比较低的场景有效,但是对客流比较复杂或者客流量大的场景,每个块可能包含多个行人,这种算法难以确定地定位到每一个行人。在另一种行人检测方法中,对视频中每一帧直接使用行人检测算法。然而,这种方法的计算时间复杂度比较高,而且对于客流比较大的监控场景,由于场景中存在很强的遮挡情况,也很难完整地定位出场景中的每一个行人。
技术实现思路
有鉴于上述情况,本专利技术提供了一种对象检测方法和对象检测装置,其即使在复杂的高密度场景中也能进行准确的对象检测。进一步地,本专利技术还提供了一种对象检测方法和对象检测装置,其不仅能够在复杂的高密度场景中进行准确的对象检测,还能够在后续准确地进行对象跟踪。根据本专利技术一实施例,提供了一种对象检测方法,包括:将图像序列中的至少一帧图像映射到三维物理空间,以获得所述图像中每个像素的三维坐标;提取所述图像中的前景区域;对所述前景区域进行分块操作,以获得块集合;以及对所述块集合中的每个块,基于所述块中预定参考点的三维坐标,通过神 ...
【技术保护点】
一种对象检测方法,包括:将图像序列中的至少一帧图像映射到三维物理空间,以获得所述图像中每个像素的三维坐标;提取所述图像中的前景区域;对所述前景区域进行分块操作,以获得块集合;以及对所述块集合中的每个块,基于所述块中预定参考点的三维坐标,通过神经网络检测所述块中的对象,以得到对象检测结果。
【技术特征摘要】
1.一种对象检测方法,包括:
将图像序列中的至少一帧图像映射到三维物理空间,以获得所述图像中
每个像素的三维坐标;
提取所述图像中的前景区域;
对所述前景区域进行分块操作,以获得块集合;以及
对所述块集合中的每个块,基于所述块中预定参考点的三维坐标,通过
神经网络检测所述块中的对象,以得到对象检测结果。
2.如权利要求1所述的对象检测方法,还包括:
对至少两帧图像的对象检测结果进行匹配,以得到对象跟踪结果。
3.如权利要求1所述的对象检测方法,通过神经网络检测所述块中的对
象的步骤包括:
基于所述块中与预定参考面接触的像素的三维坐标以及所述块的尺寸信
息,估计真实场景中所述块的物理尺寸;
基于所述块的物理尺寸,计算所述块中可能存在的对象的数目的上限;
以及
基于所述块和所述上限,通过神经网络检测所述块中的对象,以得到对
象检测结果。
4.如权利要求3所述的对象检测方法,通过神经网络检测所述块中的对
象的步骤包括:
对于每次检测过程,将所述块和所述上限输入训练后的神经网络,以得
到所述块中本次检测过程所对应的对象的位置以及所述位置处存在所述对象
的置信度;
判断是否达到结束条件;以及
当判断没有达到结束条件时,执行下一次检测过程;当判断达到结束条
件时,将各次检测过程所对应的各个对象的位置及各自的置信度输出作为对
象检测结果。
5.如权利要求4所述的对象检测方法,其中,判断是否达到结束条件的
步骤包括以下中的任一:
判断检测到的对象的数目是否到达所述上限;
判断本次检测过程所得到的置信度是否小于阈值。
6.如权利要求2所述的对象检测方法,对至少两帧图像的对象检测结果
进行匹配的步骤包括:
对于所述至少两帧图像中的每一帧图像,提取所述图像中检测到的每个
对象的特征信息,所述特征信息包括所述对象的位置信息、外观信息和纹理
信息中的至少一个;
对于所述至少两帧图像的其中一帧中每个对象,基于所述特征信息,对
所述对象与所述至少两帧图像的其他帧中每个对象的对分配权重,所述权重
表示所述对象与其他帧中每个对象之间相匹配的概率;以及
基于所述权重,对所述图像序列中的所述至少两帧图像进行匹配,以得
到对象跟踪结果。
7.如权利要求1所述的对象检测方法,获得所述图像中每个像素的三维
坐标的步骤包括:
在图像空间中确定预定参考面上的不共线的三个像素;
获取所述三个像素的深度信息;
基于所述三个像素的深度信息,建立从图像空间到三维物理空间的映射
变换;以及
将所述图像中的每个像素通过所述映射变换而映射到三维物理空间,从
而获得所述像素的三维坐标。
8.一种对象检测装置,包括:
三维坐标获取单元,将图像序列中的至少一...
【专利技术属性】
技术研发人员:俞刚,李超,何奇正,印奇,
申请(专利权)人:北京旷视科技有限公司,北京小孔科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。