检测视频图像中的目标的方法和装置制造方法及图纸

技术编号：4126011 阅读：205 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供了检测视频图像中的目标的方法和装置。所述方法包括：对包含目标帧的多帧图像分别进行检测，以得到一个或多个第一候选目标及其置信度；及对所述多帧图像中的第一候选目标及其置信度进行合并，得到目标帧中的一个或多个第二候选目标。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理技术，具体地，涉及一种检测视频图像中的目标的方法和装置。
技术介绍
图像中的物体检测技术是计算机视觉的一个重要分支。同一类物体之间存在或多或少的外形上的差异，在成像时受到光照、视角、姿态等多重因素的影响在图像中可能产生出截然不同的状态，这给图像中的物体检测技术带来很大困难。视频图像中的物体检测技术又有其自身的特点，一般来说视频图像的图像质量要差许多，分辨率低、存在运动模糊、噪点显著等，给目标检测带来了新的困难。当目标的检测和分类在视频图像中进行时，由于图像质量的下降和运动模糊等噪声的存在，处理性能会有较大下降。
技术实现思路
在下文中给出关于本专利技术的简要概述，以便提供关于本专利技术的某些方面的基本理解。应当理解，这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分，也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念，以此作为稍后论述的更详细描述的前序。根据本专利技术的一个方面，提供了一种检测视频图像中的目标的方法，所述方法包括帧检测步骤对包含目标帧的多帧图像分别进行检测，以得到一个或多个第一候选目标及其置信度；及合并步骤对所述多帧图像中的第一候选目标及其置信度进行合并，得到目标帧中的一个或多个第二候选目标。根据本专利技术的另一方面，提供了一种检测视频图像中的目标的装置，该装置包括目标检测与分类器，用于对视频序列中包括目标帧的多帧图像进行检测，以得到一个或多个第一候选目标及其置信度；以及合并模块，用于对所述多帧图像中的第一候选目标的置信度进行合并，以得到目标...

【技术保护点】
一种检测视频图像中的目标的方法，包括：帧检测步骤：对包含目标帧的多帧图像分别进行检测，以得到一个或多个第一候选目标及其置信度；及合并步骤：对所述多帧图像中的第一候选目标及其置信度进行合并，得到目标帧中的一个或多个第二候选目标。

【技术特征摘要】
一种检测视频图像中的目标的方法，包括帧检测步骤对包含目标帧的多帧图像分别进行检测，以得到一个或多个第一候选目标及其置信度；及合并步骤对所述多帧图像中的第一候选目标及其置信度进行合并，得到目标帧中的一个或多个第二候选目标。2.如权利要求1所述的方法，其中，所述帧检测步骤包括第一遍历步骤利用第一窗口以第一步长对所述多帧图像中的每帧图像进行遍历，对每个窗口图像进行检测以得到一个或者多个第三候选目标及其置信度；第一遍历结果合并步骤将位置相邻、尺寸相近的第三候选目标及其置信度合并，以得到所述第一候选目标及其置信度。3.如权利要求2所述的方法，其中，所述帧检测步骤还包括关注区域建立步骤根据所述第一遍历结果合并步骤的结果，建立一个或多个关注区域，每个关注区域覆盖相应的第三候选目标；第二遍历步骤利用第二窗口以第二步长对每个关注区域进行遍历，对每个窗口图像进行检测以得到一个或者多个第四候选目标及其置信度；第二遍历结果合并步骤将位置相邻、尺寸相近的第三候选目标和第四候选目标及其置信度合并，以得到所述第一候选目标及其置信度。4.如权利要求2所述的方法，其中，所述第一遍历步骤包括帧金字塔建立步骤建立每帧图像的多尺度金字塔图像，该多尺度金字塔图像包括K 层，K> 1 ；第三遍历步骤，利用所述第一窗口以所述第一步长对所述金字塔图像中的每个进行遍历，对每个窗口图像进行检测以得到一个或者多个第三候选目标及其置信度。5.如权利要求4所述的方法，其中所述第三遍历步骤是从所述金字塔图像中最小尺寸的图像开始处理的，并且还包括掩模建立步骤基于对第一到第N金字塔图像的检测结果而建立一个或多个目标掩模，每个目标掩模对应于相应的第三候选目标，其中，在对其余K-N个图像进行处理时，不对所述K-N个图像中与各目标掩模对应的区域进行遍历，其中1<Ν<Κ。6.如权利要求3所述的方法，其中所述关注区域建立步骤之后，所述方法还包括建立每个关注区域的多尺度金字塔图像，所述第二遍历步骤包括利用所述第二窗口以所述第二步长对每个关注区域的金字塔图像进行遍历，对每个窗口图像进行检测以得到一个或者多个第四候选目标及其置信度。7.如权利要求1所述的方法，其中，所述合并步骤包括将所述多帧图像中的位置相邻尺寸相近的第一候选目标的置信度合并。8.如权利要求7所述的方法，其中，将所述多帧图像中位置相邻尺寸相近的第一候选目标的置信度合并包括对所述多帧图像中的位置相邻尺寸相近的第一候选目标的置信度求和或平均值，或者对所述多帧图像中的位置相邻尺寸相近的第一候选目标的置信度进行归一化并对归一化后的置信度求和或求平均值。9.如权利要求1所述的方法，其中，所述帧检测步骤是利用包括多个子分类器的目标检测和分类器进行的，每个子分类器能够检测一类目标。10.如权利要求9所述的方法，还包括根据输出最大置信度的子分类器所对应的类别，来确定目标的类别。11.一种检测视频图像中的目标的装置，包括目标检测与分类器，用于对视频序列中包括目标帧的多帧图像进行检测，以得到一个或多个第一候选目标及其置信度；合并模块，用于对所述多帧图像中的第一候选目标的置信度进行合并，以得到目标帧中的一个或多个第...

【专利技术属性】
技术研发人员：梅树起，吴伟国，
申请(专利权)人：索尼株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人