一种在复杂场景的视频中进行人体头肩检测的方法技术

技术编号：4940300 阅读：547 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种在复杂场景的视频中进行人体头肩检测的方法，属于计算机信息挖掘技术领域。从视频的各帧中人工标定头肩图片、背景图片和身体其他部分的图片作为正负样本，镜像这些图片；提取正负样本的梯度向量，对第一级分类器训练；用头肩图片作为新正样本，用身体其他部分的图片作为新负样本；提取正负样本的梯度向量，对第二级分类器训练。确定待检测视频的一帧中一个待检测窗口的位置和大小，提取该窗口的梯度向量；将它通过第一级分类器，若分类为负，则结束检测，若第一级分类为正，则将它通过第二级分类器；若分类为正，则确认该窗口包含头肩。改变窗口的位置和大小，对新窗口进行同样的检测。本发明专利技术可以提高准确率，同时提高检测速度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机信息挖掘
，特别涉及一种在复杂场景的图片中对人体的头肩检测的方法，尤其涉及在真实世界的监控视频的帧中行人的头肩检测。
技术介绍
近年来，在计算机视频分析领域，在视频中对人体的检测是一个热门的研究方向。在人体检测的各种方法中，通过检测身体的各部分来检测人体是一个重要辅助手段。而对这些身体各部分，头肩区域是一个非常显著的特征。由于视频中的经常会出现人体被部分遮挡的情况，导致检测困难，而此时头肩还有很高的概率被检测出来，所以检测头肩对检测人体很好的辅助作用。同时，在视频事件检测领域，人在头肩附近的许多动作往往包含一些隐含的事件信息，比如挥手或者打电话等。所以，复杂背景下的头肩检测具有重要的意义。 .头肩检测属于目标检测，而在目标检测领域，方法可以分为两类，一是做背景提取或分割，分离出的前景目标作为检测结果。二是在图像中直接搜索目标。在视频中用背景提取的方法只能应用于静态摄像机，对于场景中静止不动的目标，检测非常困难，这限制了它的应用范围。所以现在一般采用在图像中直接搜索目标的方法。这些方法一般使用分类器根据目标的特征对目标进行分类。目标的特征是目标本身包含的特征信息，比如目标图像区域的颜色直方图，纹理，梯度等。提取目标的特征之后，分类器根据目标的特征对目标的类别进行判断。目前国际通用的分类器主要是支持向量机(以下简称SVM)，但是目前的单级SVM分类器往往由于只进行一次分类，准确率不高。
技术实现思路
本专利技术的目的是为克服已有技术的不足之处，提出一种在复杂场景的视频中进行人体头肩检测的方法，以梯度方向直方...

【技术保护点】
一种复杂场景的视频中进行人体头肩检测的方法，其特征在于，主要包括以下步骤：　（１）从待检测的一类视频中选择一个视频。从该视频的各帧中人工标定一定数量的头肩图片、一定数量背景图片和一定数量的身体其他部分的图片，其中要求这些图片的边长至少１厘米。以头肩图片作为正样本图片，以背景图片作为负样本图片；　（２）将得到的正负样本图片进行左右镜像，增加样本的数量；　（３）提取得到的正负样本图片的梯度方向直方图，并将梯度方向直方图转化为向量的形式，作为样本图片的梯度向量；（４）用从正负样本中提取出的梯度向量对第一级支持向量机进行训练，生成一个用于分类的第一级模型；　（５）用所述头肩图片作为新正样本，用所述身体其他部分的图片代替所述背景图片作为新负样本；　（６）提取所述新正负样本图片的梯度方向直方图，并将梯度方向直方图转化为１乘Ｎ的向量的形式，Ｎ为正整数，作为新样本的梯度向量；　（７）用从新的正负样本中提取出的梯度向量对第二级支持向量机进行训练，生成一个用于分类的第二级模型；　（８）读入一个待检测视频，提取该视频的一帧图像；　（９）确定该帧图像上某一个待检测窗口的位置和大小，采用步骤（３）的方法提取该窗...

【技术特征摘要】

【专利技术属性】
技术研发人员：孙立峰，丁锡锋，徐辉，崔鹏，杨士强，
申请(专利权)人：清华大学，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人