一种基于人体全局特征直方图熵的动作检测方法技术

技术编号:10237222 阅读:193 留言:0更新日期:2014-07-18 23:19
本发明专利技术一种基于人体全局特征直方图熵的动作检测方法,属于计算机视觉技术领域,主要涉及视频中的一种人体行为识别方法。通过建库和识别两个阶段完成对视频中人体动作的识别,建库阶段:首先采集视频,计算出视频一帧人物图像的直方图向量,然后对直方图向量进行归一化处理,对归一化后的各类直方图向量求熵,将得到的多个熵组合成一熵向量,最后对其定义,完成建立人体动作特征模板库;识别阶段:首先采集视频,再根据建库的方法求出一段视频的熵向量,然后与模板库进行匹配,找出最模板库中最匹配的熵向量,其对应的定义为该段视频的动作类型,从而具有提高人体动作识别精确度、简化模板匹配步骤、缩短运算时间的效果。

【技术实现步骤摘要】
一种基于人体全局特征直方图熵的动作检测方法
本专利技术属于计算机视觉
,主要涉及视频中的一种人体行为检测方法。
技术介绍
人体行为识别是计算机领域一个非常重要的分支,其目的是从未知视频中自动分析人体行为,广泛应用于各种监控场合,如ATM取款机、超市、城市交通十字路口旁都安装有“电子眼”,在发生抢劫、打架、交通事故等突发事件时,具有人体行为识别功能的智能监控系统全天候工作,能在第一时间内发现并报警,为相关安全人员赢得时间,最大程度地减少财产损失、保障人身安全。人体行为识别分属很多类别范畴,如单层结构识别,层次结构识别;单层结构识别方法下,又有时空体方法、时空特点描述子方法、模式匹配法,并且,这些方法可以相互交叉,形成新的方法。在一般情况下,视频图像被分割仅剩下人体行为图像,对该行为进行分类,然后据此对该视频分类;更一般情况下,人体行为的连续识别包含整个行为的检测过程。专利201210065810.6公开了一种《基于主梯度方向特征的目标检测及姿态估计方法》,该方法步骤包括模板训练和目标检测两个阶段。在模板训练阶段:首先拍摄被检测物体不同角度的V张图片,对拍摄到的一张图片以一定的步长旋转360度得到若干张模板图片,计算模板图片主梯度方向描述,通过主梯度方向描述对模板进行聚类处理,建立最强梯度模板集合;目标检测阶段:通过计算测试图片的主梯度方向描述,与建立的最强梯度模板集合进行匹配,选取匹配分数最大的模板即为对于测试图片的最优模板。该专利在建库阶段人工选取目标姿态及角度具有较大主观性,导致建库信息与实际情况不符,误差较大;该专利通过主梯度方向描述目标特征,该方法计算量大,特征描述不准确,匹配难度大;当目标尺寸较小时,该专利无对应的处理方法,无法完成匹配。
技术实现思路
本专利技术的目的是针对
技术介绍
的不足设计一种基于人体全局特征直方图熵的动作检测方法,从而达到提高人体动作识别精确度、简化模板匹配步骤、缩短运算时间的目的。本专利技术一种基于人体全局特征直方图熵的动作检测方法的技术方案分为建库和识别两个步骤。建库阶段:首先采集视频,选择出一段完整动作的视频,再依次分割出该段视频每一帧中各个运动人体的完整图像,再求出该图像的直方图向量,然后对直方图向量进行归一化处理,再求出归一化后各类相邻图像的均值向量,按顺序链接各均值向量,得到一个均值向量维度×均值向量个数的矩阵,再求该矩阵的熵,得到一熵向量,然后对该熵向量归一化处理,最后对归一化后的熵向量定义,完成建立人体动作特征模板库;识别阶段:首先采集视频,再根据建库的方法求出一段视频的熵向量,再归一化处理,然后与模板库进行匹配,找出最模板库中最匹配的经归一化处理的熵向量,其对应的定义为该段视频的动作类型。本专利技术的具体步骤如下:步骤1:采集建立人体动作特征模板库的视频图像;步骤1-1:使用摄像头采集包含运动人体的视频,并对视频进行分段,每段包含一个动作的完整过程,然后根据每段视频的动作对该段视频定义;步骤1-2:选取一段视频,利用高斯模型从该段视频的每一帧中依次分割出若干尺寸尽可能小的子图像,每个子图像包含一个尽可能完整的人体形象;步骤2:计算子图像直方图向量;步骤2-1:根据子图像中各像素灰度值大小判断该像素是否为子图像的背景,如果是,则对该像素重新赋值得到人体剪影图像。步骤2-2:将人体剪影图像等分为若干各方形区域;步骤2-3:对每个方形区域进行与人体轮廓信息相关的直方图统计;步骤2-4:将各区域统计的直方图进行拼接,形成表示该人体剪影图像的全局直方图;步骤2-5:对该全局直方图进行归一化处理,得到全局直方图向量;步骤3:对得到的全局直方图向量进行k-means聚类,并对同一类全局直方图向量标相同的编号;步骤4:将全局直方图向量按照其对应的视频帧播放顺序排列,计算相邻且编号相同的全局直方图向量的均值得到一均值向量,并对应替换计算前编号相同的若干全局直方图向量,如这些编号序列具有周期性,则只选取其中的两个周期;步骤5:计算熵向量;步骤5-1:将得到的所有均值向量的每个相同位置处的分量横向链接,组成一个a×b的矩阵,其中a为均值向量的维度,b为均值向量的个数;步骤5-2:对该矩阵的每一行求熵,得到一个熵向量;步骤5-3:将该熵向量进行归一化处理,得到一直方图熵向量,然后根据最初选取视频段的定义对该直方图熵向量进行定义;步骤5-4:重复上述步骤得到若干定义的直方图熵向量,从而建立人体动作特征模板库;步骤6:特征识别步骤6-1:采集视频并选取该视频的一小段进行处理;步骤6-2:采用与建立人体动作特征模板库相同的方法处理选取的小段视频,得到该段视频的直方图熵向量;步骤6-3:将得到的待测视频直方图熵向量与人体动作特征模板库中进行匹配,选择出模板库中与之最匹配的直方图熵向量,其定义则为待测视频中的任务动作类型。其中步骤2-1判断子图像中像素灰度值在-3σ~3σ之间则对该像素赋值为225。步骤2-3对每个方形区域进行梯度直方图统计。步骤3的具体步骤的为:步骤3-1:从所有全局直方图向量中,随机选取若干全局直方图向量作为中心向量;步骤3-2:分别计算剩余全局直方图向量与各中心向量的卡方距离,并将其与之距离最近的中心向量归为一类;步骤3-3:重新计算每个分类中的中心向量;步骤3-4:重复步3-2、3-3直至新确定的中心向量与原中心向量相等或变化小于规定阈值;步骤3-5:对同一类的全局直方图向量标相同的编号。本专利技术通过建库和识别两个阶段完成对视频中人体动作的识别,建库阶段:首先采集视频,选择出一段完整动作的视频,再依次分割出该段视频每一帧中各个运动人体的完整图像,再求出该图像的直方图向量,然后对直方图向量进行归一化处理,再求出归一化后各类相邻图像的均值向量,按顺序链接各均值向量,得到一个均值向量维度×均值向量个数的矩阵,再求该矩阵的熵,得到一熵向量,然后对该熵向量归一化处理,最后对归一化后的熵向量定义,完成建立人体动作特征模板库;识别阶段:首先采集视频,再根据建库的方法求出一段视频的熵向量,再归一化处理,然后与模板库进行匹配,找出最模板库中最匹配的经归一化处理的熵向量,其对应的定义为该段视频的动作类型。从而具有提高人体动作识别精确度、简化模板匹配步骤、缩短运算时间的效果。附图说明图1是本专利技术的具体流程图;图2是将单个运动人体从背景中分离出来的示意图;图3是运动人体子图像分块的示意图;图4是帧直方图的计算示意图;图5对帧全局直方图向量使用L1范数进行归一化示意图;图6是计算大量训练视频的直方图向量的示意图;图7是相邻且携带相同标签的直方图向量的均值计算示意图;图8是将所有直方图均值向量在相同位置处的分量链接起来的示意图;图9是计算熵向量的示意图。具体实施方式本实施例以标准人体运动数据库为例,如KHT数据库、Weizmann数据库、UCFsports数据库,在VisualStdio2010平台下,结合OpenCV标准库,使用C++编程进行处理仿真,并得到实验数据;本专利技术的实施流程图如图1所示。步骤1、采集建立人体动作特征模板库的视频图像标准人体运动数据库中的视频背景比较简单,动作类型十分明显,有利于运动人体子图像的提取。将运动人体从视频帧的背景中分离出来,形成运动人体子图像序列,并将所有本文档来自技高网
...
一种基于人体全局特征直方图熵的动作检测方法

【技术保护点】
一种基于人体全局特征直方图熵的动作检测方法,该方法包括:步骤1:采集建立人体动作特征模板库的视频图像;步骤1‑1:使用摄像头采集包含运动人体的视频,并对视频进行分段,每段包含一个动作的完整过程,然后根据每段视频的动作对该段视频定义;步骤1‑2:选取一段视频,利用高斯模型从该段视频的每一帧中依次分割出若干尺寸尽可能小的子图像,每个子图像包含一个尽可能完整的人体形象;步骤2:计算子图像直方图向量;步骤2‑1:根据子图像中各像素灰度值大小判断该像素是否为子图像的背景,如果是,则对该像素重新赋值得到人体剪影图像。步骤2‑2:将人体剪影图像等分为若干各方形区域;步骤2‑3:对每个方形区域进行与人体轮廓信息相关的直方图统计;步骤2‑4:将各区域统计的直方图进行拼接,形成表示该人体剪影图像的全局直方图;步骤2‑5:对该全局直方图进行归一化处理,得到全局直方图向量;步骤3:对得到的全局直方图向量进行k‑means聚类,并对同一类全局直方图向量标相同的编号;步骤4:将全局直方图向量按照其对应的视频帧播放顺序排列,计算相邻且编号相同的全局直方图向量的均值得到一均值向量,并对应替换计算前编号相同的若干全局直方图向量,如这些编号序列具有周期性,则只选取其中的两个周期;步骤5:计算熵向量;步骤5‑1:将得到的所有均值向量的每个相同位置处的分量横向链接,组成一个a×b的矩阵,其中a为均值向量的维度,b为均值向量的个数;步骤5‑2:对该矩阵的每一行求熵,得到一个熵向量;步骤5‑3:将该熵向量进行归一化处理,得到一直方图熵向量,然后根据最初选取视频段的定义对该直方图熵向量进行定义;步骤5‑4:重复上述步骤得到若干定义的直方图熵向量,从而建立人体动作特征模板库;步骤6:特征识别步骤6‑1:采集视频并选取该视频的一小段进行处理;步骤6‑2:采用与建立人体动作特征模板库相同的方法处理选取的小段视频,得到该段视频的直方图熵向量;步骤6‑3:将得到的待测视频直方图熵向量与人体动作特征模板库中进行匹配,选择出模板库中与之最匹配的直方图熵向量,其定义则为待测视频中的任务动作类型。...

【技术特征摘要】
1.一种基于人体全局特征直方图熵的动作检测方法,该方法包括:步骤1:采集建立人体动作特征模板库的视频图像;步骤1-1:使用摄像头采集包含运动人体的视频,并对视频进行分段,每段包含一个动作的完整过程,然后根据每段视频的动作对该段视频定义;步骤1-2:选取一段视频,利用高斯模型从该段视频的每一帧中依次分割出若干尺寸尽可能小的子图像像素,每个子图像包含一个尽可能完整的人体形象;步骤2:计算子图像直方图向量;步骤2-1:根据子图像中各像素灰度值大小判断该像素是否为子图像的背景,如果是,则对该像素重新赋值得到人体剪影图像;步骤2-2:将人体剪影图像等分为若干个方形区域;步骤2-3:对每个方形区域进行与人体轮廓信息相关的直方图统计;步骤2-4:将各区域统计的直方图进行拼接,形成表示该人体剪影图像的全局直方图;步骤2-5:对该全局直方图进行归一化处理,得到全局直方图向量;步骤3:对得到的全局直方图向量进行k-means聚类,并对同一类全局直方图向量标相同的编号;步骤4:将全局直方图向量按照其对应的视频帧播放顺序排列,计算相邻且编号相同的全局直方图向量的均值得到一均值向量,并对应替换计算前编号相同的若干全局直方图向量,如这些编号序列具有周期性,则只选取其中的两个周期;步骤5:计算熵向量;步骤5-1:将得到的所有均值向量的每个相同位置处的分量横向链接,组成一个a×b的矩阵,其...

【专利技术属性】
技术研发人员:解梅康钦谋卜英家张碧武
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1