基于混合描述子的人体运动识别方法技术

技术编号:8883405 阅读:252 留言:0更新日期:2013-07-04 02:12
本发明专利技术提出了一种基于混合描述子的人体运动识别方法,主要解决现有技术中特征提取复杂、表征能力弱的问题。其实现步骤是:(1)获得人体运动视频数据,并按8:1的比例构建训练视频集X和测试视频集T;(2)提取每个视频中人体星型模型的5个顶点坐标并计算这5个顶点坐标在其独立坐标系下的极径和极角,得到人体各个部位的统计直方图特征;(4)提取一个视频中所有图像的运动特征;(5)将统计直方图特征和运动特征级联,作为视频的最终特征;(6)分别对训练视频集X和测试视频集T中的所有视频进行特征提取,获得训练视频特征集X*和测试视频特征集T*,并对其进行学习训练,获得分类结果。本发明专利技术能准确识别人体运动,可用于视频监控、目标识别和运动识别的视频处理。

【技术实现步骤摘要】

本专利技术属于图像处理
,涉及人体运动识别方法,可用于虚拟视频、智能监控和姿态估计。
技术介绍
人体运动识别是近几年来计算机视觉领域的重大热点之一,人体运动识别在运动捕获,人机交互,视频监控等多领域获得了初步的应用,具有重大的应用前景。由于人体运动的多变性和多样性,背景的嘈杂以及光照条件,衣服纹理和自身遮挡等多方面的因素严重影响人体运动的识别效果,故从视频图像中准确估计人体姿态,实现人体运动识别是计算机视觉领域长期存在的问题。目前,人体运动识别的方法主要分为三大类:基于学习的人体运动识别、基于模型的人体运动识别和基于表现的人体运动识别。第一种,基于学习的人体运动识别方法,是先在训练的视频图像和目标视频图像数据库里提取精确的图像特征,通过机器学习从一系列训练数据中学习得到一个分类器,用该分类器来表示人体运动;然后利用该分类器对输入窗口进行分类及识别。如IvanLaptev等人采用的基于HOG和HOF的特征提取方法和基于KNN和SVM的识别方法。另外还有Somayeh Danafar和Niloofar Cheissari在其论文中采用了基于光流的特征提取方法和基于SVM的运动识别方法,其中基于光流的特征是从图像序列的相邻帧中提取。该识别方法的优点与人体模型的方法和模板匹配的方法相比是比较鲁棒,检测结果较优,但是缺点是运动信息的计算过程缺乏对行为的全局分析,且计算特征的复杂度较高,需要很多训练数据,通常需要上万的数据。第二种,基于模型的方法,是利用人体结构的先验知识建立人体模型,然后提取图像底层特征匹配到模型中,并以运动规律加以约束。当前比较典型的方法如Ju Sun采用了基于SIFT描述子和基于Markov模型的识别方法;Hsuan_Sheng Chen等人采用了基于星形骨架描述轮廓信息的特征表述方法和基于HMM的动作识别方法。这种方法简单,容易实现,但是特征表征能力较弱,信息包含较少,识别性能低,准确率不高,且容易受遮挡和人体服装差异的影响,常作为一种辅助方法。第三种,基于表现的方法,无须对人体建模,直接提取图像中感兴趣区域的底层二维表观特征,然后找出区域特征与人体动作的对应关系进行匹配。如Bobick和Davis采用了基于轮廓表征的特征表示方法和基于MHI和MEI模板的识别方法。这种方法与基于模型的方法相比计算比较简单,缺点是提出的特征对环境的动态变化敏感,易受背景变化的影响,对纹理变化不够敏感,不能最优的表征图像边缘,同时由于人体姿态的复杂性,很难构造出足够的模板以处理不同的姿态,故正确率也不高。
技术实现思路
本专利技术目的是针对上述已有技术的不足,提出一种基于混合描述子的人体行为识别方法,从人体的结构特性和人体的运动特性出发,降低人体特征提取的复杂度,在无需大量训练数据的情况下,有效地提高人体运动识别的正确率。为实现上述目的,本专利技术的技术方案包括如下:(I)将Weizmann数据库中的视频按照8:1的比例构建训练视频集X和测试视频集T,并将训练视频集X和测试视频集T中的每段视频转换为连续的单幅序列图像;(2)利用帧差法对训练视频集X中的单幅序列图像进行背景减除,并将背景减除后的彩色图像变为二值图像;(3)在上述二值图像中选取人体双手平举双脚并拢垂直站立的图片,记录图片中人体5个部位的坐标,即头部坐标权利要求1.一种,包括如下步骤: (1)将Weizmann数据库中的视频按照8:1的比例构建训练视频集X和测试视频集T,并将训练视频集X和测试视频集T中的每段视频转换为连续的单幅序列图像; (2)利用帧差法对训练视频集X中的单幅序列图像进行背景减除,并将背景减除后的彩色图像变为二值图像; (3)在上述二值图像中选取人体双手平举双脚并拢垂直站立的图片,记录图片中人体5个部位的坐标,即头部坐标(xhead, yhead),左手坐标(xOTl,yarml),右手坐标(xaniff,yarmr),左脚坐标(Xlegl,yiegi),右脚坐标(XlegrJlegr); (4)提取步骤(2)所有二值图像中人体的5个部位在以人体重心为坐标中心的直角坐标系中的坐标,分别记为左脚坐标:Oq’,y/ ),右脚坐标:Ge’ 2,f 2),头部坐标:Ge’ 3, y’ 3),左手坐标:(X’ 4) y’ 4),右手坐标:(X’ 5,y’ 5); (5)用步骤(3)中得到的头部坐标(xhMd,ytead)为坐标中心构造直角坐标系ohead,左手坐标(χ_,yarmi)为坐标中心构造直角坐标系Omil,右手坐标(xam,yarmr)为坐标中心构造直角坐标系Oam,左脚坐标(xlegl,ylegi)为坐标中心构造直角坐标系Olegl,右脚坐标(xlegr,ylegr)为坐标中心构造直角坐标系0l@ ;进行平移直角坐标系变换,将步骤(4)中得到左脚坐标(x/,Y1')转换到直角坐标系Olegl中得到 新的左脚坐标右脚坐标(X’ 2,f 2)转换到直角坐标系O1M中得到新的右脚坐标(<乂),头部坐标(X’ 3, I’ 3)转换到直角坐标系Otead中得到新的头部坐标( ),左手坐标(X’ 4, I’ 4)转换到直角坐标系Omil中得到新的左手坐标(x:jO,右手坐标(X’ 5) 5)转换到直角坐标系Omff中得到新的右手坐标^jO; (6)分别计算步骤(5)中得到的5个人体部位坐标(AfK),(X^),,( )到直角坐标系olegl,olegr, ohead, oarml, Oarmr的坐标中心的距离,依次记为d;,d d;,<,d;.’ (7)利用上述距离<,4’4’ <,名中的最大值D%计算5个人体部位坐标( ) , (χ;,ν;) , (χ;,.ν;) , (χ;,>>;),(<,‘)的极径其中 i = 1, 2......5, Dt =IBaxfcf1*, dl, d;,d:,d*s}; ⑶计算步骤(5)中得到的5个人体部位坐标( ),(x*2/2) ^ ( ), (χ (<—乂)的极角:Θ; sarctang/y:),其中 i = 1,2......5 ; (9)按照上述步骤(4) (8)将一个运动视频中的所有序列图片都做如上处理,得到一个视频中所有图片中人的5个部位的极径r*和极角Θ * ; (10)计算一个运动视频的2D统计直方图特征N: (IOa)将极径Z的取值范围等分为5个连续的子区间,将极角Θ*的取值范围等分为10个连续的子区间;再将极径r*的5个子区间和极角Θ *的10子区间分别两两组合,构成50个联合子区间; (IOb)分别统计步骤(9)得到的一个视频的所有图片中人的5个部位的极径Z和极角θ *的值落在这50个联合子区间中的次数,得到5个部位的位置特征向量,分别记为ηι,η2,η3, η4, η5,并将这5个部位的位置特征向量级联,得到一个运动视频的2D统计直方图特征N—{rij j π2,π3,Ii4J π5}; (11)利用图像矩计算一个运动视频中每幅图像中人体的帧速率,将每幅图像的帧速率级联,得到一个运动视频的运动特征V ; (12)将步骤(10)得到的2D统计直方图特征N和步骤(11)得到的运动特征V进行级联,得到一本文档来自技高网
...

【技术保护点】
一种基于混合描述子的人体运动识别方法,包括如下步骤:?(1)将Weizmann数据库中的视频按照8:1的比例构建训练视频集X和测试视频集T,并将训练视频集X和测试视频集T中的每段视频转换为连续的单幅序列图像;?(2)利用帧差法对训练视频集X中的单幅序列图像进行背景减除,并将背景减除后的彩色图像变为二值图像;?(3)在上述二值图像中选取人体双手平举双脚并拢垂直站立的图片,记录图片中人体5个部位的坐标,即头部坐标(xhead,yhead),左手坐标(xarml,yarml),右手坐标(xarmr,yarmr),左脚坐标(xlegl,ylegl),右脚坐标(xlegr,ylegr);?(4)提取步骤(2)所有二值图像中人体的5个部位在以人体重心为坐标中心的直角坐标系中的坐标,分别记为左脚坐标:(x1“,y1“),右脚坐标:(x“2,y“2),头部坐标:(x“3,y“3),左手坐标:(x“4,y“4),右手坐标:(x“5,y“5);?(5)用步骤(3)中得到的头部坐标(xhead,yhead)为坐标中心构造直角坐标系ohead,左手坐标(xarml,yarml)为坐标中心构造直角坐标系oarml,右手坐标(xarmr,yarmr)为坐标中心构造直角坐标系oarmr,左脚坐标(xlegl,ylegl)为坐标中心构造直角坐标系olegl,右脚坐标(xlegr,ylegr)为坐标中心构造直角坐标系olegr;进行平移直角坐标系变换,将步骤(4)中得到左脚坐标(x1“,y1“)转换到直角坐标系olegl中得到新的左脚坐标右脚坐标(x“2,y“2)转换到直角坐标系olegr中得到新的右脚坐标头部坐标(x“3,y“3)转换到直角坐标系ohead中得到新的头部坐标左手坐标(x“4,y“4)转换到直角坐标系oarml中得到新的左手坐标右手坐标(x“5,y“5)转换到直角坐标系oarmr中得到新的右手坐标(6)分别计算步骤(5)中得到的5个人体部位坐标到直角坐标系olegl,olegr,ohead,oarml,oarmr的坐标中心的距离,依次记为(7)利用上述距离中的最大值D*,计算5个人体部位坐标?的极径:其中i=1,2......5,(8)计算步骤(5)中得到的5个人体部位坐标的极角:其中i=1,2......5;?(9)按照上述步骤(4)~(8)将一个运动视频中的所有序列图片都做如上处理,得到一个视频中所有图片中人的5个部位的极径r*和极角θ*;?(10)计算一个运动视频的2D统计直方图特征N:?(10a)将极径r*的取值范围等分为5个连续的子区间,将极角θ*的取值范围等分为10个连续的子区间;再将极径r*的5个子区间和极角θ*的10子区间分别两两组合,构成50个联合子区间;?(10b)分别统计步骤(9)得到的一个视频的所有图片中人的5个部位的极径r*和极角θ*的值落在这50个联合子区间中的次数,得到5个部位的位置特征向量,分别记为n1,n2,n3,n4,n5,并将这5个部位的位置特征向量级联,得到一个运动视频的2D统计直方图特征N={n1,n2,n3,n4,n5};?(11)利用图像矩计算一个运动视频中每幅图像中人体的帧速率,将每幅图像的帧速率级联,得到一个运动视频的运动特征V;?(12)将步骤(10)得到的2D统计直方图特征N和步骤(11)得到的运动特征V进行级联,得到一个运动视频的最终特征B={N,V};?(13)按照上述步骤(4)~(12)提取训练视频集X和测试视频集T中的所有运动视频的最终特征,获得训练视频特征集X*和测试视频特征集T*;?(14)利用SVM算法对训练视频特征集X*进行训练学习得到分类器,将测试视频特征集T*输入到分类器中,得到各类运动的分类结果。?FDA00002975634600011.jpg,FDA00002975634600012.jpg,FDA00002975634600013.jpg,FDA00002975634600014.jpg,FDA00002975634600015.jpg,FDA00002975634600016.jpg,FDA00002975634600017.jpg,FDA00002975634600018.jpg,FDA00002975634600019.jpg,FDA000029756346000110.jpg,FDA000029756346000111.jpg,FDA000029756346000112.jpg,FDA000029756346000113.jpg,FDA000029756346000114.jpg,FDA000029756346000115.jpg,FDA000029756346000116.jpg...

【技术特征摘要】

【专利技术属性】
技术研发人员:韩红焦李成王爽李晓君张红蕾谢福强韩启强顾建银
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1