【技术实现步骤摘要】
基于非负矩阵分解的分部位人体运动识别方法
本专利技术属于视频图像处理
,特别涉及人体运动识别方法,可用于视频监控,人体姿态估计。
技术介绍
近年来,人体运动识别作为计算机视觉领域的重大热点备受人们关注,在视频监控系统,驾驶员辅助系统,人机交互系统都有广泛的应用和发展前景。但是,由于人体是非刚性的,其多变性和多样性、衣服纹理、光照条件以及自遮挡等因素都严重影响人体运动识别的效果,并且,视频图像的分辨率比较低,很难有明显的特征提取。所以,如何从复杂的人体运动中找到正确表达运动信息的本质特征以及从视频中准确的获得,是目前备受关注的关键问题。当前的人体运动识别方法主要包括两部分框架:特征提取和分类器的学习,其识别结果的优劣主要取决于所提取的运动特征的描述能力。目前,特征提取的方法有很多:例如梯度直方图算子方法HOG、尺度不变特征转化算子方法SIFT、加速鲁棒特征算子方法SURF等,上述特征提取方法适用于二维图像;在三维图像中的特征提取方法包括:梯度直方图扩展到三维空间算子方法HOG3D,时空块算子方法Cuboids,角点检测扩展到三维空间算子方法Harris3D等, ...
【技术保护点】
一种基于非负矩阵分解的分部位人体运动识别方法,包括如下步骤:(1)将KTH数据库中的运动视频按照99:1的比例选取训练视频集X和测试视频集T;(2)根据Fischler和Elschlager提出的图结构模型将人体划分为5部分,分别为:头部,左上肢,右上肢,左下肢,右下肢;(3)从训练视频集X中选取一个样本视频L,根据上述划分分别提取人体各部位的运动兴趣点及相对应的运动特征;(4)将提取的人体各部位的运动特征通过下式进行非负矩阵分解;E=V?WH其中,V为正实数空间中n×m维矩阵,用来表示人体各部位运动特征矩阵,H为正实数空间中s×m维矩阵,用来表示一个基础矩阵,W为正实数空 ...
【技术特征摘要】
1.一种基于非负矩阵分解的分部位人体运动识别方法,包括如下步骤:(1)将KTH数据库中的运动视频按照99:1的比例选取训练视频集X和测试视频集T;(2)根据Fischler和Elschlager提出的图结构模型将人体划分为5部分,分别为:头部,左上肢,右上肢,左下肢,右下肢;(3)从训练视频集X中选取一个样本视频L,根据上述划分分别提取人体各部位的运动兴趣点及相对应的运动特征;(4)将提取的人体各部位的运动特征通过下式进行非负矩阵分解;E=V-WH其中,V为正实数空间中n×m维矩阵,用来表示人体各部位运动特征矩阵,H为正实数空间中s×m维矩阵,用来表示一个基础矩阵,W为正实数空间中n×s维矩阵,用来表示一个投影矩阵,即人体各部位运动特征矩阵V在基础矩阵H上的投影,E为实数空间中n×m维矩阵,用来表示一个误差矩阵,参数n,m,s均为正整数;(5)计算上述非负矩阵分解式中的投影矩阵W和基础矩阵H,设定误差矩阵E的阈值矩阵E',使得误差矩阵E小于或等于设定的阈值矩阵E':(5a)根据人体各部位运动特征矩阵V的维数大小n、m,利用公式s<<m*n/(m+n)选取正整数s,并随机生成大小为n×s维的投影矩阵W和大小为s×m维的基础矩阵H;(5b)设定阈值矩阵E'=1*10-6;(5c)分别计算人体各部位的误差矩阵Eq:Eq=Vq-WqHq;其中q=1,2,3,4,5,分别表示人体的头部,左上肢,右上肢,左下肢,右下肢这5个部位,Vq表示部位q的运动特征矩阵,Wq表示部位q的投影矩阵,Hq表示部位q的基础矩阵;(5d)当人体各部位误差矩阵Eq大于阈值矩阵E'时,分别对投影矩阵Wq中的元素Wik和基础矩阵Hq中的元素Hkj进行更新,得到投影矩阵Wq中更新后的元素Wik*和基础矩阵Hq中更新后的元素Hkj*:#其中:Wik表示投影矩阵Wq第i行第k列元素,0<i≤n,0<k≤s,Hkj表示基础矩阵Hq第k行第j列的元素,0<k≤s,0<j≤m,上标T表示矩阵的转置;(5e)通过对投影矩阵Wq和基础矩阵Hq全部元素的更新得到更新后的投影矩阵Wq*和基础矩阵Hq*,并用更新后的投影矩阵Wq*和基础矩阵Hq*替换原有的投影矩阵Wq和基础矩阵Hq:Wq=Wq*,Hq=Hq*,(5f)重复步骤(5c)~(5e),直至人体各部分误差矩阵Eq等于或小于阈值矩阵E'为止,得到最终的人体各部分投影矩阵Wq,作为最终的人体各部位运动特征;(6)对人体各部位运动特征进行级联,得到最终的人体运动特征;(7)重复上述步骤(2)~(6)分别对训练样本集X和测试样本集T中的所有视频提取特征并进行非负...
【专利技术属性】
技术研发人员:韩红,史媛媛,曹赛,洪汉梯,陈建,李楠,刘三军,甘露,郭玉言,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。