基于核稀疏编码的人体行为识别方法技术

技术编号：13672479 阅读：75 留言：0更新日期：2016-09-07 20:46

本发明专利技术公开了一种基于核稀疏编码的人体行为识别方法，属于数字图像处理技术领域。本发明专利技术首先将输入视频分成固定长度且相互重叠的视频段，再对每个视频段提取梯度与光流特征协方差或者形状特征协方差，并采用对称正定矩阵降维方法对协方差矩阵进行降维。在Stein核的基础上，提出一种稀疏最大化的对阵正定矩阵空间字典学习，并将黎曼流形嵌入再生核希尔伯特空间提出一种黎曼稀疏求解器。本发明专利技术用于视频的人体行为识别，处理简单，计算复杂度低，对行为差异、视角变化、低分辨率具有很好的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于数字图像处理
，涉及计算机视觉、模式识别等相关理论知识，尤其是基于协方差矩阵的人体行为识别。
技术介绍
人体行为识别是计算机视觉领域的研究热点和难点，其核心是利用计算机视觉技术自动从视频序列中检测、跟踪、识别人并对其行为进行理解和描述。人体运动分析和行为识别方法是人体行为理解的核心内容，主要包括对视频人体检测，跟踪运动人体，获取人体行为的相关参数，最终达到理解人体行为的目的。人体行为识别方法主要运用于智能监控系统，主动、实时地分析视频中人体行为，及时报告可疑行为；基于内容的视频检索，对视频内容进行分析和理解，简历结构和索引；还广泛应用于人体交互、机器人、智能房间和看护中心。人体行为识别主要由人体行为表示和人体行为识别分类两个基本步骤构成，它们对人体行为识别率有显著的影响。当前人体行为识别方法主要有：一)：基于时空兴趣点云的行为识别。从不同的时间尺度提取兴趣点积累成点云，并避免对背景和静态前景检测。采用近邻分类或者支撑向量机SVM进行识别分类。该方式可以捕获平滑运动，对视角改变具有鲁棒性，遮挡处理代价小，详见文献“Matteo Bregonzio,Shaogang Gong and Tao Xiang.Recognising Action as Clouds of Space-Time Interest Points.IEEE Conference on Computer Vision and Pattern Recognition(CVPR),June 2009.”；二)：基于深度轨迹的行为识别。对每帧像素进行深度采样，并利用深度光流...

【技术保护点】
一种基于核稀疏编码的人体行为识别方法，其特征在于，包括下列步骤：步骤1：提取输入视频的行为特征：将输入视频分成长度固定且相互重叠的视频段；分别对各视频段的像素点进行特征提取，得到像素点(x,y,t)的像素点特征f(x,y,t)，其中(x,y)表示像素点的平面坐标，t表示像素点的视频帧信息；特征提取的方式为梯度光流特征或者形状协方差特征：当采用梯度光流特征时，分别计算像素点(x,y,t)的像素值沿x、y方向的一阶、二阶梯度绝对值：|Ix|,|Iy|,|Ixx|,|Iyy|，沿x,y,t方向的光流u,v,w，以及u,v,w对时刻t求偏导数，则f(x,y,t)＝[g,o]，其中当采用形状特征时，提取当前视频块的前景图像，再在前景图像中，分别计算坐标位置(x,y)到前景图像的轮廓边界的水平与垂直四个方向的距离dE,dw,dS,dN，坐标位置(x,y)到前景图像的轮廓的最小外接矩形的顶点的距离dNE,dSW,dSE,dNW；计算像素点(x,y,t)所在视频帧与当前视频段的起始帧、结束帧的间隔帧数则基于每个视频段的行为特征向量f(x,y,t)构建协方差矩阵F：其中S表示视频段的不同视频帧的图像区域...

【技术特征摘要】
1.一种基于核稀疏编码的人体行为识别方法，其特征在于，包括下列步骤：步骤1：提取输入视频的行为特征：将输入视频分成长度固定且相互重叠的视频段；分别对各视频段的像素点进行特征提取，得到像素点(x,y,t)的像素点特征f(x,y,t)，其中(x,y)表示像素点的平面坐标，t表示像素点的视频帧信息；特征提取的方式为梯度光流特征或者形状协方差特征：当采用梯度光流特征时，分别计算像素点(x,y,t)的像素值沿x、y方向的一阶、二阶梯度绝对值：|Ix|,|Iy|,|Ixx|,|Iyy|，沿x,y,t方向的光流u,v,w，以及u,v,w对时刻t求偏导数，则f(x,y,t)＝[g,o]，其中当采用形状特征时，提取当前视频块的前景图像，再在前景图像中，分别计算坐标位置(x,y)到前景图像的轮廓边界的水平与垂直四个方向的距离dE,dw,dS,dN，坐标位置(x,y)到前景图像的轮廓的最小外接矩形的顶点的距离dNE,dSW,dSE,dNW；计算像素点(x,y,t)所在视频帧与当前视频段的起始帧、结束帧的间隔帧数则基于每个视频段的行为特征向量f(x,y,t)构建协方差矩阵F：其中S表示视频段的不同视频帧的图像区域，|S|表示图像区域S的像素点数目；步骤2：将协方差矩阵F转换到再生核希尔伯特空间，对行为特征向...

【专利技术属性】
技术研发人员：解梅，黄成挥，程石磊，刘伸展，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人