一种基于卷积神经网络的人体行为识别方法技术

技术编号:21892855 阅读:14 留言:0更新日期:2019-08-17 14:52
本发明专利技术提供一种基于卷积神经网络的人体行为识别方法,包括如下步骤:采集不同人体动作的图像,每张所述图像都有一个人体骨架序列;根据人体骨架序列形成所述人体图像的移动骨架描述符图像和移动关节描述符图像;将不同人体动作的移动骨架描述符图像和移动关节描述符图像分别作为训练集训练卷积神经网络;将待识别人体动作的图像分别输入训练好的两个卷积神经网络中,分别得到各个人体动作的分数;将两种分数中相同人体动作对应的分数相加,得出得分最高的动作,作为人体行为识别的结果。本发明专利技术使得对于输入的人体姿势序列,能够使用卷积神经网络进行人体行为识别,提高对人体行为识别的准确度,并且降低学习模型的计算复杂度。

A Human Behavior Recognition Method Based on Convolutional Neural Network

【技术实现步骤摘要】
一种基于卷积神经网络的人体行为识别方法
本专利技术涉及一种基于卷积神经网络的人体行为识别方法,属于行为识别、深度学习、机器视觉等交叉

技术介绍
人体行为识别是计算机视觉领域中的一个重要研究课题,具有重要的理论意义与实际应用价值。随着科技的发展,目前人体骨架主要有两个获取的途径:通过RGB图像进行关节点估计或是通过深度摄像机直接获得(例如Kinect)。而深度摄像机正成为人体行为识别最常用的传感器之一。目前使用深度图和人体骨架数据来进行人体行为识别变得非常流行,但现有的技术还存在一些局限性。首先,传统的基于深度图的人体行为识别通常需要建立多个视角的深度图数据集,提取大量特征,以便为分类提供各种人类行为的独特表现,能识别出在前视图中看起来相似,在侧视图中不同的动作。其次,尽管基于深度图的人体行为识别方法结果比较准确,但当输入的特征维度较大时,学习模型的计算复杂度会迅速增加,因此在解决大规模问题和实时应用方面变得更加缓慢、复杂、不实用。最后,利用人体骨架数据进行人体行为识别对关节运动相当敏感,很容易把两个相同动作识别成不同的动作。对于人体行为系统的研究,国内外所采用的技术并不成熟。大部分人体行为识别系统依赖于人工对数据进行标记加工,再将数据放入模型中进行识别。对数据有较强的依赖性,其系统运行效率低,不适合工业化与商品化的需求。最近在人类视觉皮层层次处理的启发下,深度学习,特别是卷积神经网络,在图像分类方面取得了巨大的成功。但更具成本效益且更准确的人体行为识别方法,还需要进行大量的研究工作。
技术实现思路
技术问题:专利技术所要解决的技术问题是通过一套系统,使得对于输入的人体姿势序列,能够使用卷积神经网络进行人体行为识别,提高对人体行为识别的准确度,并且降低学习模型的计算复杂度。技术方案:本专利技术的一种基于卷积神经网络的人体行为识别方法,包括以下步骤:步骤1:输入一个由深度摄像机捕获的用于人体行为识别的数据集,数据集中的每个深度序列(即样本动作)都有一个人体骨架序列文件,通过数据集获得人体骨架序列;步骤2:用归一化函数F将步骤1得到的人体骨架序列中的每个人体关节的三维坐标转化为标准化空间中的三维关节坐标(x′i,y′i,z′i),将所有标准化空间的坐标按照一定顺序堆叠起来形成移动骨架描述符图像,用不同人体动作的移动骨架描述符图像作为训练集训练卷积神经网络;步骤3:将步骤1得到的人体骨架序列中的用笛卡尔坐标表示的人体关节坐标,转换成用球坐标表示。将每一帧的θ、r组合起来形成移动关节描述符图像,其中,角度θ表示人体关节坐标与z轴的垂直角度,角度表示人体关节坐标与x轴的水平角度,角度r表示人体关节坐标与原点之间的距离。用不同人体动作的移动关节描述符图像作为训练集训练卷积神经网络;步骤4:将待识别人体动作的图像分别输入步骤2和3训练好的两个卷积神经网络中,分别得到各个人体动作的分数,即图像中可能出现的各个人体动作的概率;步骤5:将步骤4得到的两种分数中相同人体动作对应的分数进行分数融合的操作,得出得分最高的动作,作为人体行为识别的结果;步骤6:输出人体行为识别的结果。其中,所述步骤2具体如下:步骤21:步骤1得到的人体骨架序列中,给定具体N帧[F1,F2,…,FN]的人体骨架序列s,令(xi,yi,zi)为第n帧{Fn}∈s中的每个人体关节的三维坐标,其中n∈[1,N];步骤22:用归一化函数F将s中每个人体关节的三维坐标转化为标准化空间s′中的三维关节坐标(x′i,y′i,z′i),即Fi′=(x′i,y′i,z′i)=F(xi,yi,zi),其中min{c}和max{c}分别是s中所有坐标的最大值和最小值,即max(xn,yn,zn)和min(xn,yn,zn);步骤23:将所有标准化空间的坐标堆叠起来,形成时间序列[F′1,F′2,…,F′n]来表示整个动作序列,将这些元素量化为RGB颜色空间,并存储为RGB图像;步骤24:将人体关节分别五个部分,包括两个手臂、两个腿和一个躯干,按照两个手臂、一个躯干、两个腿的顺序,重新排列RGB图像中的像素行的位置,即重新排列序列[F′1,F′2,…,F′n]中的所有帧,得到移动骨架描述符图像;步骤25:经过步骤21~步骤24的预处理,得到了移动骨架描述符图像,将大小调整为112×112,用作卷积神经网络CNN模型的输入。该模型中,第一卷积层使用32个7×7大小的卷积滤波器,第二、第三、第四卷积层分别使用64、128、256个5×5的卷积滤波器,最后一个卷积层使用512个3×3的卷积过滤器;步骤26:在步骤25中,初试学习率为0.0008,权重衰减为0.0005,动量为0.9,softmax回归层根据基础训练的权重为每个人体动作生成分数。所述步骤3具体如下:步骤31:步骤1得到的人体骨架序列中人体关节的坐标用笛卡尔坐标表示,转换成用球坐标表示,人体关节的集合Joints={J1,J2,…,Jk,…,J20},其中角度θ表示人体关节与z轴的垂直角度,角度表示人体关节与x轴的水平角度,角度r表示人体关节与原点之间的距离,J1,J2,…,Jk,…,J20表示从数据集提供的骨架模型的20个人体关节,Jk表示第k个人体关节;步骤32:求出三个灰度图像R、G、B,其中R(Jk,n)={θ|θ是第n帧中关节Jk的坐标θ},B(Jk,n)={r|r是第n帧中关节Jk的坐标r};步骤33:将三个灰度图像组合在一起产生移动关节描述符MJD,MJD=R+B+G;步骤34:经过步骤31~步骤33的预处理,得到了移动关节描述符图像,将大小调整为112×112,用作卷积神经网络CNN模型的输入。该模型中,第一卷积层使用32个7×7大小的卷积滤波器,第二、第三、第四卷积层分别使用64、128、256个5×5的卷积滤波器,最后一个卷积层使用512个3×3的卷积过滤器;步骤35:在步骤34中,初试学习率为0.0008,权重衰减为0.0005,动量为0.9,softmax回归层根据基础训练的权重为每个人体动作生成分数。所述步骤4具体如下:步骤41:将步骤26和步骤35输出的相同工作对应的两个分数进行融合操作,将两个通道输出的分数相加,得分最大的分数对应的动作即识别出的动作。有益效果:本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:本专利技术只使用人体姿势数据进行人体行为识别,相比传统的使用深度图进行行为识别,学习模型的计算复杂度显著降低。本专利技术对人体姿势数据采用了不同的算法转换成两个不同的描述符图像,使用卷积神经网络以相同的参数同时进行训练,最后通过分数融合来完成人体行为识别。其中两个不同的描述符图像分别为移动骨架描述符图像和移动关节描述符图像,是两种新的基于骨架的表示方法。通过这些方法的应用,提高了人体行为识别的准确性,同时降低了学习模型的计算复杂度,使系统具有较高的成本效益,具体来说:(1)本专利技术采用两个通道以相同的参数在卷积神经网络中进行训练,相比单一通道,具有更高的准确性。(2)本专利技术只使用了人体姿势数据,比传统的深度图的维数更低,降低了训练的计算时间,使得整个人体行为识别的过程更简单、更快捷。(3)本专利技术将人体姿势数据用球坐标转换成描述符,比使用笛卡尔坐标得出的结果更准确,提高了行为识别本文档来自技高网...

【技术保护点】
1.一种基于卷积神经网络的人体行为识别方法,其特征在于,包括如下步骤:步骤1:采集不同人体动作的图像,每张所述图像都有一个人体骨架序列;步骤2:根据人体骨架序列形成所述人体图像的移动骨架描述符图像;步骤3:根据人体骨架序列形成所述人体图像的移动关节描述符图像;步骤4:将步骤2和步骤3中得到的不同人体动作的移动骨架描述符图像和移动关节描述符图像分别作为训练集训练卷积神经网络;步骤5:将待识别人体动作的图像分别输入步骤4训练好的两个卷积神经网络中,分别得到各个人体动作的分数;步骤6:将步骤5中得到的两种分数中相同人体动作对应的分数相加,得出得分最高的动作,作为人体行为识别的结果。

【技术特征摘要】
1.一种基于卷积神经网络的人体行为识别方法,其特征在于,包括如下步骤:步骤1:采集不同人体动作的图像,每张所述图像都有一个人体骨架序列;步骤2:根据人体骨架序列形成所述人体图像的移动骨架描述符图像;步骤3:根据人体骨架序列形成所述人体图像的移动关节描述符图像;步骤4:将步骤2和步骤3中得到的不同人体动作的移动骨架描述符图像和移动关节描述符图像分别作为训练集训练卷积神经网络;步骤5:将待识别人体动作的图像分别输入步骤4训练好的两个卷积神经网络中,分别得到各个人体动作的分数;步骤6:将步骤5中得到的两种分数中相同人体动作对应的分数相加,得出得分最高的动作,作为人体行为识别的结果。2.根据权利要求1所述的一种基于卷积神经网络的人体行为识别方法,其特征在于,所述步骤2中根据人体骨架序列形成移动骨架描述符图像的步骤包括:步骤21:步骤1得到的人体骨架序列中,给定具体N帧[F1,F2,…,FN]的人体骨架序列s,令(xi,yi,zi)为第n帧{Fn}∈s中的每个人体关节的三维坐标,其中n∈[1,N];步骤22:用归一化函数F将s中每个人体关节的三维坐标转化为标准化空间s′中的三维关节坐标(x′i,y′i′z′i),即F′i=(x′i,y′i′z′i)=F(xi,yi,zi),其中min{c}和max{c}分别是s中所有坐标的最大值和最小值,即max(xn,yn,zn)和min(xn,yn,zn),其中n∈[1,N];步骤23:将所有标准化空间的坐标堆叠起来,形成时间序列[F′1,F′2,…,F′N]来表示整个动作序列,将这些元素量化为RGB颜色空间,并存储为RGB图像;步骤24:将人体关节分别五个部分,包括...

【专利技术属性】
技术研发人员:赵立昌陈志岳文静吴宇晨孙斗南周传
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1