一种基于卷积神经网络的多人姿态估计方法技术

技术编号：21478666 阅读：44 留言：0更新日期：2019-06-29 05:02

本发明专利技术提出了一种基于卷积神经网络的多人姿态估计方法，将待处理图像输入到已完成训练的多人姿态估计网络得到两组数据，分别为人体关键点位置数据和人体关键点映射向量数据，然后解码数据得到图像中人体关键点和人体中心点的位置，并通过映射向量将关键点映射到可聚类的二维空间，再使用k‑means算法对映射后的关键点进行聚类间接实现原始人体关键点的分组，对分组关键点分析，最终实现多人姿态估计。本发明专利技术提出的多人姿态估计网络由特征提取网络、特征通道压缩模块、人体关键点位置分支模块和人体关键点映射向量分支模块四部分组成，可以实现端到端的训练和预测。本发明专利技术是一种自下而上多人姿态估计方法，在速度和准确率上均有良好表现。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积神经网络的多人姿态估计方法
本专利技术属于计算机视觉
，具体涉及到了一种基于卷积神经网络的多人姿态估计方法。
技术介绍
在计算机视觉任务中，人体常常是主要的研究对象，例如视频监控、运动分析和人机交互等。人的行为动作由人体关键点或称为骨骼点的运动组成，如肩部、手肘和手腕的运动组成手的运动。如果可以定位这些人体关键点，就可以为后续的人体行为分析打下基础，例如在无人监守的情况下自动识别打砸，行人跌倒等异常行为。基于计算机视觉的多人姿态估计，是指根据图像信息定位人体关键点，将人体关键点相连从而构成人体骨架模型。多人姿态估计主要面临以下难点：图像中的人体可能出现在任意位置，数量和尺寸未知；图像中的人体存在互相遮挡的情况，人体外观不完整；图像中的人体姿态复杂多变等。近年来，得益于卷积神经网络的强大图像特征提取能力，多人姿态估计取得了显著的进步，主要可以分为自上而下和自下而上两种思路。其中自上而下是指，首先检测图像中人体从而获得人体的位置、数量和尺寸信息，再对每个检出人体采用单人姿态估计方法。这种方法依赖人体检测器，测试速度慢且随图像中人体个数线性变慢。自下而上是指，首先检测图像中所有的人体关键点再建模关键点之间的关系，属于相同人体的关键点分组在一起，组成人体骨架模型，从而实现多人姿态估计。现有技术一般采用预测关键点标记或者关键点之间的连接关系，通过标记或者连接关系对关键点分组，不能很好的利用人体结构特点，可解释性较差。
技术实现思路
针对现有技术的缺陷，本专利技术提供了一种基于卷积神经网络的多人姿态估计方法，旨在解决现有技术自上而下的方法速度慢，依赖人体...

【技术保护点】
1.一种基于卷积神经网络的多人姿态估计方法，其特征在于，包括下述步骤：(1)使用完成训练的多人姿态估计网络对输入的图像进行计算得到人体关键点位置数据和人体关键点映射向量数据；(2)解码所述人体关键点位置数据得到所述图像中所有的m类人体关键点和人体中心，解码所述人体关键点映射向量数据，将所述每类人体关键点和人体中心映射到可聚类的二维空间得到人体关键点映射后的二维坐标；(3)对所述映射后的二维坐标分组，进行多人姿态估计。

【技术特征摘要】
1.一种基于卷积神经网络的多人姿态估计方法，其特征在于，包括下述步骤：(1)使用完成训练的多人姿态估计网络对输入的图像进行计算得到人体关键点位置数据和人体关键点映射向量数据；(2)解码所述人体关键点位置数据得到所述图像中所有的m类人体关键点和人体中心，解码所述人体关键点映射向量数据，将所述每类人体关键点和人体中心映射到可聚类的二维空间得到人体关键点映射后的二维坐标；(3)对所述映射后的二维坐标分组，进行多人姿态估计。2.如权利要求1所述的多人姿态估计方法，其特征在于，所述多人姿态估计网络包括特征提取网络、特征通道压缩模块、人体关键点位置分支模块和人体关键点映射向量分支模块；所述特征提取网络用于提取所述图像的特征；所述特征通道压缩模块用于压缩所述特征；所述人体关键点位置分支模块用于输出人体关键点位置数据；所述人体关键点映射向量分支模块用于输出人体关键点映射向量数据。3.如权利要求2所述的多人姿态估计方法，其特征在于，所述特征通道压缩模块包括卷积层、BN(BatchNormalization，批归一化)和ReLU(Rectifiedlinearunit，修正线性单元)激活函数；所述人体关键点位置分支模块包括3层卷积和激活函数，前两层激活函数为ReLU激活函数，最后一层激活函数为sigmoid激活函数；所述人体关键点映射向量分支模块包括3层卷积和激活函数，前两层激活函数为ReLU激活函数，最后一层激活函数为tanh激活函数。4.如权利要求1所述的多人姿态估计方法，其特征在于，所述多人姿态估计网络的训练采用的损失函数为平方损失函数，定义总体损失函数为：Loss＝loc_loss+conf_loss+vec_loss其中loc_loss表示位置损失，conf_loss表示...

【专利技术属性】
技术研发人员：邹腊梅，熊紫华，李长峰，李晓光，陈婷，张松伟，俞天敏，车鑫，颜露新，钟胜，杨卫东，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人