基于全局信息整合的多人姿态估计方法技术

技术编号：21893046 阅读：65 留言：0更新日期：2019-08-17 14:57

本发明专利技术公开了一种基于全局信息整合的多人姿态估计方法，包括：对输入图像进行前期处理；经过人体检测器生成一组人体边界框，将获得的人体边界框输入“特征编码+姿态解码”模块中进行模型训练；依次预测每个人的关键点的定位，生成多个关键点热图，以表示每个关键点的位置置信度；最后，通过姿态非极大值抑制模块消除冗余的姿态估计以得到最终的人体姿态。本发明专利技术所提出的一种基于全局信息整合的多人姿态估计方法，通过结合不同归一化策略与多层信息融合可以显著提高多人姿态估计的精度，采用超边几何约束策略能够有效减少误连接，能够有效地改善在尺度变化，遮挡和复杂的多人场景中遇到困难的姿态估计方法。

Multi-person attitude estimation method based on global information integration

全部详细技术资料下载

【技术实现步骤摘要】
基于全局信息整合的多人姿态估计方法
本专利技术涉及一种多人姿态方法，特别涉及一种基于全局信息整合的多人姿态估计方法，属于图像处理

技术介绍
试图让计算机具备自动理解图像或者视频序列中蕴含的人体行为信息的能力一直都是众多机器学习相关领域研究的热点问题。人体姿态估计是这些任务的重要基础，在行为识别、人机交互、人类重新识别、影音娱乐等领域均有广泛的应用。人体姿势估计是指从图像中定位身体关键点(头部，肩部，肘部，手腕，膝盖，脚踝等)，通过图像分析来确定不同人体部位在图片中的位置和方向等定位信息的过程，是人体动作行为识别与分析的基础。我们关注单张图片中的多人姿态估计问题。由于自然图片中的背景与光照、人体外观特征和姿势结构的复杂多变性，该任务面临诸多挑战，当场景推广到多人时，问题进一步复杂化。在这项工作中，我们主要关注基于卷积神经网络的方法，由于卷积神经网络可以从大数据中自动学习抽象特征，相比传统人体姿态估计算法中采用的手工设计的特征，它有更强的表达和区分能力，能更准确地表征真实人体外观特征，而且卷积神经网络模型还具有很强的非线性映射能力，可以更加有效地实现从图像特征到人体姿态的映射。现有多人姿态估计现阶段有两种常用的方法：基于部分框架标记出候选的部分检测并且将它们和每个个体关联起来，然后根据部件组队的得分高低判断组合方式。两步框架借助现有的用于单人姿势判断的技术，先检测人，然后对每一个人进行姿态估计，这两步分别进行。两种方法各有优缺点，前者需要进行匹配算法，虽然能达到实时，但精度不高；后者姿态估计的精度在很大程度上取决于检测到的边界框的质量，并且人数越多，...

【技术保护点】
1.一种基于全局信息整合的多人姿态估计方法，其特征在于，包括如下步骤：步骤一：输入图像数据，将该图像数据的大小调整为卷积神经网络的输入大小；步骤二：经过人体检测器生成一组人体边界框，将获得的人体边界框输入姿态卷积神经网络进行模型训练，所述的姿态卷积神经网络结构包括基于全局信息提取的特征编码模块和基于全局信息提取的姿态解码模块；步骤三：依次预测每个人的关键点的定位，生成多个关键点热图，所述关键点热图用于表示每个关键点的位置置信度，所述位置置信度表示每个关键点的得分；步骤四：通过姿态非极大值抑制模块消除冗余的姿态估计，具体包括：选择得分最高的姿势作为参考，通过应用消除标准来消除接近它的一些姿势；对剩余姿势设置重复该过程，直到消除冗余姿势并且仅报告唯一姿势，得到最终的人体姿态。

【技术特征摘要】
1.一种基于全局信息整合的多人姿态估计方法，其特征在于，包括如下步骤：步骤一：输入图像数据，将该图像数据的大小调整为卷积神经网络的输入大小；步骤二：经过人体检测器生成一组人体边界框，将获得的人体边界框输入姿态卷积神经网络进行模型训练，所述的姿态卷积神经网络结构包括基于全局信息提取的特征编码模块和基于全局信息提取的姿态解码模块；步骤三：依次预测每个人的关键点的定位，生成多个关键点热图，所述关键点热图用于表示每个关键点的位置置信度，所述位置置信度表示每个关键点的得分；步骤四：通过姿态非极大值抑制模块消除冗余的姿态估计，具体包括：选择得分最高的姿势作为参考，通过应用消除标准来消除接近它的一些姿势；对剩余姿势设置重复该过程，直到消除冗余姿势并且仅报告唯一姿势，得到最终的人体姿态。2.根据权利要求1所述的基于全局信息整合的多人姿态估计方法，其特征在于，所述关键点包括：人体的五官、肩、肘、腕、髋、膝、踝。3.根据权利要求1所述的基于全局信息整合的多人姿态估计方法，其特征在于，所述基于全局信息提取的特征编码模块基于残差网络，并引入实例归一化策略，使得在特征提取中更专注于人体实例，图像目标特征的注意力更高；首先使用卷积-池化操作从图片中提取出低层次特征，包括：轮廓；之后的1到4层网络基于之前提取更高一些的语...

【专利技术属性】
技术研发人员：田佳豪，乔会翔，雷蕾，王敏杰，张加焕，肖江剑，
申请(专利权)人：中国科学院宁波材料技术与工程研究所，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人