【技术实现步骤摘要】
一种基于热图梯度约束的人体姿态估计方法
[0001]本专利技术涉及计算机视觉
,具体而言是一种引入热图梯度约束的人体姿态估计方法。
技术介绍
[0002]人体姿态估计是计算机视觉领域中的一个重要课题,在智能安防、自动驾驶、智能家居金和动画建模等领域有着广泛的应用。该课题旨在预测一张图片中所有人体的关键点的坐标,例如手腕、脖子等。
[0003]根据训练时标注数据的表征形式不同,人体姿态估计算法主要分为两大类:基于坐标回归的方法和基于热图回归的算法。基于坐标回归的方法让人体姿态估计网络直接输出关键点坐标,这种方法的优点是可以从图片到关键点坐标端到端地反向传播,缺点是人体姿态估计网络需要拟合高度非线性的目标函数,并且关键点坐标提供的空间信息过于稀疏,使得人体姿态估计网络的训练难度大大增加,因此最终的预测效果较差。
[0004]基于热图回归的方法首先将标注的关键点坐标构建成高斯分布热图,让人体姿态估计网络以构建的高斯分布目标热图为预测目标,并在最终使用时从预测的热图中通过解码方法得到最终的预测坐标。这种方法相较于基于坐标回归的方法,降低了目标函数的非线性度,并且高斯分布目标热图为训练过程提供了更多的监督信息,因此获得更好的效果,成为了人体姿态估计的主流方法。
[0005]虽然基于热图回归的方法的已经取得较高的预测效果,但是目前基于热图回归的方法采用的均方误差损失函数这一训练目标,与最终从预测热图中解码出的预测坐标的准确率这一任务目标,这两者之间仍然存在不对齐的问题。具体而言,目前基于热图回归的方 ...
【技术保护点】
【技术特征摘要】
1.一种基于热图梯度约束的人体姿态估计方法,其特征是按如下步骤进行:步骤1、对人体姿态估计数据库进行数据预处理:所述人体姿态估计数据库中任意第A个样本是由一张原始图片I
A
、一个人体框bbox
A
和一组人体关键点μ
A
组成;所述样本A的一组人体关键点坐标μ
A
包含K个坐标,记为其中,表示第i个人体关键点的坐标,K表示人体关键点数;使用样本A的人体框bbox
A
对原始图片I
A
进行裁剪,并缩放到指定尺寸后得到输入图片I
′
A
,并将原始图片I
A
上的人体关键点坐标μ
A
转换到输入图片I
′
A
上的人体关键点坐标μ
′
A
;由{I
′
A
,μ
′
A
}构成样本A预处理后的一组人体姿态数据,从而得到包含N个样本的预处理后的人体姿态数据库D
p
;步骤2、基于HRNet网络构建基于热图回归的人体姿态估计网络F
p
:所述HRNet网络包括:输入层、B个特征提取与融合阶段和输出层;其中,所述输入层包括:卷积层、批标准化层、ReLU激活函数;B个特征提取与融合阶段由B个特征提取模块和B个融合模块构成,每个特征提取模块由卷积层、批标准化层、ReLU激活函数和残差连接组成,每个融合模块由卷积层、批标准化层和ReLU激活函数组成;所述输出层包括:反卷积层、卷积层、批标准化层和ReLU激活函数;使用高斯分布对所述HRNet网络中所有卷积层、反卷积层和批标准化层进行权值初始化;步骤3、使用引入热图梯度约束的损失函数训练人体姿态估计网络F
p
:步骤3.1、根据所述人体姿态数据库D
p
中样本A的人体姿态数据{I
′
A
,μ
′
A
}中的人体关键点坐标μ
′
A
生成样本A的目标热图和目标热图梯度图其中,表示样本A的第i个人体关键点的目标热图,表示样本A的第i个人体关键点的目标热梯度图;步骤3.1.1、利用式(1)生成样本A的第i个人体关键点的目标热图上坐标为(x,y)的像素值从而得到样本A的第i个人体关键点的目标热图最终得到样本A的K个人体关键点的目标热图人体关键点的目标热图式(1)中,和表示预处理后的第i个人体关键点坐标μ
i
′
A
的x轴值和y轴值,σ一个是固定的超参数,X和Y分别表示目标热图的尺寸;步骤3.1.2、利用式(2)生成样本A的第i个人体关键点的目标热图梯度上坐标为(x,y)的像素值从而得到样本A的第i个人体关键点的目标热图梯度图最终得到样本A的K个人体关键点的目标热图梯度图样本A的K个人体关键点的目标热图梯度图式(2)中,和表示第i个关键点在x轴和y轴方向的目标热图梯度图在坐
标(x,y)的像素值;表示样本A的第i个人体关键点的目标热图上坐标为(x+1,y)的像素值,表示样本A的第i个人体关键点的目标热图上坐标为(x,y+1)的像素值;步骤3.2、将所述人体姿态数据库D
p
中样本A的人体姿态数据{I
′
A
,μ
′
A
}中的I
′
A
输入到人体姿态估计网络F
p
中,得到样本A的预测热图中,得...
【专利技术属性】
技术研发人员:王上飞,方林,
申请(专利权)人:合肥综合性国家科学中心人工智能研究院安徽省人工智能实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。