一种小尺度感知增强的人体姿态估计方法技术

技术编号:36954751 阅读:93 留言:0更新日期:2023-03-22 19:15
本发明专利技术公开了一种小尺度感知增强的人体姿态估计方法,该方法汲取了以往模型的不足,针对于小尺度目标的表现做了专门的优化,选用了更为精确的Top

【技术实现步骤摘要】
一种小尺度感知增强的人体姿态估计方法


[0001]本专利技术属于计算机视觉及人体姿态估计
,具体涉及一种小尺度感知增强的人体姿态估计方法。

技术介绍

[0002]二维人体姿态估计(HPE)是计算机视觉领域非常重要的一个分支,受到了许多研究者的关注,其具体的做法就是从图片中定位出人体的关节点(膝盖、手肘等);HPE在实际生活中有着大量的应用,例如动作识别、动画制作、增强现实等领域。
[0003]在HPE领域主要有两大分支:一种是基于坐标回归的方法,另一种是基于热图回归的方法。
[0004]基于坐标回归的方法;现有人体关键点的数据集均以坐标的形式对关节点进行标注,因此研究者们也最先容易联想到让网络生成同样形式的信号来进行监督学习,因此基于坐标回归的方法在早期十分受欢迎,文献[Toshev,A.,Szegedy,C.:Deeppose:Human pose estimation via deep neural networks.In:Proceedings of the IEEE conference on computer v本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种小尺度感知增强的人体姿态估计方法,包括如下步骤:(1)获取大量含有人物的图片,并对图片中人物的关节点位置进行标注;(2)构建基于SSA

Net的模型框架,其包括:BackBone模块,用于对输入的图片进行特征提取;TAA模块,用于对提取得到的特征图进行特征增强;SimCC模块,根据增强后的特征图对关节点位置进行预测;(3)利用步骤(1)中获取的图片及其标注信息对上述模型框架进行训练;(4)将包含人物的待估计图片输入至训练好的模型中,即可预测出该图片中人物各关节点的位置坐标。2.根据权利要求1所述的人体姿态估计方法,其特征在于:所述BackBone模块以HRNet_W48为骨干网络,保留高分辨率分支,并将其他分辨率分支的输出进行了特征融合。3.根据权利要求1所述的人体姿态估计方法,其特征在于:所述TAA模块的输入特征图为原图片尺寸的1/4,该模块首先利用转置卷积将输入特征图的大小转变为原图片尺寸的1/2,然后将特征图通过1
×
1的卷积操作,保证特征图尺寸不变的前提下,将其通道数扩大为原来的2倍;进而再将特征图送入坐标注意力机制模块进行编码,最后将坐标注意力机制模块的输入与输出通过残差机制进行特征融合后作为TAA模块最终的输出结果。4.根据权利要求3所述的人体姿态估计方法,其特征在于:所述坐标注意力机制模块首先将输入特征图从宽度和高度两个方向分别进行全局平均池化,得到宽度和高度两个方向的特征图,然后将这两个方向的特征图拼接在一起后依次通过1
×
1的卷积操作、批量归一化处理以及Sigmoid激活函数得到特征图f,进而将特征图f按照原来的高度和宽度分别进行1
×
1的卷积操作得到通道数与输入一样的特征图F
h
和F,F
h
和F分别通过Sigmoid激活函数后得到对应高度和宽度上的注意力权重g
h
和g
w
,最后利用g
h
和g
w

【专利技术属性】
技术研发人员:李少华张海翔马汉杰冯杰
申请(专利权)人:浙江理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1