【技术实现步骤摘要】
一种基于特征金字塔网络的单阶段多人姿态估计方法
本专利技术涉及人体姿态估计
,特别涉及一种基于特征金字塔网络的单阶段多人姿态估计方法。
技术介绍
人体姿态估计是计算机视觉进一步理解人体行为的关键步骤,即通过一张RGB图像有效预测出人体所有关节点并形成正确的姿态。准确预测出人体姿态对更高级别的计算机视觉任务,如人的行为识别、人机交互、行人重识别、异常行为检测等均有重要的意义。尽管人体姿态估计领域发展迅速,但对于多人姿态估计任务,目前不论是自顶向下还是自底向上的方法,均为多阶段的方法,以上方法均存在的一个问题是耗时且无法发挥CNN网络端到端可训练的优势。传统的姿态估计方法在一味地追求精度时,却忽略了对网络参数、推理速度的思考;导致姿态估计算法难以落地,极大的降低了经济效益。在网络结构设计方面,HowardA,ZhmoginovA,ChenLC,等人(18thProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition)在论文“Mobi ...
【技术保护点】
1.一种基于特征金字塔网络的单阶段多人姿态估计方法,其特征在于,包括:/n步骤10、基于MobileNet网络搭建特征金字塔网络,所述金字塔网络用于提取分辨率顺序降低的多张初级特征图,然后进行通道间的信息融合,接着以分辨率最低的初级特征图为起点,对所有初级特征图在特征分支之间进行上采样和特征相加操作,最后进行预测输出;/n步骤20、获取多人姿态估计数据集,所述多人姿态估计数据集包括多人姿态图片以及关节点地面真值标注;利用所述多人姿态估计数据集构造中心点热图、上偏移热图、下偏移热图以及关节细化热图作为训练标签,对所述特征金字塔网络进行训练;/n步骤30、将待测图像输入训练好的 ...
【技术特征摘要】
1.一种基于特征金字塔网络的单阶段多人姿态估计方法,其特征在于,包括:
步骤10、基于MobileNet网络搭建特征金字塔网络,所述金字塔网络用于提取分辨率顺序降低的多张初级特征图,然后进行通道间的信息融合,接着以分辨率最低的初级特征图为起点,对所有初级特征图在特征分支之间进行上采样和特征相加操作,最后进行预测输出;
步骤20、获取多人姿态估计数据集,所述多人姿态估计数据集包括多人姿态图片以及关节点地面真值标注;利用所述多人姿态估计数据集构造中心点热图、上偏移热图、下偏移热图以及关节细化热图作为训练标签,对所述特征金字塔网络进行训练;
步骤30、将待测图像输入训练好的所述特征金字塔网络,根据输出的中心点热图、上偏移热图、下偏移热图以及关节细化热图计算关节位置,然后根据所述关节位置形成完整的人体姿态。
2.根据权利要求1所述的方法,其特征在于,所述步骤10具体包括:
步骤11、创建多个第一卷积核,用于提取图像初级特征并改变图像特征的通道数;
步骤12、在所述多个第一卷积核的输出端,依次级联由多个反向残差单元构成的卷积模块,完成多层特征提取主分支的搭建,所述特征提取主分支输出的多层原始特征图分辨率大小依次降低;
步骤13、在所述反向残差单元模块提取出的各层原始特征图之后,均设置一组第二卷积核,用于对当前层的原始特征图进行通道间的信息融合,得到对应的融合特征图;
步骤14、以分辨率最低的特征图层次为起点,依次级联多个反卷积模块,用于将当前层的融合特征图的分辨率放大为下一层融合特征图的分辨率大小,得到放大特征图,接着将所述放大特征图与所述下一层融合特征图进行逐位置的元素求和操作,得到强化特征图;
步骤15、利用四组并行的多个第三卷积核对分辨率最大的强化特征图进行预测输出。
3.根据权利要求1所述的方法,其特征在于:所述步骤20中,对所述特征金字塔网络进行训练,具体为:分别计算所述特征金字塔网络预测输出的中心点热图、上偏移热图、下偏移热图以及关节细化热图与训练标签的损失值以及总损失,然后根据所述损失值训练所述特征金字塔网络;
计算中心点热图损失值的公式为:
其中,P(pj)表示预测的中心点热图中位置为pj处的预测值,G(pj)表示由训练标签构造的中心点热图位置为pj处的真值...
【专利技术属性】
技术研发人员:骆炎民,张智谦,林躬耕,
申请(专利权)人:华侨大学,福建省公田软件股份有限公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。