【技术实现步骤摘要】
基于卷积神经网络的人体动作姿态智能估计方法及装置
本专利技术涉及深度学习计算机视觉领域,具体涉及一种基于卷积神经网络的人体动作姿态智能估计方法及装置。
技术介绍
随着计算机科学技术的快速发展以及公众社会对技术应用需求的不断提升,人工智能的研究和应用越来越受到学术界与工业界的关注。随着硬件设备的高速发展、人工智能与深度学习技术的不断完善以及由此催生的各种实践产品,人体姿态估计在日常生活中拥有着广泛的应用前景,并不断开拓到新的市场,目前关于人体姿态估计应用的几个主流场景包括:安防监控、人机交互、运动分析、无人驾驶等。这也说明了人体姿态估计具有很大的理论意义与实践价值。如今,现有的基于深度学习的人体姿态估计方法中,采用自底向上策略的模型其平均准确率一般不如采用自顶向下的方法,而其他采用自顶向下策略的模型对不同人体关键点采用相同的学习过程,容易遗漏在人体图像中受干扰因素影响难以分辨的关键点,导致人体姿态估计不准确。
技术实现思路
本专利技术的目的是提供一种基于卷积神经网络的人体动作姿态智能估计方法及装置, ...
【技术保护点】
1.一种基于卷积神经网络的人体动作姿态智能估计方法,其特征在于,包括:/n将待进行动作姿态估计的人体图像输入到训练好的人体检测模型中进行处理,得到所述人体图像的人物个体检测结果;/n将所述人物个体检测结果输入到训练好的全局估计模型中进行处理,得到不同尺度的人体关键点的第一特征图;/n将所述第一特征图输入到训练好的补充精调模型中进行处理,通过加强学习得到不同尺度的人体关键点的第二特征图;所述补充精调模型中包括多个特征提取分支,每个特征提取分支中设置数量不同的精调模块,通过各特征提取分支的精调模块加强学习;/n基于所述不同尺度的人体关键点的第二特征图,得到人体姿态估计结果。/n
【技术特征摘要】
1.一种基于卷积神经网络的人体动作姿态智能估计方法,其特征在于,包括:
将待进行动作姿态估计的人体图像输入到训练好的人体检测模型中进行处理,得到所述人体图像的人物个体检测结果;
将所述人物个体检测结果输入到训练好的全局估计模型中进行处理,得到不同尺度的人体关键点的第一特征图;
将所述第一特征图输入到训练好的补充精调模型中进行处理,通过加强学习得到不同尺度的人体关键点的第二特征图;所述补充精调模型中包括多个特征提取分支,每个特征提取分支中设置数量不同的精调模块,通过各特征提取分支的精调模块加强学习;
基于所述不同尺度的人体关键点的第二特征图,得到人体姿态估计结果。
2.根据权利要求1所述的人体动作姿态智能估计方法,其特征在于,所述通过精调模块加强学习,包括:
所述精调模块的输入为上一层特征图,对所述特征图进行多次先进行规范化处理、再进行激活、后进行卷积特征提取的处理方式,将提取得到的特征图与所述上一层特征图相加后,输出精调后的特征图;
其中,当所述特征提取分支上设置一个精调模块时,该精调模块输入的上一层特征图为所述第一特征图;
当所述特征提取分支上设置一个以上的精调模块时,第一个精调模块输入的上一层特征图为所述第一特征图,第一个精调模块输出的精调后的特征图作为下一个精调模块的输入。
3.根据权利要求1所述的人体动作姿态智能估计方法,其特征在于,所述精调模块包括残差分支,其中,残差分支上设置有依次连接的第一归一化层、第一激活层、第一卷积层、第二归一化层、第二激活层、第二卷积层、第三归一化层、第三激活层、第三卷积层;
所述精调模块还包括相加层,用于对经过残差分支处理后输出的特征图和输入精调模块的特征图相加,以输出精调后的特征图。
4.根据权利要求1所述的人体动作姿态智能估计方法,其特征在于,所述补充精调模型中,通过各特征提取分支的精调模块加强学习之后,还包括:
对每个特征提取分支输出的精调后的特征图依次进行压缩、激励和整合操作,其中压缩操作通过全局平均池化压缩不同通道上的特征图以获得全局特征,激励操作通过将学习得到的非线性依赖关系来对不同通道赋予相应的权重系数,整合操作将压缩操作、激励操作的结果整合到所述精调后的特征图中,以对所述精调后的特征图进行重新标定,输出所述人体关键点的第二特征图。
5.根据权利要求1所述的人体动作姿态智能估计方法,其特征在于,所述人体检测模型、全...
【专利技术属性】
技术研发人员:官全龙,罗伟其,李哲夫,刘东灵,张焕明,方良达,汪超男,赖兆荣,
申请(专利权)人:暨南大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。