一种人体姿态估计方法及相关装置制造方法及图纸

技术编号：37377690 阅读：13 留言：0更新日期：2023-04-27 07:20

本申请提供了一种人体姿态估计方法及相关装置，该人体姿态估计方法包括：基于连续预设帧数的第一原始图像，获取背景区域图像集；利用背景区域图像集进行背景建模，得到完整背景图像；对帧序号取值大于预设帧数的第二原始图像以及完整背景图像进行差分运算，得到对应于第二原始图像的前景目标图像；对前景目标图像进行特征提取及预测，得到对应于第二原始图像的人体姿态估计结果。通过本申请方案的实施，对多帧原始图像进行背景建模可获得较为完整的背景图，然后基于完整背景图对待检测图像进行去背景处理，再对前景目标进行姿态估计，可排除大部分背景干扰导致的误检，有效提高了人体骨架点检测结果的准确性。人体骨架点检测结果的准确性。人体骨架点检测结果的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种人体姿态估计方法及相关装置

[0001]本申请涉及图像处理
，尤其涉及一种人体姿态估计方法及相关装置。

技术介绍

[0002]近年来，随着深度学习技术的不断进步，人体姿态估计(也即人体骨架点检测)得到了较大发展，人体骨架点包括关节、五官等，通过这些关键点可以描述人体骨骼信息。目前，人体姿态估计技术在实际场景中的应用也越来越广泛，如娱乐健身、康复训练、动作识别等。
[0003]然而，在实际应用场景下，待检测图像中可能存在复杂背景，进而在人体姿态估计过程中容易受背景干扰而导致人体骨架点误检的问题。而为了克服此类问题，在相关技术中，针对当前帧待检测图像，通常直接将前一帧图像的背景区域作为参考，来获取当前帧图像的前景目标，然后对所获取的前景目标进行人体骨架点检测，但是，在运动场景下，前一帧图像的背景区域与当前帧图像的实际背景区域仅是具备一定相似性，在复杂运动场景下并不能为当前帧图像的人体骨架点检测提供准确参考，在实际应用中仍然存在较高的误检可能性，人体骨架点检测结果的整体准确性相对较低。

技术实现思路

[0004]本申请实施例提供了一种人体姿态估计方法及相关装置，至少能够解决相关技术中所提供的人体姿态估计方案的误检可能性较高，人体骨架点检测结果的整体准确性相对较低的问题。
[0005]本申请实施例第一方面提供了一种人体姿态估计方法，包括：基于连续预设帧数的第一原始图像，获取背景区域图像集；其中，所述背景区域图像集包括对应于多帧所述第一原始图像的多张背景区域图像；利用所述背景区域图像集...

【技术保护点】

【技术特征摘要】
1.一种人体姿态估计方法，其特征在于，包括：基于连续预设帧数的第一原始图像，获取背景区域图像集；其中，所述背景区域图像集包括对应于多帧所述第一原始图像的多张背景区域图像；利用所述背景区域图像集进行背景建模，得到完整背景图像；对第二原始图像以及所述完整背景图像进行差分运算，得到对应于所述第二原始图像的前景目标图像；其中，所述第二原始图像的帧序号取值大于所述预设帧数；对所述前景目标图像进行特征提取及预测，得到对应于所述第二原始图像的人体姿态估计结果。2.根据权利要求1所述的人体姿态估计方法，其特征在于，所述对所述前景目标图像进行特征提取及预测，得到对应于所述第二原始图像的人体姿态估计结果的步骤，包括：将所述前景目标图像输入至训练完成的人体姿态估计模型中的特征提取网络，输出目标特征图像；将所述目标特征图像输入至所述人体姿态估计模型中的姿态预测网络，输出对应于所述第二原始图像的人体姿态估计结果。3.根据权利要求2所述的人体姿态估计方法，其特征在于，所述特征提取网络包括最大池化模块、多个级联的卷积模块以及平均池化模块；所述将所述前景目标图像输入至训练完成的人体姿态估计模型中的特征提取网络，输出目标特征图像的步骤，包括：将所述前景目标图像输入至训练完成的人体姿态估计模型中的特征提取网络，利用所述最大池化模块对所述前景目标图像进行最大池化处理，得到第一特征图像；将各所述卷积模块的输入以及输出进行特征融合后作为下一卷积模块的输入，利用多个级联的所述卷积模块对所述第一特征图像进行卷积处理，得到第二特征图像；利用所述平均池化模块对所述第二特征图像进行平均池化处理，得到目标特征图像。4.根据权利要求2所述的人体姿态估计方法，其特征在于，所述姿态预测网络包括多个级联的stage模块，所述stage模块包括关键点置信度预测网络以及关键点亲和度向量场预测网络；所述将所述目标特征图像输入至所述人体姿态估计模型中的姿态预测网络，输出对应于所述第二原始图像的人体姿态估计结果的步骤，包括：将所述目标特征图像输入至所述人体姿态估计模型中的姿态预测网络，依次利用各所述stage模块的所述关键点置信度预测网络获取关键点置信度图像，以及利用所述关键点亲和度向量场预测网络获取关键点亲和度向量场；将最后一个所述stage模块的所述关键点置信度图像以及所述关键点亲和度向量场融合后所得的输出，作为对应于所述第二原始图像的人体姿态估计结果；其中，相邻两个所述stage模块中，...

【专利技术属性】
技术研发人员：陈宇，
申请(专利权)人：奥比中光科技集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人