一种基于弱监督学习的人体三维姿态估计方法技术

技术编号：38817205 阅读：14 留言：0更新日期：2023-09-15 19:56

本发明专利技术涉及一种基于弱监督学习的人体三维姿态估计方法，从图像/视频中估计出人体的各个主要关节点的三维坐标，得到人体在图像/视频中的三维姿态，从而能够帮助计算机在立体空间中理解人体的行为动作。首先基于对抗生成式网络的二维人体姿态估计方法，利用单目视频的帧间一致性假设，构建时空域的对抗生成网络，引入自适应滤波处理，通过将自适应滤波器嵌入到GAN中，实现了端到端的二维人体姿态估计生成；其次，利用视频的帧间信息估计出深度，并结合估计出的相机位姿，从参考帧变换到目标帧，以几何一致性为约束，对估计的三维骨架关节点进行深度约束；最后，引入图像处理中的多分辨思想，通过将生成的三维人体骨架反投影回二维空间，降采样为低分辨率的二维人体部件图，与二维人体姿态估计网络构成循环对抗生成网络。本发明专利技术提出的基于弱监督学习的三维人体姿态估计方法，可以提升二维姿态与三维姿态估计的准确性，在减少对语义标注依赖的前提下，尽可能消除语义歧义性以及几何不一致。尽可能消除语义歧义性以及几何不一致。尽可能消除语义歧义性以及几何不一致。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于弱监督学习的人体三维姿态估计方法

[0001]本专利技术涉及计算机视觉领域，特别是涉及一种基于弱监督学习的人体三维姿态估计方法。

技术介绍

[0002]运动是人类维持生命、完成任务、改造客观世界的基础，也是人类在图像等信息媒体中的主要表现形式，使计算机获取并分析场景中人物的运动是模式识别与自动化领域的一项重要内容。人体运动数据较好地保持了真实人体运动细节，并详细记录了其运动轨迹，被广泛应用在体育仿真、医学理疗、机器人模拟、工厂监控等领域。在此背景下，以获取和利用人体运动数据为目的的人体运动监测研究已经成为近年来研究热点，主要包含对人体媒体数据的信号序列处理、人体姿态估计、运动重构、运动追踪、运动识别、运动质量评估，以及运动合成与编辑等。
[0003]随着对人体运动监测的研究逐渐深入并应用到各个领域，以及运动数据传感器设备的逐渐普及，利用机器学习技术自动化地获取并分析运动数据中承载的人体运动信息，实现人体运动在线监测，越来越受到研究人员的关注。当前人体运动数据捕获方法主要分为从特定的运动捕获设备获取、从其他媒体数据中估计人体运动信息，以及从运动数据库中编辑及合成新的运动数据。其中，通过特定的运动捕获设备进行运动数据采集能够保留人体运动的细节特征，生成高逼真度的人体动画，在计算机动画和游戏开发领域具有广泛的应用。然而，此类方法进行数据捕获一般为针对某一类特定运动获取一次性数据，当所需运动类型发生变化时，就需要选择特定人员在特定场景进行重新捕获。这将带来捕获成本高、数据来源少等问题，且不能完全反映人类的正常...

【技术保护点】

【技术特征摘要】
1.一种基于对抗生成网络的弱监督三维人体姿态估计方法，其特征在于该方法步骤如下：步骤(1)、基于动态滤波的对抗生成式二维人体姿态估计，单目视频的二维人体姿态估计利用连续的视频帧得到t时刻的二维人体姿态D
t
和相机运动矩阵T
t
。在缺少真实值的条件下，利用视角之间的转换完成对其中各个网络的监督。在给定参考帧的情况下，利用参考帧及其与相邻帧之间的相关性，来衡量二维人体姿态是否准确；步骤(2)、基于深度约束的三维人体姿态估计，在提取到二维人体姿态的基础上，采用弱监督对抗式学习二维到三维数据分布之间的映射，根据人体运动学模型，若三维人体姿态的二维姿态、关节点间的相对深度以及骨架长度这三个要素确定，则三维人体姿态几乎可以完全确定。据此，设计一个弱监督学习框架，对三维人体姿态的三要素进行约束；步骤(3)、基于多分辨迭代训练的自监督机制，为确保最终估计的三维人体姿态的准确性，借鉴图像超分辨率任务中的多尺度迭代训练思想，设计多分辨迭代训练的自监督机制。2.根据权利要求1所述的一种基于对抗生成网络的弱监督三维人体姿态估计方法，其特征在于：所述步骤(1)基于动态滤波的对抗生成式二维人体姿态估计，具体步骤如下：步骤(A1)、假设场景本身是静止的，没有任何移动的人物；目标帧和源图片之间不存在任何遮挡关系；人体表面是Lambertian的，即不存在由视点转换而引起的颜色变化；步骤(A2)、为使视点合成能够嵌入卷积神经网络，利用双线性插值的思想，将传统warping方法可微化，以此为基础，利用编码
‑
解码网络，分别估计二维人体姿态与相机位姿。为提升估计结果的准确性，引入动态滤波网络，根据输入帧的不...

【专利技术属性】
技术研发人员：牟恒辰，刘义，李文昌，刘晓冬，刘瑞军，王晓川，
申请(专利权)人：北京机械工业自动化研究所有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人