【技术实现步骤摘要】
【国外来华专利技术】基于激光雷达的三维人体动作捕捉方法、训练方法及系统
[0001]相关专利申请
[0002]本申请是2022年2月25日递交的第PCT/CN2022/078083号国际专利申请的延续申请案。上述申请通过本专利技术的整体引用,成为本专利技术的一部分。
[0003]本专利技术一般涉及捕捉动作。更具体地,本专利技术涉及远距离三维人体动作捕捉系统和方法。
技术介绍
[0004]近几年来,深度神经网络在根据图像或视频推断三维人体姿势方面取得了显著成果,深度神经网络的研究重点与设计数据集紧密相关,可以使用数据集对深度神经网络进行训练。然而,这些数据集一般不包括远距离或长距离下使用光探测和测距(LiDAR)传感器捕捉的人体动作、IMU系统获取的地面实况人体动作以及同步彩色图像。因此,需要一种涵盖深度信息和准确三维姿势地面实况信息的训练数据集。考虑到点云中存在的时空关系以及时间顺序,通常采用基于学习的方法来处理点云。作为广泛使用的基于标记的方案的替代方案,无标记动作捕捉技术可以减少基于标记的解决方案对身体佩戴式标记的需求。
技术实现思路
[0005]本专利技术介绍了训练机器学习模型生成基于光探测和测距(LiDAR)点云的三维(3D)动作的系统和方法。在各个实施例中,计算系统可以对代表场景中对象的机器学习模型进行编码。所述计算系统可以使用数据集训练机器学习模型,所述数据集包括单目LiDAR传感器捕捉到的同步LiDAR点云以及从IMU设备获得的地面实况三维运动。机器学习模型可以基于单目LiDAR传感器捕捉到 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种基于激光雷达的三维人体动作捕捉模型的训练方法,所述方法包括以下步骤:计算系统对代表场景中对象的机器学习模型进行编码;计算系统使用数据集训练所述机器学习模型,所述数据集包括单目LiDAR传感器捕捉到的同步LiDAR点云以及从IMU设备获得的地面实况三维动作;其中,所述机器学习模型可以基于单目LiDAR传感器捕捉到的多个点云帧的输入生成对象的三维动作。2.根据权利要求1所述的方法,其中,所述对象是人体。3.根据权利要求2所述的方法,其中,所述同步LiDAR点云包括单目LiDAR传感器捕捉到的多个点云帧,所述单目LiDAR传感器与人体相隔一定距离,所述多个点云帧的每个点包括至少一个时间戳,其中所述距离的范围在至少10
‑
50米之间。4.根据权利要求2所述的方法,其中,所述地面实况三维动作与人体相关,人体每个地面实况三维动作包括时间戳、空间坐标、人体多个关节旋转以及人体三维姿势。5.根据权利要求2所述的方法,其中,所述数据集进一步包括人体同步图像。6.根据权利要求5所述的方法,其中,所述数据集进一步包括人体同步图像的标签,其中,每个标签包括一个二维围框,围绕同步图像中描述的人体。7.根据权利要求6所述的方法,进一步包括以下步骤使用数据集中人体同步图像,训练第二机器学习模型;通过经过训练的第二机器学习模型,输出人体第二三维动作;基于人体第二三维动作,评价人体三维动作。8.根据权利要求1所述的方法,其中,所述机器学习模型包括一个时间编码器模块,用于从每个点云帧中提取全局描述符,生成全局描述符的多个隐藏变量,并预测多个关节位置;其中,所述时间编码器模块包括一个PointNet++网络、一个双向GRU和一个MLP编码器;其中,所述PointNet++网络可以提取全局描述符,所述双向GRU可以生成所述多个隐藏变量,所述MLP编码器可以预测所述多个关节位置。9.根据权利要求8所述的方法,其中,所述机器学习模型进一步包括一个动作学解算器模块,用于将全局特征与每个关节连接来生成完整的关节特征,并用于输出完整的关节特征来计算所述多个关节旋转,其中,所述动作学解算器包括一个ST
‑
GCN,用于将全局特征与每个关节连接。10.根据权利要求9所述的方法,其中,所述机器学习模型进一步包括一个关节优化器模块,用于优化所述多个关节的旋转,其中,所述优化器模块包括一个SMPL模型,用于优化所述多个关节的旋转。11.一种基于激光雷达的三维人体动作捕捉模型的训练系统,所述系统包括:一个处理器;一个存储设备,用于存储代表场景中对象的机器学习模型以及数据集,数据集包括单目LiDAR传感器捕捉到的同步LiDAR点云以及从IMU设备获得的地面实况三维动作,其中,所述机器学习模型可以基于单目LiDAR传感器捕捉到的多个点云帧的输入生成对象的三维动作;一个存储器,用于存储指令,当所述处理器执行指令时,使系统能够利用数据集来进行机器学习模型的训练。
12.根据权利要求11所述的系统,其中,所述对象是人体。13.根据权利要求12所述的系统,其中,所述同步LiDAR点云包括单目LiDAR传感器捕捉到的多个点云帧,所述单目LiDAR传感器与人体相隔一段距离,所述多个点云帧的每个点包括一个时间戳,其中所述距离的范围在至少10
‑
50米之间。14.根据权利要求12所述的系统,其中,所述地面实况三维动作与人体相关,人体每个地面实况三维动作包括时间戳、空间坐标、人体多个关节旋转以及人体三维姿势。15.根据权利要求12所述的系统,其中,所述数据集进一步包括人体同步图像。16.根据权利要求15所述的系统,其中,所述数据集进一步包括人体同步图像的标签,其中,每个标签包括一个二维围框,围绕同步图像中描述的人体。17.根据权利要求16所述的系统,其中,...
【专利技术属性】
技术研发人员:王程,李嘉廉,许岚,温程璐,虞晶怡,
申请(专利权)人:上海科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。