【技术实现步骤摘要】
【国外来华专利技术】具有改进的姿态跟踪的运动学交互系统
技术介绍
[0001]三维(3D)人类姿态估计技术被用于许多应用中,比如人机交互、运动中的生物力学分析、电影的3D角色动画、游戏、以及社会虚拟现实(virtual reality,VR)。该技术的一个目标是将在二维(2D)视频中捕捉的一个或多个人的人体关节定位在3D空间中。然而,这在实践中是很难实现的。从捕捉的2D图像预测身体关节的3D位置通常使用具有相应3D姿态注释的图像的数据集,但试图从这样的数据集进行预测经常会导致时间上不连贯的输出,在相邻的视频帧中出现明显的抖动和不现实的人类姿态。因此,在将人类运动从捕捉的2D视频或图像正确映射到再现的3D图像方面,存在许多非简单的挑战。
附图说明
[0002]要求保护的主题的实施例的特征和优点将随着以下详细描述进行并且在参考附图后变得清楚,附图中:
[0003]图1图示了根据本公开的实施例的对两个个体发生3D姿态跟踪的示例环境。
[0004]图2图示了根据本公开的实施例配置的示例运动学交互系统的框图。
[0005]图3是根据本公开的实施例的生成主体的3D姿态的方法。
[0006]图4A图示了根据本公开的实施例的从2D图像捕捉的主体的示例姿态。
[0007]图4B图示了根据本公开的实施例的叠加在主体上的2D骨架图。
[0008]图4C图示了根据本公开的实施例的从图4B的2D骨架图得出的3D骨架图。
[0009]图4D图示了根据本公开的实施例的考虑到更准确的骨段的改进的3D骨架图。
[00 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种被配置为生成主体的3D姿态的系统,所述系统包括:至少一个处理器,被配置为执行下列操作:从被配置为捕捉所述主体的一个或多个图像的图像捕捉设备接收所述一个或多个图像;产生与所述一个或多个图像中的所述主体相关联的二维(2D)骨架图,其中,所述2D骨架图包括多个2D关节位置;至少基于所述多个2D关节位置,来产生与所述一个或多个图像中的所述主体相关联的估计的三维(3D)骨架图,其中,所述估计的3D骨架图包括多个3D关节位置以及3D关节位置的相应对之间的多个骨段;通过至少重定位所述估计的3D骨架图的多个骨段中的一个或多个骨段的相应长度以更紧密地匹配模板3D骨架图的相应一个或多个模板骨段的相应长度,来产生改进的3D骨架图,所述模板3D骨架图具有多个模板3D关节位置以及模板3D关节位置的相应对之间的多个模板骨段;以及基于所述主体的相应运动,来对所述改进的3D骨架图进行动画化。2.如权利要求1所述的系统,还包括:所述图像捕捉设备,其中,所述图像捕捉设备包括单个RGB相机。3.如权利要求1所述的系统,其中,所述至少一个处理器被配置为通过将与所述2D骨架图相关联的数据输入到神经网络中来产生所述估计的3D骨架图,其中,所述神经网络被配置为至少输出所述多个3D关节位置。4.如权利要求1所述的系统,其中,所述至少一个处理器还被配置为生成所述模板3D骨架图,其中,生成所述模板3D骨架图包括:设置所述模板3D骨架图的高度并且使用人体测量统计来确定所述模板骨段的长度。5.如权利要求1
‑
4中的任一项所述的系统,其中,所述重定位生成重定位的3D骨架图,并且所述至少一个处理器还被配置为将所述重定位的3D骨架图的3D关节位置转换成相对于根关节位置的多个关节角度。6.如权利要求5所述的系统,其中,产生所述改进的3D骨架图包括:最小化联系所述重定位的3D骨架图、所述估计的3D骨架图和所述2D骨架图的目标函数的误差,以求解所述改进的3D骨架图的关节角度和根关节位置。7.如权利要求1
‑
4中的任一项所述的系统,其中,所述至少一个处理器还被配置为基于每个所述2D关节位置和2D根关节位置之间的距离,来正规化所述2D关节位置。8.如权利要求7所述的系统,其中,所述2D根关节位置表示所述主体的骨盆关节。9.如权利要求1
‑
4中的任一项所述的系统,其中,所述至少一个处理器还被配置为执行下列操作:产生与所述一个或多个图像中的第二主体相关联的第二2D骨架图,其中,所述第二2D骨架图包括第二多个2D关节位置;至少基于所述第二多个2D关节位置,来产生与所述一个或多个图像中的所述第二主体相关联的第二估计的三维(3D)骨架图,其中,所述第二估计的3D骨架图包括第二多个3D关节位置以及第二3D关节位置的相应对之间的第二多个骨段;通过至少重定位所述第二估计的3D骨架图的第二多个骨段中的一个或多个骨段的相
应长度以更紧密地匹配第二模板3D骨架图的一个或多个相应第二模板骨段的相应长度,来产生第二改进的3D骨架图,所述第二模板3D骨架图具有第二多个模板3D关节位置以及第二模板3D关节位置的相应对之间的第二多个模板骨段;以及基于所述第二主体的相应运动,来对所述第二改进的3D骨架图进行动画化。10.一种生成主体的3D姿态的由计算机实现的方法,所述方法包括:接收由图像捕捉设备捕捉的主体的一个或多个图像;产生与所述一个或多个图像中的所述主体相关联的二维(2D)骨架图,其中,所述2D骨架图包括多个2D关节位置;至少基于所述多个2D关节位置,来产生与所述一个或多个图像中的所述主体相关联的估计的三维(3D)骨架图,其中,所述估计的3D骨架图包括多个3D关节位置以及3D关节位置的相应对之间的多个骨段;通过至少重定位所述估计的3D骨架图的多个骨段中的一个或多个骨段的长度以更紧密地匹配模板3D骨架图的相应模板骨段的长度,来产生改进的3D骨架图,所述模板3D骨架图具有多个模板3D关节位置以及模板3D关节位置的相应对之间的多个模板骨段;以及基于所述主体的相应运动,来对所述改进的3D骨架图进行动画化。11.如权利要求10所述的由计算机实现的方法,其中,产生所述估计的3D骨架图包括:将与所述2D骨架图相关联的数据输入到神经网络中,其中,所述神经网络被配置为至少输出所述多个3D关节位置。12.如权利要求10所述的由计算机实现的方法,还包括:生成所述模板3D骨架图,其中,生成所述模板3D骨架图包括:设置所述模板3D骨架图的高度并且使用人体测量统计来确定所述模板骨段的长度。13.如权利要求10
‑
12中的任一项所述的由计算机实现的方法,其中,所述重定位生成重定位的3D骨架图,并且所述方法还包括:将所述重定位的3D骨架图的...
【专利技术属性】
技术研发人员:王山东,康杨雨轩,姚安邦,陆鸣,陈玉荣,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。