【技术实现步骤摘要】
一种基于Transformer的手部模型重建方法及装置
[0001]本专利技术涉及人机交互
,特别是指一种基于
Transformer
的手部模型重建方法及装置
。
技术介绍
[0002]手部姿态重建是计算机视觉领域的一项重要任务,以往的研究多关注于单手手部三维重建,但是由于人类常常需要利用双手和外界进行交互,双手图像常常存在复杂的交互和遮挡情况,并且双手皮肤材质的相似也进一步提升了重建的难度
。
对于双手交互状态的手部模型重建任务来说,虽然单手重建方法同样能够实现双手的重建,但是由于双手交互时存在严重遮挡,并且双手之间皮肤材质的相似也进一步增大了重建的难度,之前的单手重建方法无法较好地处理双手交互的情况
。
一些以往的方法采用深度相机跟踪手部,但是其成本相比于普通相机较高,且应用较难
。
[0003]随着双手交互数据集
I nterhand2.6M
的推出,一些直接从
RGB
图像中重建双手的方法被提出
。
采用两阶段的方式,先利用编码器预测双手的
MANO
参数模型参数和
3D
关键点,再利用全连接神经网络进一步微调
。
通过预测初始的参数表示再微调的方式,提升重建效果
。
但是该方法没有考虑中间表示,并且由于有符号距离场的目标函数较难优化,因此重建效果一般
。
[0004]考虑重建当中图像特征的重要性,引入了 ...
【技术保护点】
【技术特征摘要】
1.
一种基于
Transformer
的手部模型重建方法,其特征在于,所述方法包括:对手部姿态的生成条件进行设定,获得合成参数;将所述合成参数输入合成数据生成管线,获得合成数据集;基于
Transformer
学习模型进行模型构建,获得待训练手部重建模型;使用所述合成数据集和预设的真实数据集,对所述待训练手部重建模型进行训练,获得手部重建模型;输入目标手部图片,通过所述手部重建模型进行重建,获得目标手部重建模型
。2.
根据权利要求1所述的一种基于
Transformer
的手部模型重建方法,其特征在于,所述合成参数包括手部姿态标注的生成方式
、
相机位置和光照参数
。3.
根据权利要求2所述的一种基于
Transformer
的手部模型重建方法,其特征在于,所述将所述合成参数输入合成数据生成管线,获得合成数据集,包括:基于所述手部姿态标注的生成方式,通过预设的标注生成器,获得合成标注生成数据;基于所述手部姿态标注的生成方式,通过预设的背景生成器,获得合成背景生成数据;采用所述相机位置
、
所述光照参数
、
所述合成标注生成数据和所述合成背景生成数据,通过预设的网格渲染器,获得合成数据集
。4.
根据权利要求1所述的一种基于
Transformer
的手部模型重建方法,其特征在于,所述待训练手部重建模型包括多层特征提取模块
、
顶点回归和模型重建模块
。5.
根据权利要求4所述的一种基于
Transformer
的手部模型重建方法,其特征在于,所述多层特征提取模块用于提取待训练手部重建模型的输入数据的多尺度图像特征
。6.
根据权利要求4所述的一种基于
Transformer
的手部模型重建方法,其特征在于,所述顶点回归和模型重建模块用于回归重建模型的顶点坐标以及根据重建模型的顶点坐标进行模型重建;所述顶点回归和模型重建模块包括3个
MANO
先验迁移子模块;所述
MANO
先验迁移子模块包括1个图卷积神经网络子模块和2个
Transformer
子...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。