一种基于深度图像的三维外形恢复和姿态估计方法和装置制造方法及图纸

技术编号：25757231 阅读：23 留言：0更新日期：2020-09-25 21:06

本发明专利技术提出一种基于深度图像的三维外形恢复和姿态估计方法和装置，采用基于点云的级联深度学习网络，实时高精度地恢复三维外形以及三维关节点坐标。本发明专利技术提出参数化模型层，基于预定义的参数化模型，通过神经网络恢复模型参数恢复三维外形和对应关节点坐标。本发明专利技术提出关节自适应调整子网络，解绑三维外形与关节点之间的内在关系，自适应学习三维外形和不同骨架标注的关节点坐标的关系。同时现有数据集缺乏三维外形标注，因此本发明专利技术提出Chamfer损失提供三维外形的弱监督。经过实际使用验证，本发明专利技术具有自动化程度高、精度高和实时性的优点，可满足专业的或者大众化的应用需求。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度图像的三维外形恢复和姿态估计方法和装置
本专利技术属于计算机视觉、计算机图像处理领域，具体涉及到一种基于深度图像的人手三维外形恢复和姿态估计方法和装置，适用于人体整体或局部(如人手、人脸)、大型动物等对象。
技术介绍
随着计算机视觉和人工智能的发展，人机交互技术从键盘、鼠标向自然人机交互方式过度。在满足人类基本的交互需求之后，自然人机交互方式更加强调交互体验，尽量摆脱交互界面和设备的限制，让人机交互和人类交流一样方便、自然。而人工智能和机器学习的出现以及迅猛发展使之成为可能。目前智能音箱、体感交互设备、智能汽车等“智能”商业产品的出现，意味着自然人机交互在深度学习和人工智能的加持下取得了不错的进展，同时也面领着更大的挑战。因为手势语言的丰富表达能力和相机设备的普及使用，人手姿态估计和外形重建一直是计算机视觉和人机交互领域的热点研究问题，有着广阔的应用场景。人手姿态作为一种新型的人机交互方式，代表性的应用领域包括虚拟现实、机器人、医疗教育等方面。精准的外形重建在虚拟现实的碰撞检测、辅助动画设计等方面有着至关重要的作用。最近，深度学习在基于深度图像的人手姿态估计问题上取得了突破性的进展，基于深度学习的人手姿态估计问题已经得到基本解决，本专利技术提出解决基于深度图像的人手三维重建问题。该问题以单张深度图像作为输入，与三维关节点估计问题只需要恢复稀疏的14-21个关节点的三维坐标问题不同，三维外形恢复问题需要恢复人手表面稠密点云的三维坐标，并得到点云之间的连接关系，保证恢复出的网格模型具有合理的类...

【技术保护点】
1.一种基于深度图像的三维外形恢复和姿态估计方法，其特征在于，包括以下步骤：/n构建级联神经网络，用于同时估计目标对象的三维网格坐标和三维关节点位置；/n利用关节损失、平均形状损失、Chamfer损失对级联神经网络进行训练；/n将待估计的深度图像输入训练完成的级联神经网络，预测目标对象的三维网格和三维关节点坐标。/n

【技术特征摘要】
1.一种基于深度图像的三维外形恢复和姿态估计方法，其特征在于，包括以下步骤：
构建级联神经网络，用于同时估计目标对象的三维网格坐标和三维关节点位置；
利用关节损失、平均形状损失、Chamfer损失对级联神经网络进行训练；
将待估计的深度图像输入训练完成的级联神经网络，预测目标对象的三维网格和三维关节点坐标。

2.根据权利要求1所述方法，其特征在于，在进行网络训练和预测之前，进行数据预处理工作，包括将深度图转化成点云、点云和对应关节标注的归一化。

3.根据权利要求2所述方法，其特征在于，所述数据预处理包括：
给定原始深度图像Di，在去除背景等无关深度区域之后，根据从图像坐标系坐标到相机坐标系坐标的转换公式，计算得到深度图对应的稠密点云；
计算稠密点云的平均中心点坐标COM，将得到的稠密点云减去COM得到归一化点云，对应的关节点标注坐标进行同样归一化处理得到处理后的关节点Ji；
在稠密点云中随机选择p个点得到处理完后的点云

4.根据权利要求1所述方法，其特征在于，所述级联神经网络以归一化稀疏点云为输入，该级联神经网络分为三个阶段：第一阶段和第二阶段网络为形状估计网络，用于恢复待处理对象的三维网格点和标准骨架下的关节点坐标；第三阶段网络为关节调整网络，根据第二阶段恢复的三维网格坐标回归适应不同数据集的关节点标注的关节点坐标。

5.根据权利要求1所述方法，其特征在于，所述形状估计网络的损失函数包括关节损失、平均形状损失和Chamfer损失；对于提供三维网格标注的数据集，损失...

【专利技术属性】
技术研发人员：邓小明，朱玉影，曲文天，马翠霞，王宏安，
申请(专利权)人：中国科学院软件研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人