一种基于RGB图像的三维重建方法技术

技术编号：31236042 阅读：16 留言：0更新日期：2021-12-08 10:18

本发明专利技术公开了一种手部三维建模的方法，具体包括手部检测；特征生成；手部三维重建三个步骤。该方法通过RGB图像实现手部三维重建，不需要使用手部的多视图图像，并利用深度学习技术实现从二维图像到三维手部模型的映射，替代了传统的几何方法和复杂的专业软件构建手部，通过深度学习的方法来提取特征，而不是利用几何线条去构建，采用目前公开的数据和一些合成的数据来进行训练，利用深度学习实现三维重建能达到建模快，精度高。精度高。精度高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于RGB图像的三维重建方法

[0001]本专利技术涉及计算机视觉和计算机仿真领域，具体是指基于RGB图像的手部三维重建方法。

技术介绍

[0002]随着虚拟现实、增强现实等三维技术的出现，人机交互的应用场景的要求在不断变化，它要求场景更加生动、人物角色也更加逼真，一切朝着复杂、逼真和高精度的要求在发展。与此同时，听觉交互和视觉交互等人机交互的方式已经不能够满足业界的需求。手是人类与环境互动的最自然的方式之一，这使得手在三维场景的人机交互中也起到同样重要的作用，而手部三维重建是实现手在三维场景下的人机交互这一应用下的基础。手部三维重建是指利用获取的手部空间信息，还原出手在三维场景下的三维模型。手部三维重建的目的是通过获取到的数据，恢复在三维场景下手的形状、姿态和精细的表面，以此来完成手的重建。
[0003]随着深度摄像机的出现，基于RGB
‑
D图像的手部三维重建相继发展，但因为设备的价格昂贵，深度图像数据难以获得。由于RGB相机比深度摄像机应用广泛，RGB图像数据容易获得，所以采用RGB图像进行手部三维重建更方便。目前的人机交互的方式在一些领域已经取得了研究成果，比如语音识别、人脸识别、指纹识别、人体姿态识别等，这些人机交互的方式已经发展的比较成熟了。面部表情和言语在交流中起着重要的作用，重要的非言语信息也通过身体动作进行交流，特别是手和手指的动作，以强调我们的言语，阐明我们的思想，传达情感。手作为非语言的交流方式，手在人机交互中也起到了不可或缺的作用。当人们在无法用言语表达的情况下，通...

【技术保护点】

【技术特征摘要】
1.基于RGB图像的手部三维重建方法，其特征在于，具体包括下列步骤：(1)数据集选择的探索研究：本发明选择的是利用RGB图像实现手部三维重建，通过对RGB图像进行训练，以便更好的获取手部特征，数据集是真实的数据集，还会有一些合成的数据集，以便达到精确的训练结果；(2)手部检测：输入RGB图像，利用深度学习的手部检测算法去检测出图片中手部的位置，还会进行检测出单手、双手的操作，同时进行左右手的区分；(3)特征生成：在完成手部检测的步骤时，本发明利用2.5D
‑
Net神经网络生成2.5D热图，并提取低级特征，让二维关键点检测更加准确，以便生成更加精确的二维手部姿态估计，其次，把提取的低级特征放入到ResNet
‑
50网络里来产生高级特征；(4)手部三维重建：本发明利用图卷积神经网络实现手部三维重建，将生成的高级特征放入图卷积神经网络，在图卷积神经网络里估...

【专利技术属性】
技术研发人员：王海玲，张菁，张天驰，
申请(专利权)人：济南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人