实时三维场景重建方法及装置制造方法及图纸

技术编号：34885110 阅读：35 留言：0更新日期：2022-09-10 13:42

本申请公开了一种实时三维场景重建方法及装置，其中，方法包括：获取单目相机的相机内参；提取单目相机的目标图片的实际相机位姿和由稀疏深度先验得到的稀疏深度点；以及利用预设三维场景重建网络，基于由相机内参、实际相机位姿和稀疏深度点得到的融合时空信息生成三维场景重建结果。由此，解决了相关技术中忽视粗略稀疏特征点的深度估计数据，对空间信息的利用不完善，导致三维重建结果连续性、准确性较差，且实用性较差的技术问题。且实用性较差的技术问题。且实用性较差的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
实时三维场景重建方法及装置

[0001]本申请涉及图像处理
，特别涉及一种实时三维场景重建方法及装置。

技术介绍

[0002]三维场景重建技术是计算机视觉的核心问题，在许多应用场景如AR/VR，机器人运动规划，机器人场景理解中，精细、稠密地重建智能体所在的三维场景是不可或缺的。如今，稠密地重建三维场景可以利用多种传感器输入，包括激光雷达、深度相机等提供深度信息的设备，但这些设备具有成本过高、较为笨重的缺点，应用场景十分受限，而仅仅使用单目相机拍摄的视频进行三维场景重建拥有成本低、应用方便的优势，所以成为了目前的研究热点。
[0003]然而相关技术中，利用单目相机重建三维场景，输入的为已知的场景全部的扫描序列，并不是增量式的未知输入，实用性较差，且在三维特征体素表示的构建方面，使用对二维图像特征进行反投影后平均池化的方法，忽视了图像特征间的时域联系，同时，还忽易视粗略稀疏特征点的深度估计数据，对空间信息的利用不完善，亟需改善。

技术实现思路

[0004]本申请是基于专利技术人对以下问题的认知和发现作出的：
[0005]利用单目相机得到的多角度图像直接进行稠密三维重建目前面临很大的问题，如有限的计算资源、重建场景的连续性不好、噪音太多等等。目前，直接利用深度神经网络进行端到端重建方法能够部分解决重建质量问题，但已有的方法忽视了多角度图像的时域联系，以及可以提取出的空间信息。
[0006]现有的利用单目相机重建三维场景的技术主要分为：(1)传统VSLAM(Visual Simu...

【技术保护点】

【技术特征摘要】
1.一种实时三维场景重建方法，其特征在于，包括以下步骤：获取单目相机的相机内参；提取所述单目相机的目标图片的实际相机位姿和由稀疏深度先验得到的稀疏深度点；以及利用预设三维场景重建网络，基于由所述相机内参、所述实际相机位姿和所述稀疏深度点得到的融合时空信息生成三维场景重建结果。2.根据权利要求1所述的方法，其特征在于，所述利用预设三维场景重建网络，基于由所述相机内参、所述实际相机位姿和所述稀疏深度点得到的融合时空信息生成三维场景重建结果，包括：分别提取所述实际相机位姿和所述稀疏深度点的二维特征，并分别反投影为对应的初始局部三维特征体素；从所述稀疏深度点提取空间信息，并融合所述空间信息和帧间时序特征联系，得到局部融合三维特征体素；将所述局部融合三维特征体素融合至全局，得到最终的全局融合三维特征体素；基于所述最终的全局融合三维特征体素利用预设MLP网络得到所述三维场景重建结果。3.根据权利要求2所述的方法，其特征在于，分别提取所述实际相机位姿和所述稀疏深度点的二维特征之前，还包括：计算所述稀疏深度点的归一化置信度；将所述稀疏深度点和所述归一化置信度投影成对应的稀疏深度图及置信度；由所述稀疏深度图及置信度得到所述稀疏深度先验。4.根据权利要求2或3所述的方法，其特征在于，所述局部融合三维特征体素为：其中，为片段特征体素，F代表本申请实施例为将片段特征体素进行融合的过程，为得到的局部融合三维特征体素。5.根据权利要求2所述的方法，其特征在于，所述基于所述最终全局融合三维特征体素利用预设MLP网络得到所述三维场景重建结果，包括：基于所述最终全局融合三维特征体素，利用所述预设MLP网络中级联的两个MLP层得到估计的占用度栅格和场景TSDF体素；根据所述占用度栅格和场...

【专利技术属性】
技术研发人员：季向阳，张晨阳光，娄志强，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人