反转用于姿态估计的神经辐射场制造技术

技术编号：36737759 阅读：12 留言：0更新日期：2023-03-04 10:10

所提供的是反转训练后的NeRF模型的系统和方法，其中，NeRF模型存储场景或对象的结构，以从以新视角拍摄的图像估计6D姿态。6D姿态估计具有广泛的应用，包括用于机器人操纵的视觉定位和对象姿态估计。定位和对象姿态估计。定位和对象姿态估计。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】反转用于姿态估计的神经辐射场
[0001]相关申请的交叉引用
[0002]本申请要求于2020年11月16日提交的第63/114,399号美国临时专利申请的优先权。上述每个申请通过引用整体并入本文。

[0003]本公开一般涉及用于姿态估计的系统和方法。更具体地，本公开涉及反转用于姿态估计的神经辐射场。

技术介绍

[0004]神经辐射场(Neural Radiance Field，NeRF)通过用神经网络模型捕捉场景或对象的3D几何和外观，来展示其在新视角图像合成(novel view image synthesis)方面的优势。可微神经模型(differentiable neural model)设计使其能够通过用具有已知相机姿态的一组2D图像来训练，使用梯度下降法来优化3D空间中的占位和颜色外观。

技术实现思路

[0005]本公开的实施例的各方面和优点将在以下描述中部分阐述，或者可以从描述中了解，或者可以通过实施例的实践了解。
[0006]本公开的一个示例方面涉及用于确定相机姿态的计算系统。计算系统包括一个或多个处理器和一个或多个非暂时性计算机可读介质，其共同存储：机器学习的神经辐射场模型，其先前被训练为对场景建模；和指令，其在由一个或多个处理器执行时，使计算系统执行操作。该操作包括：获得由相机捕捉的主体图像。该操作包括：对于一个或多个姿态更新迭代中的每一个：获得相机的当前估计姿态；用机器学习的神经辐射场来处理描述当前估计姿态的数据，以从当前估计姿态生成场景的合成图像的一个或...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于确定相机姿态的计算系统，包括：一个或多个处理器；和一个或多个非暂时性计算机可读介质，其共同存储：机器学习的神经辐射场模型，其先前被训练为对场景建模；和指令，其在由一个或多个处理器执行时，使计算系统执行操作，所述操作包括：获得由相机捕捉的主体图像；以及对于一个或多个姿态更新迭代中的每一个：获得相机的当前估计姿态；用机器学习的神经辐射场来处理描述当前估计姿态的数据，以从当前估计姿态生成场景的合成图像的一个或多个合成像素；评估将一个或多个合成像素与包括在由相机捕捉的主体图像中的一个或多个观察像素进行比较的损失函数；以及至少部分基于损失函数的梯度，更新相机的当前估计姿态。2.根据前述权利要求中任一项所述的计算系统，其中，当前估计姿态被表示为六个自由度的指数坐标。3.根据前述权利要求中任一项所述的计算系统，其中，损失函数将一个或多个合成像素的相应强度与包括在由相机捕捉的主体图像中的一个或多个观察像素的相应强度进行比较。4.根据前述权利要求中任一项所述的计算系统，其中，损失函数将一个或多个合成像素的相应色度与包括在由相机捕捉的主体图像中的一个或多个观察像素的相应色度进行比较。5.根据前述权利要求中任一项所述的计算系统，其中，损失函数包括Huber损失函数。6.根据前述权利要求中任一项所述的计算系统，其中，损失函数包括L1或L2损失函数。7.根据前述权利要求中任一项所述的计算系统，其中，相机与基于相机的估计姿态来在场景中导航的自主机器人关联。8.根据前述权利要求中任一项所述的计算系统，其中，用机器学习的神经辐射场来处理描述当前估计姿态的数据以生成一个或多个合成像素包括：确定从多个可能像素中标识一个或多个采样像素的子采样图像平面；确定一个或多个采样像素中的每一个的射线和方向；以及处理描述射线和方向的数据，以生成每个采样像素的合成像素之一。9.根据前述权利要求中任一项所述的计算系统，其中，主体图像描绘场景。10.根据权利要求1至8中任一项所述的计算系统，其中，主体图像描绘不同但类似的场景。11.一种用于确定相机姿态的计算机实现的方法，包括：由包括一个或多个计算设备的计算系统获得由相机捕捉的主体图像；由计算系统访问先前被训练为对场景建模的机器学习的神经辐射场模型；以及对于一个或多个姿态更新迭代中的每一个：由计算系统获得相机的当前估计姿态；由计算系统用机器学习的神经辐射场来处...

【专利技术属性】
技术研发人员：林宗毅，PR弗洛伦斯，YC林，JT巴隆，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人