高分辨率神经渲染制造技术

技术编号：39312143 阅读：7 留言：0更新日期：2023-11-12 15:57

提供了用于训练机器学习模型，以基于位置数据以及基于方向数据的与特定视图方向相关联的加权方案来生成密度值和辐射分量，从而计算沿着多个相机光线的每个点的最终

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】高分辨率神经渲染

技术介绍

[0001]存在许多正在研究的用于渲染包括不同材料和具有复杂几何形状的对象的三维(3D)场景的连续3D视点的方法。此类研究的目标是能够从有限数量的(二维)2D训练图像中渲染场景的新颖视角。此类静态场景能够由连续的5D或6D函数表示，该函数将位置和方向作为输入并输出在该位置处在该方向上的辐射率。替代地，此类函数的余域是空间中每个方向和点的辐射率。一些研究涉及将对象和场景编码到如多层感知器(MLP)的神经网络中。
[0002]神经辐射场(NeRF)是最近发现的一种方法，其训练神经网络以基于该场景的多个图像来捕获该场景。一旦网络经过训练，它就可以用于从任何视点以及利用任何相机参数生成场景的图像。然而，虽然NeRF方法能够准确地渲染场景的精细细节，但渲染新颖视点的过程非常缓慢，并且在计算上非常昂贵。NeRF低效率的主要原因是对于渲染的每个像素都必须调用神经网络多达200次。对于1MPix图像，这会导致对神经网络进行2亿次调用来渲染单个图像。因此，为了渲染单个图像，计算系统需要延长的时间段来处理数据才能获得这些详细的结果。
[0003]鉴于前述，存在对用于生成训练数据和训练模型的改进的系统和方法的持续需要，其包括部署这样的模型，以用于改进的图像渲染。
[0004]本文要求保护的主题不限于解决任何缺点或仅在诸如上述那些环境中操作的实施例。相反，该背景仅被提供来说明可以实践本文描述的一些实施例的一个示例性

技术实现思路

[0005]所公开的实施例涉及用于训练机器学习模型以生成静态...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由计算系统实现的用于训练机器学习模型以生成静态场景的颜色输出的方法，所述方法包括：识别三维静态场景；获取包括所述三维静态场景的多个视点的一组训练图像；识别对应于所述一组训练图像的多个相机光线；对沿所述多个相机光线的一组点进行采样以获得在所述一组点中包括的每个点的位置数据和方向数据；根据获得的每个点的位置数据训练第一神经网络；利用所述第一神经网络处理所述位置数据以生成密度值和多个辐射分量；将所述多个辐射分量存储为缓存的辐射分量；根据所述方向数据训练第二神经网络；利用所述第二神经网络处理所述方向数据以生成针对多个视图方向的加权方案，所述加权方案包括要应用于所述多个辐射分量的多个权重值；将针对所述多个视图方向中包括的每个视图方向的加权方案存储为缓存的加权方案数据；以及通过根据与特定视图方向相关联的缓存的加权方案数据来组合所述缓存的辐射分量，以生成最终颜色值。2.根据权利要求1所述的方法，还包括：基于在缓存的数据库中包括的密度值和最终颜色值，沿着在所述多个相机光线中包括的相机光线对在点的子集中包括的每个点执行体积渲染；以及将沿所述相机光线的所述点的子集折叠为渲染的像素，以包括在所述静态场景的二维图像中。3.根据权利要求2所述的方法，还包括：将所述渲染的像素与在所述一组训练图像中包括的训练图像中的对应像素进行比较；以及最小化所述渲染的像素与所述训练图像中的对应像素之间的误差。4.根据权利要求1所述的方法，还包括：通过基于沿相机光线采样的多个点的体积密度计算符号
‑
距离函数，从所述三维静态场景的体积表示导出碰撞网格；识别在所述多个点中包括的与由所述碰撞网格计算的第一命中相对应的第一点；以及通过整合在所述多个点中包括的点的子集来执行体积渲染，所述点的子集对应于在所述第一命中之后由所述碰撞网格识别的非空空间。5.根据权利要求1所述的方法，还包括：在通过基于沿相机光线采样的多个点的体积密...

【专利技术属性】
技术研发人员：S，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人