基于傅立叶网格的三维神经渲染方法和装置制造方法及图纸

技术编号：39568742 阅读：7 留言：0更新日期：2023-12-03 19:19

本发明专利技术提供一种基于傅立叶网格的三维神经渲染方法和装置，该方法包括：

全部详细技术资料下载

【技术实现步骤摘要】
基于傅立叶网格的三维神经渲染方法和装置

[0001]本专利技术涉及新视角合成
，尤其涉及一种基于傅立叶网格的三维神经渲染方法和装置
。

技术介绍

[0002]视角合成是指利用现有图像或场景信息生成在原始观察点之外的新视角的技术
。
该领域在计算机视觉和计算机图形学中具有重要意义，并涉及到模型建立
、
图像处理
、
信号处理等相关技术
。
[0003]神经辐射场
(Neural Radiance Fields
，
NeRF)
：
NeRF
是一种通过多层感知器
(MLP)
来表示颜色和密度，并通过可微分的体积渲染来学习隐式的三维表示
。NeRF
已经成为新视角合成的主要方法，并在多个领域得到广泛应用
。
之前的工作还针对
NeRF
的效率做出了一些改进，例如使用高级缓存技术的
FastNeRF
和
Instant
‑
NGP
，以及将高容量
MLP
分解为多个小型
MLP
的
KiloNeRF。
[0004]无界场景重建：该领域主要关注学习无界或大规模辐射场的重建
。
由于
NeRF
在渲染新视角方面取得了显著的成功，近期的研究着眼于学习无界或大规模辐射场
。
例如，
NeRF++<...

【技术保护点】

【技术特征摘要】
1.
一种基于傅立叶网格的三维神经渲染方法，其特征在于，包括如下步骤：
S1
：采集图像，通过摄影设备采集场景的多个视角图像；
S2
：相机定位装置回归相机姿态，使用相机定位装置来确定每个图像的相机姿态信息；
S3
：求解神经渲染场，通过网格操作符
FourierGrid
建模无界辐射场，其中，
FourierGrid
利用傅里叶特征映射将输入信号扩展为多个频率分量，并使用网格来建模不同频率的组成部分；
S4
：获取输入视角，利用获取的相机姿态信息，将相机位置和方向转化为对应的输入视角；
S5
：根据输入视角采样，渲染新视角的图片
。2.
根据权利要求1所述的方法，其特征在于，对于输入信号的第
$i$
个频率成分，傅里叶特征映射
$\gamma(\bx,i)\in\mathbb{R}^{3}$
的计算如下：如果
$i$
除以2的余数为0，则
$\gamma(\bx,i)
＝
\sin(2^{\lfloor i/2\rfloor}\pi\bx)$
；否则，
$\gamma(\bx,i)
＝
\cos(2^{\lfloor i/2\rfloor}\pi\bx)$。3.
根据权利要求2所述的方法，其特征在于，通过相应的可学习网格张量
$\mathbf{V}^{(i)}$
对每个频率成分进行建模
。4.
根据权利要求3所述的方法，其特征在于，通过相应的可学习网格张量
$\mathbf{V}^{(i)}$
对每个频率成分进行建模具体包括：对于第
$i$
个频率成分，通过插值操作符
$\texttt{Interpolate}$
将特征映射应用到网格上，得到表示该频率成分的特征向量
$\boldsymbol{h_i}$
：
$\boldsymbol{h_i}
＝
\texttt{Interpolate}(\gamma(\bx,i),\mathbf{V}^{(i)})$
，其中
$0\leq i\leq 2l
‑
1$
，
$l$
是控制采用的傅里叶特征数量的超参数；最后，
FourierGrid
通过汇总函数
$\Phi$
输出汇总的信号，得到最终的特征向量
$\bu$
：
$\bu
＝
\texttt{FourierGrid}(\bx)
＝
\Phi({\boldsymbol{h_0},\boldsymbol{h_1},...,\boldsymbol{h_{2l
‑
1}}})$
；在汇总函数中，采用平均值作为最佳的汇总方式：
$\Phi({\boldsymbol{h_0},\boldsymbol{h_1},...,\boldsymbol{h_{n
‑
1}}})
＝
\frac{1}{n}\sum_{i
＝
0}^{n
‑
1}{\boldsymbol{h_i}}$。5.
根据权利要求4所述的方法，其特征在于，在步骤
S5
中，通过对
FourierGrid
中的网格进行插值操作，从已有视角图像中...

【专利技术属性】
技术研发人员：何弢，严骏驰，廖文龙，赵泽林，
申请(专利权)人：上海酷移机器人有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人