【技术实现步骤摘要】
一种基于显式和隐式混合编码的动态场景重建方法
[0001]本专利技术涉及动态场景重建
,更具体的说是涉及一种基于显式和隐式混合编码的动态场景重建方法
。
技术介绍
[0002]使用一组
2D
图像重建和渲染
3D
场景的问题一直是计算机视觉和图形学领域的一个挑战
。
这项任务在虚拟现实
、
互动游戏和电影制作等各种应用中具有重要意义
。
最近,神经辐射场
(NeRF)
通过使用可微分体绘制技术,使静态场景重建任务的性能取得了显著的进步
。NeRF
仅需要将
3D
位置
(X
,
Y
,
Z)
和
2D
观察方向
(
θ
,
φ
)
作为输入,采用单个多层感知器
(MLP)
来拟合静态场景,即可得到
3D
点的颜色和密度,使其能够从多个
2D
图像准确地重建
3D
结构,并从以前未见过的视点生成逼真的图像
。
然而,由于现实世界是动态的,并且在复杂场景中经常涉及运动,因此将
NeRF
重建静态场景的功能扩展到动态场景是亟待解决的问题
。
但是,由于
NeRF
完全依赖于
MLP
这种隐式表示,为了获取采样点的颜色和密度,在每轮迭
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种基于显式和隐式混合编码的动态场景重建方法,其特征在于,具体步骤包括如下:构建动态场景重建模型,包括依次连接的形变网络
、
规范网络和体渲染场;形变网络利用显式体素网格来存储
3D
动态特征,同时采用轻量级
MLP
来解码所述
3D
动态特征,输出位移估计;所述规范网络修正所述形变网络中位移估计的误差,将时间信息编码融入到密度和颜色的估计中;所述体渲染场利用规范网络预测的颜色和密度来计算像素点的颜色值;构建批处理数据,并将批处理数据送入构建好的动态场景重建模型中进行训练,通过渲染得到的图像与真实图像的像素值做损失,利用损失函数值来优化网络参数直到收敛,得到最优动态场景重建模型;输入待测数据到所述最优动态场景重建模型,获得渲染后的图像
。2.
根据权利要求1所述的一种基于显式和隐式混合编码的动态场景重建方法,其特征在于,所述形变网络包括依次设置形变体素网格和形变多层感知器;给定体素网格分辨率每个体素顶点存储的特征向量长度为
N
d
,形变多层感知器
F
d
包括输入层
、
隐藏层和输出层,用于输出估计的位移量
。3.
根据权利要求1所述的一种基于显式和隐式混合编码的动态场景重建方法,其特征在于,所述规范网络包括密度模块和颜色模块;在所述密度模块中依次设置密度体素网格
G
σ
,密度多层感知器
F
σ
,给定体素网格分辨率每个体素顶点存储的特征向量长度为
N
σ
,密度多层感知器
F
σ
包括输入层
、
隐藏层和输出层,用以输出估计的密度
σ
;在所述颜色模块中依次设置颜色体素网格
G
c
,颜色多层感知器
F
c
,给定体素网格分辨率每个体素顶点存储的特征向量长度为
N
c
,颜色多层感知器
F
c
包括输入层
、
隐藏层和输出层,用以输出估计的颜色
RGB。4.
根据权利要求3所述的一种基于显式和隐式混合编码的动态场景重建方法,其特征在于,所述体渲染场,计算每条光线的颜色,设
p(h)
=
o+hd
是从相机光心的中心
o
发射到投影像素的相机射线上的一点,其中射线方向
d
即投影像素点到光心的单位向量,经过密度模块和颜色模块后得到一条光线上
n
个采样点的密度
σ
和颜色
c
,则该光线的估计颜色为其中,
h
n
和
h
f
表示场景体积的边界,
p
′
(h,t)
是通过变形网络从观察空间变换到标规范空间的采样点,是
h
n
到当前采样点
h
的累计透射率
。5.
根据权利要求1所述的一种基于显式和隐式混合编码的动态场景重建方法,其特征在于,构建批处理数据具体步骤如下:每轮从训练集图像中随机选取
N_rays
个像素点,以相机光心为原点
o
,沿着投影像素方向
d
发出一条射线,获得批处理所用的
N_rays
条光线,同时记录每条光线所属相片的时间
N_rays_t
,以光线的近端
near
和远端
far
为区间,在光线上采样
N_sample
个采样点
p(x
,
y
,
z)
,至此获得批处理数据为
(N_rays
,
技术研发人员:阎维青,陈延顺,徐金东,刘兆伟,任金来,
申请(专利权)人:烟台大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。