一种基于类网格细胞空间编码的半隐式神经地图构建方法技术

技术编号:38130938 阅读:9 留言:0更新日期:2023-07-08 09:38
本发明专利技术公开了一种基于类网格细胞空间编码的半隐式神经地图构建方法。该方法使用类网格细胞空间编码,显式地对三维空间进行抽象编码,将编码结果输入神经网络中进行解码,再通过渲染的方式生成新视觉视图。该方法提出的三维空间上的类网格细胞空间编码,可以提高数据之间的关联性,消除神经地图中的冗余信息,实现对环境的压缩感知,实现信息的最大化利用,进而提高地图重建质量。构建半隐式神经地图可以应用于医疗影像、自动驾驶、游戏开发或室内设计等技术领域,自动根据输入的二维图像生成三维场景模型。三维场景模型。三维场景模型。

【技术实现步骤摘要】
一种基于类网格细胞空间编码的半隐式神经地图构建方法


[0001]本专利技术属于图像处理
,涉及三维重建或新视角合成方法,具体涉及一种基于类网格细胞空间编码的半隐式神经地图构建方法。

技术介绍

[0002]三维重建或新视角生成技术是指利用计算机算法和人工智能技术,从已有的图像或视频数据中生成新的视角或角度。这种技术在虚拟现实、增强现实、三维建模等领域具有广泛的应用。传统的三维建模需要大量的时间和人力成本,而新视角生成技术可以通过训练深度学习模型,自动地从已有的二维图像或视频中提取出三维场景,并生成新的视角或角度,从而实现快速的三维建模。在虚拟现实和增强现实中,新视角生成技术可以让用户以不同的角度或视角来观察虚拟场景或增强现实对象,增强用户的沉浸感和体验感。同时,在医学、建筑设计、游戏开发等领域也有着广泛的应用。
[0003]目前,已有的三维重建或新视图合成方法可以分为显式三维重建与隐式三维重建。基于已有的多视角视觉图像信息,显式三维重建方法提取相关特征信息,完成图像之间的数据关联,实现点云、网格等显式模型的构建,进而完成三维场景的重建。隐式三维重建方法则利用神经网络模型存储拟合待重建场景的空间信息,预测不同视角下视觉图像的观测结果,计算预测观测结果与真实测量数据的差异,反向传播优化神经网络模型,实现隐式的三维场景重建。
[0004]隐式神经地图表征已经被证明在表示形状和场景信息方面具有有效性,通常利用多层感知器(MLPs)来编码有符号的距离场(signed distance fields)、占用(occupancy)或体积密度(volume density)。与可微渲染一起,这些方法可以重建对象和场景的几何形状和外观。其中,神经辐射场(NeRF)在合成给定一组姿态输入图像的静态场景新视图方面取得了显著的效果。神经辐射场的关键思想是利用神经网络拟合场景的辐射信息,从而构建一个连续的辐射场,并通过可微体素渲染来获得图像,因此,优化过程可以通过最小化光度损失(photometric loss)来实现。但是隐式神经地图技术仍存在诸多问题:首先,由于网络的信息存储量有限,在学习过程中产生的遗忘现象使得神经辐射场方法难以编码大尺度的场景。同时,神经地图网络结构大,计算复杂度较大,拥有大量待训练参数,需要大量的训练数据。此外,神经地图的训练过程依赖较为准确的相机姿态数据。
[0005]为了进一步提高神经地图的性能,一些方法尝试在空间上构建辅助编码,以此来取代一部分的网络结构与参数,将场景信息隐式存储在显式三维空间结构的编码参数中,即构建半隐式神经地图。结合辅助空间结构的编码,这些方法可以提高神经地图的编码空间范围与编码性能。这一系列研究工作表明,设计半隐式神经地图模型的方法,是提升神经地图表征效率与精度的关键。

技术实现思路

[0006]针对现有技术的不足,本专利技术提出了一种基于类网格细胞空间编码的半隐式神经
地图构建方法。该方法提出了类网格细胞空间编码,通过显式地对三维空间进行抽象编码,提高数据之间的关联性,消除神经地图中的冗余信息,实现对环境的压缩感知,可根据传感器提供的新视角图像,构建高质量的半隐式神经地图,提高神经地图对场景的表达能力。一种基于类网格细胞空间编码的半隐式神经地图构建方法,包括如下步骤:
[0007]步骤1.类网格细胞空间编码模型选择
[0008]从网格细胞的空间编码方式中选择一种或多种的组合作为类网格细胞的空间编码方式,按照选择的编码方式构建多尺度类网格细胞,类网格细胞的面积随尺度增大而增大。
[0009]作为优选,所述网格细胞的空间编码方式包括:
[0010]①
多个网格细胞通过六方密堆积排列(HCP)的纵向周期性交错叠加组合;
[0011]②
多个网格细胞通过面心立方堆积排列(FCC)的纵向周期性交错叠加组合;
[0012]③
两个网格细胞空间中每两层在z方向对齐的六边形模式;
[0013]④
单个网格细胞空间在空间中z方向全部对齐的六边形模式;
[0014]⑤
单个网格细胞空间在空间中z方向随机分布,水平方向呈六边形模式。
[0015]步骤2.采样搜索
[0016]在一个视角下,针对每一个待观测的二维成像坐标,通过光追的方式反向延长传感器光心至成像平面的射线,并在射线上采样三维空间坐标x,再根据坐标x寻找与其相邻的网格细胞,得到坐标x周围的多尺度网格细胞集合。
[0017]步骤3.编码计算
[0018]根据坐标x与单一尺度下各网格细胞相对的空间位置关系,计算插值组合的权重,实现网格细胞编码输出的组合,获得坐标x在单一尺度下的编码结果。随后,将不同尺度下网格细胞的编码结果进行组合,获得网格细胞最终的编码信息。
[0019]步骤4.解码渲染
[0020]神经网络模型将结合步骤2中光追向量作为的视角观测方向信息,对步骤3中网格细胞最终的编码信息进行解码,估计坐标点在三维空间下对应的传感器可观测信息,并通过与传感器类型相关的渲染方法,沿着步骤2中延长的射线,整合射线上的多个采样点信息,输出传感器在该视角下的观测结果。
[0021]作为优选,所述渲染方法包括针对可见光相机的体素渲染方法、针对深度传感器的球形光追搜索渲染。
[0022]步骤5.反向传播训练
[0023]对比步骤4得到的观测结果与传感器原始的测量结果,构建相应的损失函数。由于每一个类网格细胞都拥有可训练的编码参数,在反向传播训练地图模型时,不论是隐式的解码模型还是显示的类网格细胞编码参数都会得到更新。最终,通过不断地训练,使损失函数尽可能地减少,进而完成半隐式神经地图的构建。
[0024]本专利技术具有以下有益效果:
[0025]本方法主要用于对空间分布的信息进行显式编码,通过在三维空间上的类网格细胞空间编码,实现信息的最大化利用,进而提高地图重建质量。本方法使用的类网格细胞空间编码模型是一种特殊的三维空间哈希编码方式。每一个类网格细胞出现在空间中的多个位置,即不同三维坐标的相邻网格细胞集合具有一定的重合性,因此不同采样点将具有相
似的编码信息,这与哈希冲突的情况类似。而哈希冲突可以增加数据之间的关联性,消除哈希表中存在的冗余信息,因此实现了对环境的数据进行压缩。同时,该编码方式呈现一定的周期性,每个类网格细胞在压缩过程中,更关注场景中存在的周期性规律信息,总结场景的信息规律,能够基于已有的三维空间结构经验,在新场景中快速完成对三维结构的认知,可以提高半隐式神经辐射场在具有结构场景中的性能。因此本方法具有重要的科学价值和实用价值。
附图说明
[0026]图1为基于类网格细胞的神经辐射场整体流程图;
[0027]图2为类脑神经编码模式的示意图;
[0028]图3为实施例中构建类脑神经编码的示意图。
具体实施方式
[0029]以下结合附图对本专利技术作进一步的解释说明;
[0030]如图1所示,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于类网格细胞空间编码的半隐式神经地图构建方法,其特征在于:具体包括以下步骤:步骤1.类网格细胞空间编码模型选择从网格细胞的空间编码方式中选择一种或多种的组合作为类网格细胞的空间编码方式,按照选择的编码方式构建多尺度类网格细胞,类网格细胞的面积随尺度增大而增大;步骤2.采样搜索在一个视角下,针对每一个待观测的二维成像坐标,通过光追的方式反向延长传感器光心至成像平面的射线,并在射线上采样三维空间坐标x,再根据坐标x寻找与其相邻的网格细胞,得到坐标x周围的多尺度网格细胞集合;步骤3.编码计算根据坐标x与单一尺度下各网格细胞相对的空间位置关系,计算插值组合的权重,实现网格细胞编码输出的组合,获得坐标x在单一尺度下的编码结果;随后,将不同尺度下网格细胞的编码结果进行组合,获得网格细胞最终的编码信息;步骤4.解码渲染神经网络模型将结合步骤2中光追向量作为的视角观测方向信息,对步骤3中网格细胞最终的编码信息进行解码,估计坐标点在三维空间下对应的传感器可观测信息,并通过与传感器类型相关的渲染方法,沿着步骤2中延长的射线,整合射线上的多个采样点信息,输出传感器在该视角下的观测结果;步骤5.反向传播训练对比步骤4得到的观测结果与传感器原始的测量结果,构建相应的损失函数;通过不断地训练,使损失函数取最小值,进而完成半隐式神经地图的构建。2.如权利要求1所述一种基于类网格细胞空间编码的半隐式神经地图构建方法,其特征在于:所述网格细胞的空间编码方式包括:

多个网格细胞通过六方密堆积排列(HCP)的纵向周期性交错叠加组合;

多个网格细胞通过面心立方堆积排列(FCC)的纵向周期性交错叠加组合;

两个网格细胞空间中每两层在z方向对齐的六边形模式;

单个网格细胞空间在空间中z方向全部对齐的六边形模式;

单个网格细胞空间在空间中z方向随机分布,水平方向呈六边形模式。3.如权利要求1所述一种基于类网格细胞空间编码的半隐式神经地图构建方法,其特征在于:在步骤2中首先让六边形分布的类网格细胞紧密铺满三维空间的xy平面,并将六边形分割为六个全等的正三角形,然后针对采样点的三维空间坐标x,将其x轴、y轴坐标值进行线性变换,z轴坐标值保持不变,使原本呈正三角形分布的类网格细胞变换至由正方形对角线分割得到的直角三角形空间内;随后,对变换后三维空间坐标x的每一维值向上或向下取整,并将取整结果进行排列组合,得到采样点周围正方形的四个顶点坐标;由于每一个正方形由...

【专利技术属性】
技术研发人员:戴玮辰王佳鑫孔万增
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1