【技术实现步骤摘要】
本专利技术属于人工智能中的图像处理,特别是涉及一种基于神经辐射表征的大规模三维场景语义和建筑分割方法。
技术介绍
1、近年来,城市规划和自动驾驶等应用中,对城市场景语义理解的需求日益增加。然而,现有的方法在处理多视角航拍图像时存在一些挑战。传统的3d城市场景语义理解方法主要依赖于点云表示。这些方法通常在带有人工标注的3d数据集上进行训练,但标注3d数据是一项耗时的工作,难以创建具有多样性场景的训练数据集。此外,点云往往难以捕捉场景的结构细节,限制了其在城市尺度语义理解任务中的适用性。
2、在多视角航拍图像中,问题变得更加复杂。首先,这类图像涵盖了各种物体,包括建筑物、车辆和道路。对于语义理解,现有的二维语义分割方法往往难以有效处理这些物体的尺寸差异,原因是:它们的训练数据分布与真实航拍图像的分布不同,或者缺乏用于fine-tuned的大规模人工标注的航拍图像。对于建筑实例分割,现有的二维分割方法生成的二维实例标签在多视图下常常存在不一致问题,即在一个视图中分割的对象在另一个视图中可能被分割为多个独立的实例。在航拍图像的背景下
...【技术保护点】
1.基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,基于神经辐射场的几何重建场景,具体包括:
3.根据权利要求1所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,在几何重建场景中,像素颜色通过沿其视觉射线r采样的点的颜色在体积渲染中的积分计算得到:
4.根据权利要求3所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,NeRF渲染的颜色与采样射线集合R中捕获的颜色C之间的重建误
...【技术特征摘要】
1.基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,基于神经辐射场的几何重建场景,具体包括:
3.根据权利要求1所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,在几何重建场景中,像素颜色通过沿其视觉射线r采样的点的颜色在体积渲染中的积分计算得到:
4.根据权利要求3所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,nerf渲染的颜色与采样射线集合r中捕获的颜色c之间的重建误差最小化,损失函数如下:
5.根据权利要求4所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,为每个视图重建深度图,并在损失函数中引入深度正则化项以优化nerf的几何结构。
6.根据权利要求1所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,融合尺度自适应语义标签是利用神经辐射场进行新视图合成,模拟虚拟相机,从高空拍摄图像,具体地,对于每个原始图像,增加其相机高度以进行新视图渲染,生成一组远景图像{if},然...
【专利技术属性】
技术研发人员:陈冠英,张煜奇,崔曙光,
申请(专利权)人:香港中文大学深圳未来智联网络研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。