基于神经辐射表征的大规模三维场景语义和建筑分割方法技术

技术编号:40708343 阅读:18 留言:0更新日期:2024-03-22 11:09
本发明专利技术公开了一种基于神经辐射表征的大规模三维场景语义和建筑分割方法,包括以下步骤:基于神经辐射场的几何重建场景;融合尺度自适应语义标签,优化原始图像的语义分割结果;分割建筑级实例,创建跨视图引导图。本发明专利技术基于神经辐射场技术,提出了尺度自适应语义标签融合方法,有效解决二维语义标签不准确的问题,并将其引入到三维场景表示中,实现一致、准确的城市场景语义理解;本发明专利技术的跨视图实例标签聚合方法,解决了多视角实例标签不一致的问题,能够实现精确的建筑级实例分割;相比于现有的三维点云场景分割技术,本发明专利技术的方法不需要繁重的人工标注,提高了效率。

【技术实现步骤摘要】

本专利技术属于人工智能中的图像处理,特别是涉及一种基于神经辐射表征的大规模三维场景语义和建筑分割方法


技术介绍

1、近年来,城市规划和自动驾驶等应用中,对城市场景语义理解的需求日益增加。然而,现有的方法在处理多视角航拍图像时存在一些挑战。传统的3d城市场景语义理解方法主要依赖于点云表示。这些方法通常在带有人工标注的3d数据集上进行训练,但标注3d数据是一项耗时的工作,难以创建具有多样性场景的训练数据集。此外,点云往往难以捕捉场景的结构细节,限制了其在城市尺度语义理解任务中的适用性。

2、在多视角航拍图像中,问题变得更加复杂。首先,这类图像涵盖了各种物体,包括建筑物、车辆和道路。对于语义理解,现有的二维语义分割方法往往难以有效处理这些物体的尺寸差异,原因是:它们的训练数据分布与真实航拍图像的分布不同,或者缺乏用于fine-tuned的大规模人工标注的航拍图像。对于建筑实例分割,现有的二维分割方法生成的二维实例标签在多视图下常常存在不一致问题,即在一个视图中分割的对象在另一个视图中可能被分割为多个独立的实例。在航拍图像的背景下,由于每张图像只捕捉本文档来自技高网...

【技术保护点】

1.基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,基于神经辐射场的几何重建场景,具体包括:

3.根据权利要求1所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,在几何重建场景中,像素颜色通过沿其视觉射线r采样的点的颜色在体积渲染中的积分计算得到:

4.根据权利要求3所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,NeRF渲染的颜色与采样射线集合R中捕获的颜色C之间的重建误差最小化,损失函数如...

【技术特征摘要】

1.基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,基于神经辐射场的几何重建场景,具体包括:

3.根据权利要求1所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,在几何重建场景中,像素颜色通过沿其视觉射线r采样的点的颜色在体积渲染中的积分计算得到:

4.根据权利要求3所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,nerf渲染的颜色与采样射线集合r中捕获的颜色c之间的重建误差最小化,损失函数如下:

5.根据权利要求4所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,为每个视图重建深度图,并在损失函数中引入深度正则化项以优化nerf的几何结构。

6.根据权利要求1所述的基于神经辐射表征的大规模三维场景语义和建筑分割方法,其特征在于,融合尺度自适应语义标签是利用神经辐射场进行新视图合成,模拟虚拟相机,从高空拍摄图像,具体地,对于每个原始图像,增加其相机高度以进行新视图渲染,生成一组远景图像{if},然...

【专利技术属性】
技术研发人员:陈冠英张煜奇崔曙光
申请(专利权)人:香港中文大学深圳未来智联网络研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1