【技术实现步骤摘要】
本申请涉及语义重建,特别是涉及一种基于隐式神经表征的单目语义重建方法。
技术介绍
1、对现实世界环境进行三维语义重建是机器人迈向自动化、智能化的通用空间人工智能必须要完成的关键任务之一,该技术已在多个领域有着广泛的应用,例如自动驾驶,vr/ar,具身智能等。仅包含一个光学摄像头的单目相机,由于成本低、体积小、易获取,在人们生活中随处可见(例如手机,单反相机,无人机,工业机器人等)。如何通过单目光学相机扫描环境,重建场景的三维语义地图,一直是学术界和工业界致力于攻克的技术难题。
2、现有的单目语义重建方法通常采用两种方式。第一种为语义融合方法,以单目图像序列作为输入,该类方法首先借助现有的sfm/slam系统进行几何重建,然后利用预训练的卷积神经网络对二维图像序列进行语义分割,最后利用已恢复的几何信息将2d语义反投影到三维空间当中,建立场景的三维语义地图。该类方法通常会面临低精度的语义质量问题和内存开销问题:1. 当几何重建出现错误时,语义信息的反投影也会随之出错,这会大大降低三维语义地图的质量;2. 神经网络预测的语义会发生
...【技术保护点】
1.一种基于隐式神经表征的单目语义重建方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,对所述单目图像序列进行基于隐式神经场景表征,将场景的纹理、几何、语义信息分别建模为连续的三维函数并使用神经网络学习特定的场景表征函数,包括:
3.根据权利要求1所述的方法,其特征在于,根据所述场景表征函数和图形学中的体积渲染原理,得到任意视角下的光线颜色、法向量和语义信息,包括:
4.根据权利要求1所述的方法,其特征在于,利用所述任意视角下的法向量设计几何损失函数,包括:
5.根据权利要求1所述的方法,其特征
...【技术特征摘要】
1.一种基于隐式神经表征的单目语义重建方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,对所述单目图像序列进行基于隐式神经场景表征,将场景的纹理、几何、语义信息分别建模为连续的三维函数并使用神经网络学习特定的场景表征函数,包括:
3.根据权利要求1所述的方法,其特征在于,根据所述场景表征函数和图形学中的体积渲染原理,得到任意视角下的光线颜色、法向量和语义信息,包括:
4.根据权利要求1所述的方法,其特征在于,利用所述任意视角下的法向量设计几何损失函数,包括...
【专利技术属性】
技术研发人员:智帅峰,杜振华,张浩宇,夏靖远,霍凯,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。