System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于神经辐射场的视觉伺服实现视觉定位导航方法和系统技术方案_技高网

基于神经辐射场的视觉伺服实现视觉定位导航方法和系统技术方案

技术编号:41135013 阅读:5 留言:0更新日期:2024-04-30 18:06
本发明专利技术提供了一种基于神经辐射场的视觉伺服实现视觉定位导航方法和系统,包括:获取导航初始状态对应的初始状态图像和目标状态对应的目标状态图像;基于初始状态图像和目标状态图像,得到目标状态图像有效的关键点对应,将目标状态图像有效的关键点对应作为导航先验;基于所述导航先验,通过IBVS导航进行视觉导航,由于本发明专利技术在处理初始状态图像和目标状态图像得到导航先验的过程中使用到了视觉定位,因此本发明专利技术将视觉定位扩展到视觉导航,可以有效的增强基于IBVS的视觉导航任务。

【技术实现步骤摘要】

本专利技术属于视觉定位和视觉导航,具体涉及一种基于神经辐射场的视觉伺服实现视觉定位导航方法和系统


技术介绍

1、基于单张查询图像估计相机位姿是视觉定位中基本的任务,它在机器人、虚拟现实和自动驾驶等领域具有广泛的应用。近年来,基于深度学习的视觉定位方法受到了广泛的关注,它们使用深度神经网络有效地从查询图像中提取视觉特征,然后利用这些特征估计查询图像的位姿。

2、当前主流的视觉定位方法一般可以分为两类。第一类是基于结构的方法,例如一种基于密集匹配和视角合成的视觉定位方法(见文献taira h,okutomi m,sattler t,etal.inloc:indoor visual localization with dense matching and view synthesis[c]//proceedings of the ieee conference on computer vision and patternrecognition.2018:7199-7209.)和分层定位网络(见文献sarlin p e,cadena c,siegwartr,et al.from coarse to fine:robust hierarchical localization at large scale[c]//proceedings ofthe ieee/cvf conference on computer vision and patternrecognition.2019:12716-12725.),它们使用复杂的流程实现精确的定位。结构方法首先建立场景3d坐标与2d像素之间的对应关系,之后使用透视变换与非线性优化算法结合随机一致性采样算法计算相机的位姿。结构方法的第一阶段一般需要一个复杂的流程,包括图像检索、特征提取和匹配。第二类是基于回归的方法,它们具有更简洁紧凑的框架和快速推理的性能,近些年吸引了越来越多的关注。它们要么直接回归查询图像对应的场景3d坐标,要么直接回归查询图像对应的绝对位姿。基于坐标回归的视觉定位方法,例如基于三维曲面回归的视觉定位方法(见文献brachmann e,rother c.learning less is more-6dcamera localization via 3d surface regression[c]//proceedings of the ieeeconference on computer vision andpattern recognition.2018:4654-4662.)和基于场景分层坐标分类和回归的视觉定位方法(见文献li x,wang s,zhao y,etal.hierarchical scene coordinate classification and regression for visuallocalization[c]//proceedings ofthe ieee/cvf conference on computer vision andpattern recognition.2020:11983-11992.)使用神经网络学习结构方法的第一阶段,直接从查询图像中回归3d场景坐标,之后得到3d坐标与2d像素之间的对应关系,这些基于坐标回归的视觉定位方法通常使用真值3d标签作为监督来获得更好的定位性能,增加了训练集获取的成本。与坐标回归方法不同,绝对位姿回归方法通常仅使用带有位姿的图像来训练神经网络,不需要真值3d标签进行监督训练,但由于缺少3d几何的约束,其定位性能往往低于坐标回归方法。

3、当前的视觉定位方法一般需要大量数据进行训练(在7-scenes数据集中每个场景使用数千张带有位姿的图像作为训练集),以保证其具有泛化到新视角的定位能力。此外,最先进的定位方法还需要密集真实的3d标签进行监督,例如深度和3d模型。然而,在现实世界中获取大量带有位姿的图像和真值3d标签是具有挑战的和高成本的。

4、目前的视觉定位方法往往只聚焦于视觉定位任务,与之密切相关的视觉导航任务采用另一种框架完成,从而增加了机器人在此方面相关应用的复杂性。


技术实现思路

1、为了解决现有技术中视觉定位任务和视觉导航任务采用不同的框架,从而增加了相关应用复杂性的问题,本专利技术提出了一种基于神经辐射场的视觉伺服实现视觉定位导航方法,包括:

2、获取导航初始状态对应的初始状态图像和目标状态对应的目标状态图像;

3、基于初始状态图像和目标状态图像,得到目标状态图像有效的关键点对应,将目标状态图像有效的关键点对应作为导航先验;

4、基于所述导航先验,通过ibvs导航进行视觉导航。

5、可选的,所述基于初始状态图像和目标状态图像,得到目标状态图像有效的关键点对应,包括:

6、基于初始状态图像和目标状态图像,通过关键点对应检测和匹配算法得到目标状态图像的关键点对应;

7、将目标状态图像的关键点对应进行过滤,得到目标状态图像有效的关键点对应。

8、可选的,所述基于初始状态图像和目标状态图像,通过关键点对应检测和匹配算法得到目标状态图像的关键点对应,包括:

9、基于初始状态图像,使用视觉定位方法得到导航的初始位姿,并将导航的初始位姿作为导航的目标粗位姿;

10、基于初始状态图像和目标状态图像,使用关键点对应检测和匹配算法得到目标状态图像的关键点对应。

11、可选的,所述基于初始状态图像,使用视觉定位方法得到导航的初始位姿,包括:

12、基于初始状态图像,使用预先训练完成的坐标回归网络得到初始状态图像对应的3d坐标,并基于初始状态图像对应的3d坐标,得到初始状态图像对应的粗位姿;

13、基于初始状态图像对应的粗位姿,通过预先训练完成的神经辐射场模型渲染得到初始状态图像的渲染图像;

14、基于初始状态图像和其渲染图像,通过关键点对应检测和匹配算法得到初始状态图像的关键点对应并将初始状态图像的关键点对应进行过滤;

15、对初始状态图像对应的粗位姿和过滤后的关键点进行优化,得到导航的初始位姿;

16、所述坐标回归网络,以图像为输入,图像对应的3d坐标为输出进行训练;所述神经辐射场模型,训练的时候以位姿为输入,位姿对应的图像为输出,使用的时候以位姿为输入,位姿对应图像的渲染图像为输出。

17、可选的,所述将初始状态图像的关键点对应进行过滤,包括:

18、基于初始状态图像的3d坐标,得到关键点对应的3d坐标;

19、基于初始状态图像的粗位姿,将关键点对应的3d坐标投影到初始状态图像的渲染图像得到投影图像关键点坐标,基于初始状态图像的渲染图像,得到渲染图像关键点坐标;

20、基于所述投影图像关键点坐标和所述渲染图像关键点坐标,计算关键点对应的坐标距离;

21、基于关键点对应的坐标距离,结合阈值对关键点对应进行过滤。

...

【技术保护点】

1.一种基于神经辐射场的视觉伺服实现视觉定位导航方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述基于初始状态图像和目标状态图像,得到目标状态图像有效的关键点对应,包括:

3.如权利要求2所述的方法,其特征在于,所述基于初始状态图像和目标状态图像,通过关键点对应检测和匹配算法得到目标状态图像的关键点对应,包括:

4.如权利要求3所述的方法,其特征在于,所述基于初始状态图像,使用视觉定位方法得到导航的初始位姿,包括:

5.如权利要求4所述的方法,其特征在于,所述将初始状态图像的关键点对应进行过滤,包括:

6.如权利要求4所述的方法,其特征在于,所述神经辐射场模型的训练,包括:

7.如权利要求6所述的方法,其特征在于,所述坐标回归网络的训练,包括:

8.一种基于神经辐射场的视觉伺服实现视觉定位导航系统,其特征在于,包括:

9.一种计算机设备,其特征在于,包括:一个或多个处理器;

10.一种计算机可读存储介质,其特征在于,其上存有计算机程序,所述计算机程序被执行时,实现如权利要求1至7中任一项所述的一种基于神经辐射场的视觉伺服实现视觉定位导航方法。

...

【技术特征摘要】

1.一种基于神经辐射场的视觉伺服实现视觉定位导航方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述基于初始状态图像和目标状态图像,得到目标状态图像有效的关键点对应,包括:

3.如权利要求2所述的方法,其特征在于,所述基于初始状态图像和目标状态图像,通过关键点对应检测和匹配算法得到目标状态图像的关键点对应,包括:

4.如权利要求3所述的方法,其特征在于,所述基于初始状态图像,使用视觉定位方法得到导航的初始位姿,包括:

5.如权利要求4所述的方法,其特征在于,所述将初始状态...

【专利技术属性】
技术研发人员:史殿习王元泽晏轶超黄怡兰夏坚强谭杰夫金松昌
申请(专利权)人:中国人民解放军三二八零六部队
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1