定位以及训练特征匹配网络的方法和装置制造方法及图纸

技术编号:30652047 阅读:25 留言:0更新日期:2021-11-04 01:13
本公开提供了定位方法和装置以及训练特征匹配网络的方法和装置,涉及图像处理、增强现实和深度学习等人工智能领域。具体实现方案为:获取待定位区域的2D图片和已建好的3D地图。从2D图片中提取出2D关键点位置和2D描述子。从3D地图中提取出3D关键点位置和3D描述子。将2D关键点位置、2D描述子、3D关键点位置和3D描述子输入预先训练的特征匹配网络,得到至少一组2D

【技术实现步骤摘要】
定位以及训练特征匹配网络的方法和装置


[0001]本公开涉及图像处理、增强现实和深度学习等人工智能领域。

技术介绍

[0002]随着手机等便携摄影设备的发展,基于摄像头的低成本视觉定位方法逐渐受到大家的关注。现有技术通常采用基于2D

3D直接匹配的方法进行定位。首先将数据库中的3D点通过词汇树等方法进行聚类,然后建立查询图片中特征点与数据库中3D点的对应关系,最后估算位姿。
[0003]现有技术中每个3D点都有多个2D观测及特征,地图越大,观测越多,特征越多,特征空间被严重压缩,简而言之,地图越大,特征匹配效果越差。

技术实现思路

[0004]本公开提供了一种定位以及训练特征匹配网络的方法和装置、设备、存储介质以及计算机程序产品。
[0005]根据本公开的第一方面,提供了一种定位方法,包括:获取待定位区域的2D图片和已建好的3D地图。从2D图片中提取出2D关键点位置和2D描述子。从3D地图中提取出3D关键点位置和3D描述子。将2D关键点位置、2D描述子、3D关键点位置和3D描述子输入预先训练的特征匹配网络,得到至少一组2D

3D匹配对。根据至少一组2D

3D匹配对求得位姿。
[0006]根据本公开的第二方面,提供了一种训练特征匹配网络的方法,包括:获取图像集合作为样本集,并将位姿信息作为所采集的图像的标注信息。根据图像集合构建3D地图。执行如下训练步骤:从样本集中选取样本。基于样本和3D地图执行第一方面的方法,得到定位结果。基于定位结果和标注信息计算总损失值。若总损失值小于预定阈值,则确定出特征匹配网络训练完成。
[0007]根据本公开的第三方面,提供了一种定位装置,包括:获取单元,被配置成获取待定位区域的2D图片和已建好的3D地图。第一提取单元,被配置成从2D图片中提取出2D关键点位置和2D描述子。第二提取单元,被配置成从3D地图中提取出3D关键点位置和3D描述子。匹配单元,被配置成将2D关键点位置、2D描述子、3D关键点位置和3D描述子输入预先训练的特征匹配网络,得到至少一组2D

3D匹配对。定位单元,被配置成根据至少一组2D

3D匹配对求得位姿。
[0008]根据本公开的第四方面,提供了一种训练特征匹配网络的装置,包括:获取单元,被配置成获取图像集合作为样本集,并将位姿信息作为所采集的图像的标注信息。建图单元,被配置成根据图像集合构建3D地图。训练单元,被配置成执行如下训练步骤:从样本集中选取样本。基于样本和3D地图执行第一方面的方法,得到定位结果。基于定位结果和标注信息计算总损失值。若总损失值小于预定阈值,则确定出特征匹配网络训练完成。
[0009]根据本公开的第五方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器
执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面和第二方面所述的方法。
[0010]根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面和第二方面所述的方法。
[0011]根据本公开的第七方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现第一方面和第二方面所述的方法。
[0012]本公开实施例提供的定位和训练特征匹配网络的方法和装置,在建图时无需保存3D点对应的2D观测及特征。在减小了地图的数据量的同时,提高了特征匹配效果,从而提高了定位的准确度。还可以大大增强建图鲁棒性,提升建图性能,增加建图精度。同时可以利用雷达点云形成网格,供增强现实内容制作者使用。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1是本公开可以应用于其中的示例性系统架构图;
[0016]图2是根据本公开定位方法的一个实施例的流程图;
[0017]图3是根据本公开定位方法的一个应用场景的示意图;
[0018]图4是根据本公开训练特征匹配网络的方法的一个实施例的流程图;
[0019]图5是根据本公开定位装置的一个实施例的结构示意图;
[0020]图6是根据本公开训练特征匹配网络的装置的一个实施例的结构示意图;
[0021]图7是适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
具体实施方式
[0022]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0023]图1示出了可以应用本申请实施例的训练特征匹配网络的方法、训练特征匹配网络的装置、定位方法或定位装置的示例性系统架构100。
[0024]如图1所示,系统架构100可以包括无人车(也称自动驾驶车)101、102,网络103、数据库服务器104和服务器105。网络103用以在无人车101、102,数据库服务器104与服务器105之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0025]无人车101、102中安装有驾驶控制设备以及激光雷达、毫米波雷达等采集点云数据的设备。驾驶控制设备(又称为车载大脑)负责无人车的智能控制。驾驶控制设备可以是单独设置的控制器,例如可编程逻辑控制器(Programmable Logic Controller,PLC)、单片机、工业控制机等;也可以是由其他具有输入/输出端口,并具有运算控制功能的电子器件组成的设备;还可以是安装有车辆驾驶控制类应用的计算机设备。
[0026]需要说明的是,实践中无人车中还可以安装有至少一个传感器,例如,相机、重力传感器、轮速传感器等。某些情况下,无人车中还可以安装有GNSS(Global Navigation Satellite System,全球导航卫星系统)设备和SINS(Strap

down Inertial Navigation System,捷联惯性导航系统)等等。
[0027]数据库服务器104可以是提供各种服务的数据库服务器。例如数据库服务器中可以存储有样本集。样本集中包含有大量的样本。其中,样本可以包括图像(街景)、样本标签。这里的样本可以是在基于视觉的3D地图建立过程中拍摄的,样本标签标识了相机拍摄图像时的位姿。用户也可以通过无人车101、102,从数据库服务器1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种定位方法,包括:获取待定位区域的2D图片和已建好的3D地图;从所述2D图片中提取出2D关键点位置和2D描述子;从所述3D地图中提取出3D关键点位置和3D描述子;将所述2D关键点位置、所述2D描述子、所述3D关键点位置和所述3D描述子输入预先训练的特征匹配网络,得到至少一组2D

3D匹配对;根据至少一组2D

3D匹配对求得位姿。2.根据权利要求1所述的方法,其中,所述将所述2D关键点位置、所述2D描述子、所述3D关键点位置和所述3D描述子输入预先训练的特征匹配网络,包括:将所述2D关键点位置编码后与2D描述子组成2D特征;将所述3D关键点位置编码后与所述3D描述子组成3D特征;将所述2D特征和所述3D特征输入预先训练的特征匹配网络。3.根据权利要求1所述的方法,其中,所述从所述2D图片中提取出2D关键点位置和2D描述子,包括:通过尺度不变特征变换算法从所述2D图片中提取出2D关键点位置和2D描述子。4.根据权利要求1所述的方法,其中,所述从所述3D地图中提取出3D关键点位置和3D描述子,包括:通过尺度不变特征变换算法从所述3D地图中提取出3D关键点位置和3D描述子。5.根据权利要求1

4任一项所述的方法,其中,所述特征匹配网络包括图神经网络和匹配层,所述图神经网络包括自注意力层和交叉注意力层。6.根据权利要求1

4任一项所述的方法,其中,所述根据至少一组2D

3D匹配对求得位姿,包括:通过求解3D到2D点对运动的方法根据至少一组2D

3D匹配对求得位姿。7.一种训练特征匹配网络的方法,包括:获取图像集合作为样本集,并将位姿信息作为所采集的图像的标注信息;根据所述图像集合构建3D地图;执行如下训练步骤:从所述样本集中选取样本;基于所述样本和所述3D地图通过特征匹配网络执行权利要求1

6中任一项所述的定位方法,得到定位结果;基于所述定位结果和标注信息计算总损失值;若总损失值小于预定阈值,则确定出所述特征匹配网络训练完成。8.根据权利要求7所述的方法,其中,所述方法还包括:若总损失值大于等于预定阈值,则调整所述特征匹配网络的相关参数,基于调整后的所述特征匹配网络继续执行上述训练步骤。9.一种定位装置,包括:获取单元,被配置成获取待定位区域的2D图片和已建好的3D地图;第一提取单元,被配置成从所述2D图片中提取出2D关键点位置和2D描述子;第二提取单元,被配置成从所述3D地图中提取出3D关键点位置和3D描述子;匹配单元,被配置成将所述2D关键点位置、所述2D描述子、所述3D关...

【专利技术属性】
技术研发人员:张晋川
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1