一种基于视觉图像的定位方法技术

技术编号:30023061 阅读:23 留言:0更新日期:2021-09-11 06:47
本发明专利技术公开了一种基于视觉图像的定位方法,通过将原始图像数据中每两个帧图像之间进行几何运动特征提取得到特征表达集,将所述特征表达集中非相邻帧图像之间的非相邻特征表达作为指导图集,然后通过该指导图集对特征表达集中相邻帧图像之间的相邻特征表达进行约束修正得到修正相邻特征表达,以及通过序列学习单元对修正相邻特征表达进行序列学习然后得到序列相邻特征表达,最后通过预设网络将该序列相邻特征表达进行降维拟合确定出帧间位姿,从而完成待定位物体的定位,实现了在进行视觉定位中在不同场景下以及在与训练集差异较大的情况下仍能进行准确的视觉定位。较大的情况下仍能进行准确的视觉定位。较大的情况下仍能进行准确的视觉定位。

【技术实现步骤摘要】
一种基于视觉图像的定位方法


[0001]本专利技术属于定位
,具体涉及一种基于视觉图像的定位方法。

技术介绍

[0002]自主定位技术作为执行建图、导航等服务的基础,已经成为目前的研究热点,完全自主的高精度定位系统在赋能空间位置感知方面有着重要的价值,可广泛地应用在国防领域、航空航天领域、工业领域和日常生活等场景,而全球导航卫星系统作为最重要的定位技术之一,能够在全球坐标系下确定传感器的位置信息,但是单纯的依靠该方法不能进行高精度的定位,尤其是在室内场景和室外具有遮挡的场景。
[0003]目前对于高精度的定位通常采用的是视觉定位技术,该技术只依靠运动目标所携带的相机就可实现完全自主的高精度定位,可广泛地应用于室内外场景,而传统的视觉定位技术通常采用的是特征点法、直接法和深度学习方法。
[0004]其中,特征点法缺乏对不同场景的自适应特点,直接法对光照变化过于敏感,深度学习方法是仅从单幅图像估计相机位姿,无法对连续图像间的时序约束关系进行考量,从而无法在与训练集差异较大的情况下继续准确的定位。
[0005]因此,如何在不同场景以及与训练集差异较大的情况下准确地进行视觉定位,是本领域技术人员有待解决的技术问题。

技术实现思路

[0006]本专利技术的目的是为了解决现有技术无法在不同场景以及与训练集差异较大的情况下进行准确的视觉定位的技术问题,因此,本专利技术提出了一种基于视觉图像的定位方法。
[0007]本专利技术的技术方案为:一种基于视觉图像的定位方法,所述方法具体包括以下步骤:
[0008]S1、将原始图像数据中每两个帧图像之间进行几何运动特征提取得到特征表达集,所述原始图像数据为待定位物体的视觉图像数据;
[0009]S2、将所述特征表达集中非相邻帧图像之间的非相邻特征表达作为指导图集,通过所述指导图集对所述特征表达集中相邻帧图像之间的相邻特征表达进行约束修正得到修正相邻特征表达;
[0010]S3、通过序列学习单元将所述修正相邻特征表达进行序列学习得到序列相邻特征表达;
[0011]S4、通过预设网络将所述序列相邻特征表达进行降维拟合确定出帧间位姿,从而完成待定位物体的定位。
[0012]进一步地,所述步骤S2具体包括以下分步骤:
[0013]S21、确定出所述相邻特征表达在所述指导图集中对应的多个关联指导图;
[0014]S22、确定出每一个所述关联指导图对应的指导约束;
[0015]S23、基于所有所述指导约束对所述相邻特征表达进行约束修正。
[0016]进一步地,所述S22中的指导约束具体由如下公式进行确定:
[0017][0018][0019]其中,mask
t+i,t+i+1
为指导约束,t为获取所述原始图像数据的t时刻,i和j为区分不同时刻的系数,且为正整数,为关联指导图中高维宏观位姿信息在c通道的指导二维特征图,为相邻特征表达的高维特征在c通道的相邻二维特征图,表示在c通道的约束,Vec为将二维特征特征图映射为一维向量,‖
·
‖2表示二范数,σ(
·
)为Sigmoid函数,为堆积操作。
[0020]进一步地,所述S3具体为通过所述序列学习单元中的预设神经网络对修正相邻特征表达进行序列学习得到序列相邻特征表达。
[0021]进一步地,所述S4具体包括以下分步骤:
[0022]S41、通过所述预设网络将所述序列相邻特征表达进行降维拟合确定出相邻帧图像之间的相对位移变化和相对欧拉角变化;
[0023]S42、基于所述相对位移变化和所述相对欧拉角变化对所述待定位物体进行定位。
[0024]与现有技术相比,本专利技术的有益效果是:
[0025](1)通过将原始图像数据中每两个帧图像之间进行几何运动特征提取得到特征表达集,经所述特征表达集中非相邻帧图像之间的非相邻特征表达作为指导图集,然后通过该指导图集对特征表达集中相邻帧图像之间的相邻特征表达进行约束修正得到修正相邻特征表达,以及通过序列学习单元对修正相邻特征表达进行序列学习然后得到序列相邻特征表达,最后通过预设网络将该序列相邻特征表达进行降维拟合确定出帧间位姿,从而完成待定位物体的定位,实现了在进行视觉定位中在不同场景下以及在与训练集差异较大的情况下仍能进行准确的视觉定位。
[0026](2)本专利技术通过确定出特征表达集中的指导图集,并通过该指导图集对特征表达集中相邻特征表达进行约束修正,保证了图像序列间的运动一致性。
[0027](3)本专利技术通过序列学习单元对修正相邻特征表达进行序列学习,充分挖掘时序信号特征,能够起到连续指导当前位姿估计的效果。
附图说明
[0028]图1所示为本专利技术实施例提供的一种基于视觉图像的定位方法的流程示意图;
[0029]图2所示为本专利技术实施例中进行几何运动特征提取时原始图像数据的维度变化。
具体实施方式
[0030]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0031]如
技术介绍
中所述,现有技术中特征点法缺乏对不同场景的自适应特点,直接法对光照变化过于敏感,深度学习方法是仅从单幅图像估计相机位姿,无法对连续图像间的时序约束关系进行考量,从而无法在与训练集差异较大的情况下进行准确的定位。
[0032]为解决现有技术中的不足,本申请提出一种基于视觉图像的定位方法,如图1所示,所述方法包括以下步骤:
[0033]步骤S1、将原始图像数据中每两个帧图像之间进行几何运动特征提取得到特征表达集,所述原始图像数据为待定位物体的视觉图像数据。
[0034]具体的,原始图像数据也即待定位物体的视觉图像数据可由待定位物体上携带的相机进行获取,且该原始图像数据是连续的多个原始RGB帧图像。
[0035]在具体应用场景中,原始图像数据是连续4帧的原始RGB帧图像,其尺寸为3
×
370
×
1226,其中3表示图像的RGB三通道,370和1226分别表示原始图像的高和宽,本领域技术人员可根据实际情况选择原始RGB帧图像的帧数。
[0036]通过卷积神经网络对原始图像数据中每两个帧图像之间进行几何运动特征提取,在具体场景中,卷积神经网络的参数配置可如下表1所示:
[0037][0038][0039]表1
[0040]其中,网络感知域的尺寸从7
×
7到5
×
5,再到3
×
3,逐渐减小,以捕捉高维特征中更细微的变化,Zero

padding(零填充)被引入来适应卷积核尺寸以及博阿吃卷积后的空间维度,网络各层通道数即每层中进行特征提取的卷积核的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于视觉图像的定位方法,其特征在于,具体包括以下步骤:S1、将原始图像数据中每两个帧图像之间进行几何运动特征提取得到特征表达集,所述原始图像数据为待定位物体的视觉图像数据;S2、将所述特征表达集中非相邻帧图像之间的非相邻特征表达作为指导图集,通过所述指导图集对所述特征表达集中相邻帧图像之间的相邻特征表达进行约束修正得到修正相邻特征表达;S3、通过序列学习单元将所述修正相邻特征表达进行序列学习得到序列相邻特征表达;S4、通过预设网络将所述序列相邻特征表达进行降维拟合确定出帧间位姿,从而完成待定位物体的定位。2.如权利要求1所述的基于视觉图像的定位方法,其特征在于,所述步骤S2具体包括以下分步骤:S21、确定出所述相邻特征表达在所述指导图集中对应的多个关联指导图;S22、确定出每一个所述关联指导图对应的指导约束;S23、基于所有所述指导约束对所述相邻特征表达进行约束修正。3.如权利要求2所述的基于视觉图像的定位方法,其特征在于,所述S22中的指导约束具体由如下公式进行确定:具体...

【专利技术属性】
技术研发人员:陈星翰朱然叶葛旺
申请(专利权)人:上海谦尊升网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1