基于自注意力机制和LSTM的无人机位姿估计方法技术

技术编号:38590936 阅读:21 留言:0更新日期:2023-08-26 23:30
本发明专利技术属于计算机视觉领域,尤其涉及一种基于自注意力机制和LSTM的无人机位姿估计方法。该方法使用Resnet和自注意力机制进行图像特征提取,然后通过LSTM长短期记忆网络对无人机的位置信息进行一定记录,最后通过全连接进行输出。在第一阶段:通过对无人机位姿估计数据集进行拆分,得到若干组前后相连的两张图像,第二阶段:通过对输入的每组图像进行堆叠,获得堆叠的相同长宽但通道不同的图像,在第三阶段:通过Resnet网络对堆叠的图像特征进行抽取,并加入自注意力机制,在第四阶段:使用LSTM对位姿估计序列中的时序信息进行学习,在第五阶段:通过全连接回归特征信息到无人机的位姿上。上。上。

【技术实现步骤摘要】
基于自注意力机制和LSTM的无人机位姿估计方法


[0001]本专利技术属于计算机
,尤其是计算机视觉领域,涉及无人机视觉位姿估计领域,具体涉及一种基于自注意力机制和LSTM的无人机位姿估计方法。

技术介绍

[0002]无人机的位姿估计是工业化应用的前提,只有在通过各种途径获取无人机的位姿数据后,才为工业应用提供有效的无人机编程控制。对于GPS和IMU方案进行位姿解算来说,其容易受到电磁干扰,对于超声波和光流信息来说,其包含信息较少一般用于防撞,而无人机通过激光雷达进行位姿解算的方案成本较高,且忽略了空间中的颜色和纹理特性。
[0003]通过视觉对无人机位姿进行估计是一个较为鲁棒且低成本的解决方案,视觉摄像头可以长期稳定工作,而且其可以感知空间颜色和纹理,可以从较高层次上对无人机所在空间中的位置进行确定。在基于视觉的无人机位姿估计中,若通过深度学习对无人机位姿进行确定,网络可以学习到图像上的高维信息表示,其不仅可以通过空间中像素点的变化来确定无人机位姿的变化,同样也可以感受空间中较大感受野的物体信息来辅助网络进行无人机位姿估计,但是本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于自注意力机制和LSTM的无人机位姿估计方法,其特征在于,所述方法包括如下步骤:步骤(1)深度学习预处理程序通过将无人机运动序列数据集中的数据,按照时序相邻的特性进行两两划分,划分为若干组前后相邻的两张图像,再输入无人机位姿估计网络;步骤(2)将输入的两张图像进行堆叠,构成长宽相同,但是通道数翻倍的一张多通道图像;步骤(3)通过Resnet神经网络对堆叠的图像特征进行提取,得到代表原图像降维特征的特征图,并通过自注意力机制对特征图进行重新计算,增强特征图的空间描述能力;步骤(4)使用两层LSTM长短期记忆网络对特征图信息中的时序信息进行记录,并取出长短期记忆网络的输出作为代表当前状态的特征向量;步骤(5)通过全连接回归层对特征向量进行回归,得到无人机所在空间中的当前位姿。2.如权利要求1所述的基于自注意力机制和LSTM的无人机位姿估计方法,其特征在于,步骤(1)所述无人机运动序列数据集划分后的格式为时间戳

...

【专利技术属性】
技术研发人员:毛泳舟陈金龙
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1