当前位置: 首页 > 专利查询>同济大学专利>正文

一种适用于现实室内环境的机器人视觉语言导航方法技术

技术编号:38356012 阅读:9 留言:0更新日期:2023-08-05 17:27
本发明专利技术涉及一种适用于现实室内环境的机器人视觉语言导航方法,包括以下步骤:获取环境信息和全景图片;对现实室内环境进行二维栅格地图构建,并将连续的室内环境转换成离散图;生成路径

【技术实现步骤摘要】
一种适用于现实室内环境的机器人视觉语言导航方法


[0001]本专利技术涉及机器人与深度学习
,尤其是涉及一种适用于现实室内环境的机器人视觉语言导航方法。

技术介绍

[0002]机器人能够在现实室内环境中理解用户的移动指令并且通过自主导航完成对应指令要求不仅是人们对于未来人工智能的愿景,也是目前机器人需要研究的长期目标之一。
[0003]室内视觉语言导航技术要求机器人在接受到用户语言指令后,通过不断对当前场景视觉特征的观测输出运动信号,并最终完成用户指令中所指定的移动任务。视觉语言导航技术主要包括了单模态的语音特征理解,视觉特征理解和多模态的特征融合三个主要过程,其中语音特征理解要求机器人能够理解用户所给出的用户指令信息,视觉特征理解要求机器人能够通过RGB图片和深度图片获得当前环境信息,多模态融合过程要求机器人能够根据用户所给指令,并结合当前机器人状态和环境信息,最终给出当前时刻下应选择的动作指令并更新当前状态信息。
[0004]现有的室内视觉语言导航模型主要应用在虚拟仿真环境,如Matterport3D,Habitat仿真环境,无法在现实室内环境下成功完成实验。在实际的现实生活场景中,视觉语言导航模型主要面临着两个问题,首先,现实室内环境与虚拟仿真环境相比环境特征差距较大,且现实生活环境语义信息较为单一,导致无法将虚拟环境中的视觉语言导航模型直接应用在现实室内环境中。第二,无法对所采集的室内场景进行连续环境建模,即难以以身边室内环境为基础,构建相似的仿真环境进行训练,若直接在现实环境中进行模型训练需要考虑机器人和环境中各种设施的碰撞成本,极大地提高了实验代价。

技术实现思路

[0005]本专利技术的目的就是为了提供一种适用于现实室内环境的机器人视觉语言导航方法,使在现实室内环境中机器人能够实现视觉语言导航功能,并保持较小的实验成本。
[0006]本专利技术的目的可以通过以下技术方案来实现:
[0007]一种适用于现实室内环境的机器人视觉语言导航方法,包括以下步骤:
[0008]S1、获取现实环境数据采集硬件平台采集的环境信息和全景图片;
[0009]S2、基于采集的环境信息对现实室内环境进行二维栅格地图构建,对室内环境进行房间区域的分类,将当前环境看作由多个不同房间组成的室内环境,并在栅格地图中定义栅格地图的导航点位置和导航点连接关系,将原本连续的室内环境转换成现实环境中视觉语言导航所使用的离散图,所述离散图中的每个导航点对应一张全景图片;
[0010]S3、基于离散图自动生成路径

指令对训练样本,并对生成的每条路径进行人工标注,获取对应每条生成路径的标注信息;对采集的全景图片进行图像特征提取,获取离散图中每个导航点的图像特征信息;基于路径

指令对训练样本以及路径中的导航点对应的全
景图片的图像特征信息构建现实室内环境的视觉语言导航数据集;
[0011]S4、构建视觉语言导航模型,接收语言指令和当前环境信息指令,输出当前时刻下的下一步动作选择,所述视觉语言导航模型包括单模态语言特征提取模块、单模态环境特征提取模块和多模态特征融合与状态更新模块;
[0012]S5、以视觉语言导航数据集为训练数据,对视觉语言导航模型进行迁移训练;
[0013]S6、以ROS系统为基础,在机器人上实现视觉语言导航功能的部署,所述视觉语言导航功能含五个工作节点,分别为相机节点、语音节点、SLAM节点、机器人主控节点和网络计算节点,其中,所述视觉语言导航模型部署在网络计算节点上。
[0014]所述现实环境数据采集硬件平台的AGV底盘具有建图和自主导航与定位能力,全景相机采集的全景图片满足水平方向360度和垂直方向90度的视角。
[0015]对于一张全景图片,将其按照水平方向间隔30度,垂直方向间隔30度进行图像切分,获得36张分辨率为640*480的彩色RGB图像。
[0016]所述S3中生成的路径满足三种规范:
[0017]导航路径起点和终点位于当前环境中的不同房间;
[0018]导航路径长度大于设定的路径最短长度;
[0019]导航路径所过导航点数大于设定的最小点数,小于设定的最大点数。
[0020]所述S3中对采集的全景图片采用在Image

Net上预训练好的ResNet152网络进行图像特征提取。
[0021]所述单模态语言特征提取模块基于BERT

base网络构建,使用大型语料数据集进行预训练;所述单模态环境特征提取模块基于ResNet152网络构建,使用ImageNet进行预训练;所述多模态特征融合与状态更新模块基于跨注意力机制来融合状态、视觉和语言信息,使用仿真环境Matterport3D和habitat下的视觉语言导航任务进行预训练。
[0022]所述视觉语言导航模型在任务开始阶段接受用户指令,利用单模态语言特征提取模块获得语言特征和初始状态特征;在任务进行过程中,机器人接收当前所处的导航点的图像作为输入,利用单模态环境特征提取模块获得当前导航点的图像特征,并经过多模态特征融合与状态更新模块获得当前时刻的动作选择和更新后的状态特征。
[0023]所述S5的迁移训练过程中,将单模态视觉特征提取模型的参数固定,不进行梯度更新,仅对单模态环境特征提取模块和多模态特征融合与状态更新模块进行网络参数更新。
[0024]所述机器人主控节点为视觉语言导航功能流程控制节点,其接收来自语音节点的用户指令信息,接收坐标信息发出环境采集指令,并通过与网络计算节点交互获得下一导航点的目标位置,发出导航指令控制机器人移动;网络计算节点接收机器人主控节点发出的环境信息和指令信息,进行网络前向计算,并返回计算结果,即所选下一导航点信息。
[0025]创建ROS下的消息模式VlnNavigation和VlnPoint供机器人主控节点与网络计算节点进行信息交互,其中,VlnNavigation中包括用户指令信息、导航点信息和导航点数量,VlnPoint中包括视觉语言导航模型计算所获得的下一导航点信息和是否停止的标志位。
[0026]与现有技术相比,本专利技术具有以下有益效果:
[0027](1)本专利技术对室内环境进行离散化构建,首先能够简化数据集采集流程,加速数据构造时间。将连续的环境抽象成数个离散的导航点,并通过导航点的连接图和全景图像构
建室内环境训练集能够省略对当前环境的三维重建过程。同时,本专利技术通过自动化的方式在离散图中自动生成导航路径样本,能够快速的生成供视觉语言导航网络模型训练的路径样本,做到快速的训练数据集构建。
[0028](2)针对每条训练样本,本专利技术采用人工标注的方式进行导航指令标注,与现有标注相比具有更高的精度,同时对于每条路径分别标注三条指令,提高了输入指令的丰富度。
[0029](3)本专利技术所构建的视觉语言导航模型基于BERT

base网络和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种适用于现实室内环境的机器人视觉语言导航方法,其特征在于,包括以下步骤:S1、获取现实环境数据采集硬件平台采集的环境信息和全景图片;S2、基于采集的环境信息对现实室内环境进行二维栅格地图构建,对室内环境进行房间区域的分类,将当前环境看作由多个不同房间组成的室内环境,并在栅格地图中定义栅格地图的导航点位置和导航点连接关系,将原本连续的室内环境转换成现实环境中视觉语言导航所使用的离散图,所述离散图中的每个导航点对应一张全景图片;S3、基于离散图自动生成路径

指令对训练样本,并对生成的每条路径进行人工标注,获取对应每条生成路径的标注信息;对采集的全景图片进行图像特征提取,获取离散图中每个导航点的图像特征信息;基于路径

指令对训练样本以及路径中的导航点对应的全景图片的图像特征信息构建现实室内环境的视觉语言导航数据集;S4、构建视觉语言导航模型,接收语言指令和当前环境信息指令,输出当前时刻下的下一步动作选择,所述视觉语言导航模型包括单模态语言特征提取模块、单模态环境特征提取模块和多模态特征融合与状态更新模块;S5、以视觉语言导航数据集为训练数据,对视觉语言导航模型进行迁移训练;S6、以ROS系统为基础,在机器人上实现视觉语言导航功能的部署,所述视觉语言导航功能含五个工作节点,分别为相机节点、语音节点、SLAM节点、机器人主控节点和网络计算节点,其中,所述视觉语言导航模型部署在网络计算节点上。2.根据权利要求1所述的一种适用于现实室内环境的机器人视觉语言导航方法,其特征在于,所述现实环境数据采集硬件平台的AGV底盘具有建图和自主导航与定位能力,全景相机采集的全景图片满足水平方向360度和垂直方向90度的视角。3.根据权利要求2所述的一种适用于现实室内环境的机器人视觉语言导航方法,其特征在于,对于一张全景图片,将其按照水平方向间隔30度,垂直方向间隔30度进行图像切分,获得36张分辨率为640*480的彩色RGB图像。4.根据权利要求1所述的一种适用于现实室内环境的机器人视觉语言导航方法,其特征在于,所述S3中生成的路径满足三种规范:导航路径起点和终点位于当前环境中的不同房间;导航路径长度大于设定的路径最短长度;导航路径所过导航点数大于设定的最小点数,小于设定的最大点数。5.根据权利要求1所述的一种适用于现实室内环境...

【专利技术属性】
技术研发人员:刘成菊陆理文陈启军王乃佳
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1