一种适用于现实室内环境的机器人视觉语言导航方法技术

技术编号：38356012 阅读：9 留言：0更新日期：2023-08-05 17:27

本发明专利技术涉及一种适用于现实室内环境的机器人视觉语言导航方法，包括以下步骤：获取环境信息和全景图片；对现实室内环境进行二维栅格地图构建，并将连续的室内环境转换成离散图；生成路径

全部详细技术资料下载

【技术实现步骤摘要】
一种适用于现实室内环境的机器人视觉语言导航方法

[0001]本专利技术涉及机器人与深度学习
，尤其是涉及一种适用于现实室内环境的机器人视觉语言导航方法。

技术介绍

[0002]机器人能够在现实室内环境中理解用户的移动指令并且通过自主导航完成对应指令要求不仅是人们对于未来人工智能的愿景，也是目前机器人需要研究的长期目标之一。
[0003]室内视觉语言导航技术要求机器人在接受到用户语言指令后，通过不断对当前场景视觉特征的观测输出运动信号，并最终完成用户指令中所指定的移动任务。视觉语言导航技术主要包括了单模态的语音特征理解，视觉特征理解和多模态的特征融合三个主要过程，其中语音特征理解要求机器人能够理解用户所给出的用户指令信息，视觉特征理解要求机器人能够通过RGB图片和深度图片获得当前环境信息，多模态融合过程要求机器人能够根据用户所给指令，并结合当前机器人状态和环境信息，最终给出当前时刻下应选择的动作指令并更新当前状态信息。
[0004]现有的室内视觉语言导航模型主要应用在虚拟仿真环境，如Matterport3D，Habitat仿真环境，无法在现实室内环境下成功完成实验。在实际的现实生活场景中，视觉语言导航模型主要面临着两个问题，首先，现实室内环境与虚拟仿真环境相比环境特征差距较大，且现实生活环境语义信息较为单一，导致无法将虚拟环境中的视觉语言导航模型直接应用在现实室内环境中。第二，无法对所采集的室内场景进行连续环境建模，即难以以身边室内环境为基础，构建相似的仿真环境进行训练，若直接在现实环境中进行模型...

【技术保护点】

【技术特征摘要】
1.一种适用于现实室内环境的机器人视觉语言导航方法，其特征在于，包括以下步骤：S1、获取现实环境数据采集硬件平台采集的环境信息和全景图片；S2、基于采集的环境信息对现实室内环境进行二维栅格地图构建，对室内环境进行房间区域的分类，将当前环境看作由多个不同房间组成的室内环境，并在栅格地图中定义栅格地图的导航点位置和导航点连接关系，将原本连续的室内环境转换成现实环境中视觉语言导航所使用的离散图，所述离散图中的每个导航点对应一张全景图片；S3、基于离散图自动生成路径
‑
指令对训练样本，并对生成的每条路径进行人工标注，获取对应每条生成路径的标注信息；对采集的全景图片进行图像特征提取，获取离散图中每个导航点的图像特征信息；基于路径
‑
指令对训练样本以及路径中的导航点对应的全景图片的图像特征信息构建现实室内环境的视觉语言导航数据集；S4、构建视觉语言导航模型，接收语言指令和当前环境信息指令，输出当前时刻下的下一步动作选择，所述视觉语言导航模型包括单模态语言特征提取模块、单模态环境特征提取模块和多模态特征融合与状态更新模块；S5、以视觉语言导航数据集为训练数据，对视觉语言导航模型进行迁移训练；S6、以ROS系统为基础，在机器人上实现视觉语言导航功能的部署，所述视觉语言导航功能含五个工作节点，分别为相机节点、语音节点、SLAM节点、机器人主控节点和网络计算节点，其中，所述视觉语言导航模型部署在网络计算节点上。2.根据权利要求1所述的一种适用于现实室内环境的机器人视觉语言导航方法，其特征在于，所述现实环境数据采集硬件平台的AGV底盘具有建图和自主导航与定位能力，全景相机采集的全景图片满足水平方向360度和垂直方向90度的视角。3.根据权利要求2所述的一种适用于现实室内环境的机器人视觉语言导航方法，其特征在于，对于一张全景图片，将其按照水平方向间隔30度，垂直方向间隔30度进行图像切分，获得36张分辨率为640*480的彩色RGB图像。4.根据权利要求1所述的一种适用于现实室内环境的机器人视觉语言导航方法，其特征在于，所述S3中生成的路径满足三种规范：导航路径起点和终点位于当前环境中的不同房间；导航路径长度大于设定的路径最短长度；导航路径所过导航点数大于设定的最小点数，小于设定的最大点数。5.根据权利要求1所述的一种适用于现实室内环境...

【专利技术属性】
技术研发人员：刘成菊，陆理文，陈启军，王乃佳，
申请(专利权)人：同济大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人