【技术实现步骤摘要】
移动机器人社交导航方法及装置
[0001]本专利技术涉及机器人
,尤其涉及一种移动机器人社交导航方法及装置
。
技术介绍
[0002]服务机器人正逐渐进入人类社会,并且越来越多地代替人类从事各种服务工作
。
这不仅要求机器人能够在与人共融场景中有效地进行导航,还要求机器人遵守人类的社交规范
。
[0003]现有的基于人机协作的社交导航方法可以分为两类
:
基于模型的方法和基于学习的方法
。
其中,基于学习的方法包括以行人的状态作为输入来学习社交导航策略
。
首先对环境中的行人进行目标检测和跟踪,获得行人的运动状态和轨迹,以此作为强化学习模型的输入
。
现有方法通常只考虑当前时刻下行人之间在空间上的相互作用,且只考虑行人可能性最大的运动轨迹,导致机器人进行导航规划时对动态行人运动的鲁棒性低
。
技术实现思路
[0004]本专利技术提供一种移动机器人社交导航方法及装置,用以解决现有技术中机器人社交 ...
【技术保护点】
【技术特征摘要】
1.
一种移动机器人社交导航方法,其特征在于,包括:根据目标场景中的智能体在当前时刻前第一预设时间段内的历史观察数据,以及所述智能体中的机器人在所述当前时刻后第二预设时间段内的每条候选动作序列,预测所述智能体中的每个行人在所述第二预设时间段内的多条运动轨迹,所述第一预设时间段包括所述当前时刻;根据所述机器人的每条候选动作序列,预测所述机器人在所述第二预设时间段内的运动轨迹;根据每条候选动作序列对应的行人的运动轨迹和所述机器人的运动轨迹,确定所述机器人在所述当前时刻的最优动作
。2.
根据权利要求1所述的移动机器人社交导航方法,其特征在于,所述根据目标场景中的智能体在当前时刻前第一预设时间段内的历史观察数据,以及所述智能体中的机器人在所述当前时刻后第二预设时间段内的每条候选动作序列,预测所述智能体中的每个行人在所述第二预设时间段内的多条运动轨迹,包括:基于轨迹编码模块根据所述智能体的历史观察数据,获取每个行人在所述当前时刻对应的特征编码;基于后验模块根据所述特征编码和状态转移模块输出的每个行人在所述当前时刻对应的确定性隐状态,得到每个行人在所述当前时刻对应的后验高斯概率分布,将所述后验高斯概率分布作为随机隐状态;基于所述状态转移模块根据所述当前时刻对应的随机隐状态
、
确定性隐状态和所述机器人在所述第二预设时间段内的每条候选动作序列,确定每个行人在所述第二预设时间段内每时刻的确定性隐状态和随机隐状态;基于观测模型根据所述确定性隐状态和随机隐状态,获取每个行人在所述第二预设时间段内每时刻的观测值的高斯分布,根据对每个行人在各时刻的观测值的高斯分布进行的多次采样,得到每个行人在所述第二预设时间段内的多条运动轨迹
。3.
根据权利要求2所述的移动机器人社交导航方法,其特征在于,所述基于轨迹编码模块根据所述智能体的历史观察数据,获取每个行人在所述当前时刻对应的特征编码,包括:基于多层感知器和激活函数对每个智能体的历史观察数据进行嵌入操作后输入门控循环单元,获取每个智能体在所述当前时刻对运动轨迹的时间依赖性;根据所有智能体对运动轨迹的时间依赖性构建全连接图,对所述全连接图进行特征提取得到每个行人在所述当前时刻的聚合隐状态;对每个行人的聚合隐状态和对运动轨迹的时间依赖性进行联结,得到每个行人在所述当前时刻的特征编码
。4.
根据权利要求2所述的移动机器人社交导航方法,其特征在于,所述基于所述状态转移模块根据所述当前时刻对应的随机隐状态
、
确定性隐状态和所述机器人在所述第二预设时间段内的每条候选动作序列,确定每个行人在所述第二预设时间段内每时刻的确定性隐状态和随机隐状态,包括:根据所述当前时刻对应的随机隐状态
、
确定性隐状态和每条候选动作序列中当前时刻的动作,确定每个行人在当前时刻的下一时刻的确定性隐状态;根据所述下一时刻的确定性隐状态,确定...
【专利技术属性】
技术研发人员:孙世颖,高星远,张宇佳,赵晓光,谭民,周飞虎,王黎,毛智,
申请(专利权)人:中国人民解放军总医院第一医学中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。