一种在移动人群环境中的机器人导航方法及系统技术方案

技术编号：33448236 阅读：15 留言：0更新日期：2022-05-19 00:33

本发明专利技术属于机器人导航技术领域，提供了一种在移动人群环境中的机器人导航方法及系统。其中，该方法包括获取移动人群中各个行人的目标位置、首选速度、航向角、实时位置和实时速度以及机器人的实时位置和实时速度；再基于机器人的风险区域模型，得到移动人群与机器人相邻的行人的风险区域并进行躲避，进而得到机器人的导航路径；其中，所述基于机器人的风险区域模型为：当机器人在限定时间内躲避成功时，通过对应奖励函数得到奖励；当机器人进入风险区域时，通过对应惩罚函数得到惩罚；风险区域的惩罚函数形式和生效范围取决于环境中机器人和行人的实时相对位置和速度。和行人的实时相对位置和速度。和行人的实时相对位置和速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种在移动人群环境中的机器人导航方法及系统

[0001]本专利技术属于机器人导航
，尤其涉及一种在移动人群环境中的机器人导航方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。
[0003]随着机器人的应用场景逐渐扩展到人机共存环境，对于社交机器人来说，在拥挤的人群环境中安全且符合社会规范的导航至关重要。近年来深度强化学习技术已经在解决人群环境下的机器人导航问题上取得了很大进展。但是专利技术人发现，目前的人群环境下的机器人导航技术未考虑人群移动速度的影响，从而导致机器人的性能会随着人群移动速度的增长而下降，从而使得机器人无法在快速移动的人群中准确感知环境中的危险。

技术实现思路

[0004]为了解决上述
技术介绍
中存在的技术问题，本专利技术提供一种在移动人群环境中的机器人导航方法及系统，其能够有效地感知环境中的风险，并在快速移动的人群中具有较高的安全性。
[0005]为了实现上述目的，本专利技术采用如下技术方案：
[0006]本专利技术的第一个方面提供一种在移动人群环境中的机器人导航方法，其包括：
[0007]获取移动人群中各个行人的目标位置、首选速度、航向角、实时位置和实时速度以及机器人的实时位置和实时速度；
[0008]再基于机器人的风险区域模型，得到移动人群与机器人相邻的行人的风险区域并进行躲避，进而得到机器人的导航路径；
[0009]其中，所述基于机器人的风险区域模型为：
[...

【技术保护点】

【技术特征摘要】
1.一种在移动人群环境中的机器人导航方法，其特征在于，包括：获取移动人群中各个行人的目标位置、首选速度、航向角、实时位置和实时速度以及机器人的实时位置和实时速度；再基于机器人的风险区域模型，得到移动人群与机器人相邻的行人的风险区域并进行躲避，进而得到机器人的导航路径；其中，所述基于机器人的风险区域模型为：当机器人在限定时间内躲避成功时，通过对应奖励函数得到奖励；当机器人进入风险区域时，通过对应惩罚函数得到惩罚；风险区域的惩罚函数形式和生效范围取决于环境中机器人和行人的实时相对位置和速度。2.如权利要求1所述的在移动人群环境中的机器人导航方法，其特征在于，机器人的导航路径是找到一个使期望收益最大化的最优策略航路径是找到一个使期望收益最大化的最优策略航路径是找到一个使期望收益最大化的最优策略式中表示在t时刻获得的奖励,γ∈(0,1)是一个折扣因子，是最优值函数，是从时间t到时间t
Δ
＝t+Δt的状态转移概率；是在t时刻整个系统的联合状态，是在t
Δ
时刻整个系统的联合状态，a
t
表示在t时刻的动作；v
pref
表示首选速度。3.如权利要求2所述的在移动人群环境中的机器人导航方法，其特征在于，使用时间差分学习方法来训练最优值函数。4.如权利要求1所述的在移动人群环境中的机器人导航方法，其特征在于，所述风险区域包括位置风险区域和速度风险区域。5.如权利要求4所述的在移动人群环境中的机器人导航方法，其特征在于，所述惩罚函数为基于速度的惩罚函数和基于位置的惩罚函数的总和。6.一种在移动人群环境中的机器人导航系统，其特征在于，包括：信息获取模块，其用于获取移动人群中各个行人的目标位置、首选速度、航向角、实时...

【专利技术属性】
技术研发人员：周风余，冯震，薛秉鑫，夏英翔，尹磊，
申请(专利权)人：山东大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人