当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于贝叶斯核推理的机器人环境探测方法技术

技术编号:37506632 阅读:33 留言:0更新日期:2023-05-07 09:43
本发明专利技术公开了一种基于贝叶斯核推理的机器人环境探测方法,包括步骤:初始化机器人历史航路点集合、信息增益阈值和推理模型训练参数等;在机器人当前感知范围内随机采样一组运动学可达的位姿集合作为候选控制动作;显式计算各候选动作的互信息并建立训练样本集合;继续采样一定量的候选动作作为查询样本,通过贝叶斯核推理方法预测查询样本的信息增益及不确定性;根据查询样本的预测结果决策最优候选动作,最终执行最优候选动作并更新环境地图,直至探测完毕。本发明专利技术的贝叶斯核推理探测方法可预测环境空间候选点的信息增益及不确定性,运算复杂度较低,适用于机器人在大尺度、杂乱的未知环境中实现在线、安全的探测。安全的探测。安全的探测。

【技术实现步骤摘要】
Bayesian optimization[C]//2016IEEE/RSJ International Conference on Intelligent Robots and Systems(IROS).IEEE,2016:1816

1822.

技术实现思路

[0011]本专利技术的目的在于,针对未知环境下机器人探测效率不高的问题,提供一种基于贝叶斯核推理的机器人环境探测方法,将贝叶斯核推理技术(Bayesian Kernel Inference,BKI)应用于机器人探测,从而可快速高效预测大量候选动作的信息增益,最终决策得到机器人的下一步最优探测动作,直至完成环境探测任务。
[0012]为了解决上述问题,本专利技术提供了如下技术方案:
[0013]一种基于贝叶斯核推理的机器人环境探测方法,包括以下步骤:
[0014]步骤1:初始化机器人历史动作集合x
hist
、信息增益阈值I
th
、需明确计算的训练样本数量N、环境探测所需时间步数量N
s
、待查询样本数量N
q本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于贝叶斯核推理的机器人环境探测方法,其特征在于,包括以下步骤:步骤1:初始化机器人历史动作集合x
hist
、信息增益阈值I
th
、需明确计算的训练样本数量N、环境探测所需时间步数量N
s
、待查询样本数量N
q
和模型训练次数N
epoch
;步骤2:在第k次迭代过程中,机器人当前位姿x
k
可通过独立的机器人定位方法获取;根据当前所建立的地图m
k
,在机器人感知范围内随机采样N个运动学可达的位姿x={x1,

,x
i
,

,x
N
},i∈[1,N]作为候选动作,每个候选动作包括机器人的目标位置坐标与目标航向角;步骤3:根据占据网格地图环境互信息定义,显式评估计算每个候选动作x
i
∈x对应的信息增益,得到MI集合y,建立训练样本集合;步骤4:继续在当前机器人感知范围内随机采样N
q
个运动学可达的候选动作得到查询样本的输入集合x
*
,结合步骤3得到的训练样本集合,通过贝叶斯核推理方法预测查询样本对应的MI,得到每次训练中最优候选动作索引集合x
best
,以及对应的最优MI集合I
best
;步骤5:若当前预测的最优MI集合I
best
中最大的MI值大于设定的信息阈值I
th
,则将最大MI值对应的候选动作x
best
(MaxInfoIdx)作为机器人下一步要达到的航路点x
k+1
,其中MaxInfoIdx为其在集合x
best
的索引,同时将x
k+1
加入到历史动作集合x
hist
;步骤6:若I
best
不大于信息阈值I
th
,则将上一时间步的机器人动作x
k
‑1作为下一个要执行的动作x
k+1
,同时从x
hist
中删除x
k
‑1;步骤7:机器人执行动作x
k+1
指令,采用局部路径规划方法得到从x
k
至x
k+1
的局部路径P
local
,机器人在行驶该路径过程的同时,利用机载传感器不断测量并完成占据栅格地图的更新,得到k+1时刻的环境地图m
k+1
;步骤8:重复执行步骤2

步骤7,直至迭代次数达到N
s
次结束此次探测过程。2.根据权利要求1所述的一种基于贝叶斯核推理的机器人环境探测方法,其特征在于,所述的步骤3中建立训练样本集合的过程具体为:遍历每个候选动作x
i
∈x,利用当前所探索的地图m
k
,采用光线投射方法得到虚拟测量Z

,根据互信息计算公式计算得到每个候选动作对应的MI:y
i
=H(m
k
)

H(m
k
;Z...

【专利技术属性】
技术研发人员:郑荣濠徐阳刘妹琴张森林
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1