【技术实现步骤摘要】
用于优化机器人的策略的方法
[0001]本专利技术涉及一种用于优化机器人的借助于高斯混合模型(英语:Gaussian Mixture Modell)实现的策略的方法和一种设备、一种计算机程序以及一种机器可读存储介质。
技术介绍
[0002]从作者Shahriari, Bobak等人的"Taking the human out of the loop: A review of Bayesian optimization." Proceedings of the IEEE 104.1 (2015): 148
‑
175 中已知高斯过程(GP)以及借助于贝叶斯优化(BO)对其进行的优化。
[0003]从作者Calinon, Sylvain的"A tutorial on task
‑
parameterized movement learning and retrieval." Intelligent service robotics 9.1 (2016): 1
‑
29中已知 ...
【技术保护点】
【技术特征摘要】
1.一种用于优化机器人的预先给定的策略(英语:policy)的方法(20),其中所述策略是高斯混合模型(英语:Gaussian mixture model),所述高斯混合模型根据机器人的起始状态和目标状态输出至少一个子轨迹,所述方法包括以下步骤:对高斯过程进行初始化(S21),所述高斯过程适用于根据高斯混合模型的参数化来估计机器人为了到达目标位置必须花费的成本,其中所述高斯过程具有至少一个核k,所述核根据在分别通过高斯混合模型和高斯过程表征的概率分布之间按照概率乘积核(英语:Probability Product Kernel)确定的距离获得输入参量;根据所述策略创建(S22)多个轨迹;为所述多个轨迹中的每一个轨迹确定(S22)成本;优化(S24)所述高斯过程,使得所述高斯过程根据所述高斯混合模型的所使用的参数为所述多个轨迹估计所确定的成本;借助于所述高斯过程确定用于所述高斯混合模型的最优参数,使得所述高斯过程输出用于所述最优参数的最优成本;通过所述最优参数替换(S25)所述高斯混合模型的参数。2.根据权利要求1所述的方法,其中按照概率乘积核根据在所述高斯混合模型(p)和所述高斯过程(q)之间的内积来计算所述距离。3.根据权利要求2所述的方法,其中根据在多个正态分布上的总和确定所述内积,其中所述多个正态分布对于在所述高斯...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。