System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术实施例涉及辅助性机械臂,尤其涉及一种机械臂运动轨迹训练方法、装置、计算机设备及存储介质。
技术介绍
1、辅助性机械臂的使用,如机器人生活辅助是一个具有挑战性的问题,可以极大的改善老年人和残疾人的生活质量,使机械臂能够学习执行复杂任务的运动技能是人工智能领域的主要目标之一。
2、然而,现有的方法需要大量的交互以学习最优轨迹,这在辅助性机械臂的实际场景中并不适用。为了在短的学习时间取得较好的效果,目前常常采用有限差分梯度策略,这限制了算法在不同的环境设置下的泛化能力,例如受试者姿势的重大变化或者使用不同的衣服等等。
技术实现思路
1、本专利技术实施例提供一种机械臂运动轨迹训练方法、装置、计算机设备及存储介质,以实现机械臂运动轨迹的稳健学习,确保能够在较少的交互中学会适应未知环境。
2、第一方面,本专利技术实施例提供了一种机械臂运动轨迹训练方法,该方法包括:
3、基于ard核函数,使用伽马过程建立从潜在空间向机器人空间的映射函数模型;其中,所述潜在空间的维度低于所述机器人空间的维度;
4、根据所述映射函数模型对所述潜在空间进行部署;
5、基于动态运动原语生成所述潜在空间机械臂运动的策略搜索框架;
6、采用强化学习算法,使用预设运动轨迹数据集对所述潜在空间进行训练。
7、可选的,所述根据所述映射函数模型对所述潜在空间进行部署,包括:
8、基于贝叶斯公式确定所述映射函数模型的边际似然;<
...【技术保护点】
1.一种机械臂运动轨迹训练方法,其特征在于,包括:
2.根据权利要求1所述的机械臂运动轨迹训练方法,其特征在于,所述根据所述映射函数模型对所述潜在空间进行部署,包括:
3.根据权利要求2所述的机械臂运动轨迹训练方法,其特征在于,所述边际似然包括:
4.根据权利要求1所述的机械臂运动轨迹训练方法,其特征在于,所述映射函数模型包括:
5.根据权利要求1所述的机械臂运动轨迹训练方法,其特征在于,在所述根据所述映射函数模型对所述潜在空间进行部署之后,还包括:
6.根据权利要求1所述的机械臂运动轨迹训练方法,其特征在于,所述策略搜索框架的策略表示为:
7.根据权利要求1所述的机械臂运动轨迹训练方法,其特征在于,所述强化学习算法的代价函数为:
8.一种机械臂运动轨迹训练装置,其特征在于,包括:
9.一种计算机设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的机械臂运动轨迹训练方法。
【技术特征摘要】
1.一种机械臂运动轨迹训练方法,其特征在于,包括:
2.根据权利要求1所述的机械臂运动轨迹训练方法,其特征在于,所述根据所述映射函数模型对所述潜在空间进行部署,包括:
3.根据权利要求2所述的机械臂运动轨迹训练方法,其特征在于,所述边际似然包括:
4.根据权利要求1所述的机械臂运动轨迹训练方法,其特征在于,所述映射函数模型包括:
5.根据权利要求1所述的机械臂运动轨迹训练方法,其特征在于,在所述根据所述映射函数模型对所述潜在空间进行部署之...
【专利技术属性】
技术研发人员:鲍敦桥,吴占雄,叶基龙,薛棱仁,
申请(专利权)人:杭州矩视科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。