一种机器人视觉运动技能学习方法及系统技术方案

技术编号:39982616 阅读:26 留言:0更新日期:2024-01-09 01:38
本发明专利技术涉及机器视觉技术领域,提供了一种机器人视觉运动技能学习方法及系统,其方法包括以下步骤:S1、获取模拟中按程序生成的任务中的任务参数;S2、通过评估所述任务的可行性来选择相应的所述任务;S3、通过评估所述任务的新颖性来选择相应的所述任务;S4、对所述任务参数进行采样;S5、学习所述任务参数的紧凑表示,以设计关系网络的任务编码器。本发明专利技术中的机器人视觉运动技能学习方法可以使其能自适应且有效地评估任务的可行性和新颖性,以选择合适的候选任务来促进学习,进而使其能应用于复杂的领域。

【技术实现步骤摘要】

本专利技术涉及机器视觉,具体涉及一种机器人视觉运动技能学习方法及系统


技术介绍

1、在现实世界中执行顺序操作任务需要机器人基于原始的感官观察以多种方式与环境进行交互,为了解决现实世界中顺序操作任务的多样性和复杂性,机器人需要获得一系列技能,这些技能可以推广到广泛的环境配置和目标。为此开发了各种数据驱动的方法,通过自我监督学习、模仿学习和强化学习来获取技能,虽然这些方法减轻了手动设计技能的需要,但是所学技能归纳到新场景的能力高度依赖于训练数据的规模和质量。

2、因此,通过领域随机化创建的模拟环境已被广泛用于收集训练数据,其能够推广到未知的环境中,为了解决简单的领域随机化效率低下的困难探索问题,越来越多的工作提出从参数化的任务空间中自适应地选择不同的任务,以加速学习进程。

3、虽然上述方法在简单的模拟环境中取得了成功,但将这些方法应用于复杂的领域(如顺序操作)中,还是具有挑战性,其中对象属性、排列和任务目标的选择对如何解决任务具有复杂的影响。而将环境随机化通常会导致无效的任务,或者无法涵盖技能策略需要培训的所有任务变化,从复杂任务空间本文档来自技高网...

【技术保护点】

1.一种机器人视觉运动技能学习方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种机器人视觉运动技能学习方法,其特征在于,所述步骤S1中,定义所述任务为w∈W;机器人在给定状态s和环境c=(k,i,j)的条件下执行策略以产生动作a,并接收奖励r,收集的经验(w,st,at,rt,st+1)存储在重放缓冲区D中,以用于训练策略π,其中,所述k为技能指数,所述i,j分别是对象指数。

3.如权利要求2所述的一种机器人视觉运动技能学习方法,其特征在于,所述步骤S2中,评估可行性的所述任务w通过所述训练策略π完成。

4.如权利要求3所述的一种机器人视觉运...

【技术特征摘要】

1.一种机器人视觉运动技能学习方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种机器人视觉运动技能学习方法,其特征在于,所述步骤s1中,定义所述任务为w∈w;机器人在给定状态s和环境c=(k,i,j)的条件下执行策略以产生动作a,并接收奖励r,收集的经验(w,st,at,rt,st+1)存储在重放缓冲区d中,以用于训练策略π,其中,所述k为技能指数,所述i,j分别是对象指数。

3.如权利要求2所述的一种机器人视觉运动技能学习方法,其特征在于,所述步骤s2中,评估可行性的所述任务w通过所述训练策略π完成。

4.如权利要求3所述的一种机器人视觉运动技能学习方法,其特征在于,所述步骤s2中,定义可行性的所述任务w在指定的所述任务w中展开所述训练策...

【专利技术属性】
技术研发人员:李泽辉吴均城杨海东杨标
申请(专利权)人:佛山市南海区广工大数控装备协同创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1