【技术实现步骤摘要】
本专利技术涉及机器视觉,具体涉及一种机器人视觉运动技能学习方法及系统。
技术介绍
1、在现实世界中执行顺序操作任务需要机器人基于原始的感官观察以多种方式与环境进行交互,为了解决现实世界中顺序操作任务的多样性和复杂性,机器人需要获得一系列技能,这些技能可以推广到广泛的环境配置和目标。为此开发了各种数据驱动的方法,通过自我监督学习、模仿学习和强化学习来获取技能,虽然这些方法减轻了手动设计技能的需要,但是所学技能归纳到新场景的能力高度依赖于训练数据的规模和质量。
2、因此,通过领域随机化创建的模拟环境已被广泛用于收集训练数据,其能够推广到未知的环境中,为了解决简单的领域随机化效率低下的困难探索问题,越来越多的工作提出从参数化的任务空间中自适应地选择不同的任务,以加速学习进程。
3、虽然上述方法在简单的模拟环境中取得了成功,但将这些方法应用于复杂的领域(如顺序操作)中,还是具有挑战性,其中对象属性、排列和任务目标的选择对如何解决任务具有复杂的影响。而将环境随机化通常会导致无效的任务,或者无法涵盖技能策略需要培训的所有任务
...【技术保护点】
1.一种机器人视觉运动技能学习方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种机器人视觉运动技能学习方法,其特征在于,所述步骤S1中,定义所述任务为w∈W;机器人在给定状态s和环境c=(k,i,j)的条件下执行策略以产生动作a,并接收奖励r,收集的经验(w,st,at,rt,st+1)存储在重放缓冲区D中,以用于训练策略π,其中,所述k为技能指数,所述i,j分别是对象指数。
3.如权利要求2所述的一种机器人视觉运动技能学习方法,其特征在于,所述步骤S2中,评估可行性的所述任务w通过所述训练策略π完成。
4.如权利要求3所
...【技术特征摘要】
1.一种机器人视觉运动技能学习方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种机器人视觉运动技能学习方法,其特征在于,所述步骤s1中,定义所述任务为w∈w;机器人在给定状态s和环境c=(k,i,j)的条件下执行策略以产生动作a,并接收奖励r,收集的经验(w,st,at,rt,st+1)存储在重放缓冲区d中,以用于训练策略π,其中,所述k为技能指数,所述i,j分别是对象指数。
3.如权利要求2所述的一种机器人视觉运动技能学习方法,其特征在于,所述步骤s2中,评估可行性的所述任务w通过所述训练策略π完成。
4.如权利要求3所述的一种机器人视觉运动技能学习方法,其特征在于,所述步骤s2中,定义可行性的所述任务w在指定的所述任务w中展开所述训练策...
【专利技术属性】
技术研发人员:李泽辉,吴均城,杨海东,杨标,
申请(专利权)人:佛山市南海区广工大数控装备协同创新研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。