基于示教奖励状态机与残差强化学习的机器人装配学习方法技术

技术编号:40988746 阅读:14 留言:0更新日期:2024-04-18 21:31
本发明专利技术提供了一种基于示教奖励状态机与残差强化学习的机器人装配方法,属于机器人与智能制造领域,包括如下步骤:搭建机器人装配的硬件实物平台和强化学习训练的虚拟仿真环境;在实物平台通过拖拽示教采集装配过程中装配对象的6D位姿示教轨迹;抽象表示示教中的关键信息和状态迁移,根据状态机构建奖励函数以提高学习效率;建立基于导纳控制的残差强化学习方法,通过残差强化学习来优化导纳控制装配策略,提高机器人装配的安全性。本发明专利技术结合了示教奖励状态机和残差强化学习的优势,既能够通过示教快速引导机器人完成任务,又能够通过强化学习实现机器人在复杂环境中的自主学习和适应性提升,同时通过导纳控制提高了系统的安全性。

【技术实现步骤摘要】

本专利技术属于智能制造的,具体涉及一种基于示教奖励状态机与残差强化学习的机器人装配学习方法


技术介绍

1、随着智能制造技术的发展,机器人被更多地应用于实际的生产应用中,特别是装配领域。现如今不仅要求机器人具有精准操作能力,而且要具有像人一样的学习适应能力以获取技巧性的关键技能,并可应对多种相似而不同的任务。深度强化学习可以赋予机器人类似人类一样的学习能力,将与环境交互的信息与智能决策相结合,使机器人能够在复杂环境中实现灵活、自主的任务执行,可以推动智能制造的创新与提升。最近一些研究表明深度强化学习算法存在限制,样本效率低、数据量要求大、训练时间长,在实际的部署应用中工作量大且繁琐。主要原因在于机器人在非结构化和不断变化的环境中探索空间大,维度高,现实中的训练过程并不稳定。

2、机器人示教技术一直是机器人应用的关键技术,已经成功地广泛地应用于机器人操作任务和连续控制的问题中。机器人示教技术的优势在于直观的操作方式、快速部署能力、灵活适应不同任务和环境、降低成本,并促进人机协作,使机器人系统更易学易用、具备广泛的应用潜力。最近的研究表明,机器人示本文档来自技高网...

【技术保护点】

1.基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述S0包括以下步骤:

3.根据权利要求1所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述S1包括以下步骤:

4.根据权利要求3所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述S11包括以下步骤:

5.根据权利要求3所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述S14包括以下步骤:</p>

6.根据...

【技术特征摘要】

1.基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述s0包括以下步骤:

3.根据权利要求1所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述s1包括以下步骤:

4.根据权利要求3所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述s11包括以下步骤:

5.根据权利要求3所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述s14包括以下步骤:

6.根...

【专利技术属性】
技术研发人员:肖睿宏占宏杨辰光
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1