【技术实现步骤摘要】
本专利技术属于智能制造的,具体涉及一种基于示教奖励状态机与残差强化学习的机器人装配学习方法。
技术介绍
1、随着智能制造技术的发展,机器人被更多地应用于实际的生产应用中,特别是装配领域。现如今不仅要求机器人具有精准操作能力,而且要具有像人一样的学习适应能力以获取技巧性的关键技能,并可应对多种相似而不同的任务。深度强化学习可以赋予机器人类似人类一样的学习能力,将与环境交互的信息与智能决策相结合,使机器人能够在复杂环境中实现灵活、自主的任务执行,可以推动智能制造的创新与提升。最近一些研究表明深度强化学习算法存在限制,样本效率低、数据量要求大、训练时间长,在实际的部署应用中工作量大且繁琐。主要原因在于机器人在非结构化和不断变化的环境中探索空间大,维度高,现实中的训练过程并不稳定。
2、机器人示教技术一直是机器人应用的关键技术,已经成功地广泛地应用于机器人操作任务和连续控制的问题中。机器人示教技术的优势在于直观的操作方式、快速部署能力、灵活适应不同任务和环境、降低成本,并促进人机协作,使机器人系统更易学易用、具备广泛的应用潜力。最近
...【技术保护点】
1.基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述S0包括以下步骤:
3.根据权利要求1所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述S1包括以下步骤:
4.根据权利要求3所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述S11包括以下步骤:
5.根据权利要求3所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述S14包括以下步骤:<
...【技术特征摘要】
1.基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述s0包括以下步骤:
3.根据权利要求1所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述s1包括以下步骤:
4.根据权利要求3所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述s11包括以下步骤:
5.根据权利要求3所述的基于示教奖励状态机与残差强化学习的机器人装配方法,其特征在于,所述s14包括以下步骤:
6.根...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。