一种抓取操作技能学习方法技术

技术编号:41824079 阅读:30 留言:0更新日期:2024-06-24 20:37
本发明专利技术公开了一种抓取操作技能学习方法,属于机器人抓取技术领域,本发明专利技术通过减少在任何给定情况下可用的行动数量来实现更快的计划,有助于从数据中更高效和精确地学习模型,且在基于深度Q网络的视觉推动抓取(VPG)模型基础上,通过为推动动作网络和抓取动作网络分别训练一个可供性的网络模型,能够限制不合理抓取位姿和无效推动操作的行为,有效地提升了学习的效率,更好地提升抓取效率和抓取成功率。

【技术实现步骤摘要】

本专利技术涉及机器人抓取,尤其涉及一种抓取操作技能学习方法


技术介绍

1、抓取是机器人领域最基本的问题之一,在分拣机器人、工业机器人、人机交互等诸多场景中有着重要的应用。近年来该问题引起了越来越多的关注。

2、传统的抓取方法通常应用于已知对象模型的环境中,这限制了对不同对象和场景的适应性。最近,研究人员将深度学习和强化学习应用到机器人抓取任务中,其中强化学习是一种通过智能体与环境交互来学习最佳行动策略的机器学习方法。它可以让机器人自监督地与环境进行信息交互,进而完成所设定的任务。现有的一些抓取模型能够实现某些场景的抓取任务,但它们在处理紧密堆叠的物体时抓取成功率不高,因为很难在物体上找到合适的抓取点并且夹持器很容易与抓取对象发生碰撞。因此,如何设计有效的策略来抓取紧密堆叠的物体仍然是一个挑战。

3、在现实生活中,对于堆叠物体的抓取,通常会将它们先推到相互分离的状态,然后再进行后续抓取工作,这样不但提高了效率而且也增加了抓取的成功率。因此如何将这两个任务建模成统一的多任务框架,实现推动和抓取的协同增效,一直是机器人抓取领域的热点。近本文档来自技高网...

【技术保护点】

1.一种抓取操作技能学习方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种抓取操作技能学习方法,其特征在于:所述步骤S1中,VPG模型采用两个深度Q网络来分别学习推动和抓取动作并输出各自的期望Q值。

3.根据权利要求1所述的一种抓取操作技能学习方法,其特征在于:所述步骤S3中,使用Huber损失函数进行迭代训练的公式为:

4.根据权利要求1所述的一种抓取操作技能学习方法,其特征在于:所述步骤S5中,具体步骤为:

【技术特征摘要】

1.一种抓取操作技能学习方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种抓取操作技能学习方法,其特征在于:所述步骤s1中,vpg模型采用两个深度q网络来分别学习推动和抓取动作并输出各自的期望q值。

<...

【专利技术属性】
技术研发人员:李东年温凯陈成军赵正旭
申请(专利权)人:青岛理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1