一种基于深度强化学习的机器人抓取方法技术

技术编号：20996994 阅读：28 留言：0更新日期：2019-04-30 19:58

本发明专利技术涉及机器人技术领域，特别是涉及一种基于深度强化学习的机器人抓取方法。其中，基于深度强化学习的机器人抓取方法包括：获取环境状态参数与预设抓取模型；根据环境状态参数，从预设抓取模型中遍历出最优抓取策略；根据最优抓取策略，控制机器人抓取物料。一方面，其无需视觉标定，便可以控制机器人抓取物料，因此，其能够降低设计难度。另一方面，其能够选择最优抓取策略控制机器人抓取物料，从而提高抓取精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度强化学习的机器人抓取方法
本专利技术涉及机器人
，特别是涉及一种基于深度强化学习的机器人抓取方法。
技术介绍
当前，多数机器人空间抓取技术都是基于传统3d视觉算法，抓取物料时，需要用到复杂的机器人视觉标定方法与视觉建模方法，并且，对操作人员需要较高的技术背景。
技术实现思路
本专利技术实施例提供了一种基于深度强化学习的机器人抓取方法，其无需视觉标定便准确地抓取物料。为解决上述技术问题，本专利技术实施例采用的一个技术方案是：提供一种基于深度强化学习的机器人抓取方法，所述方法包括：获取环境状态参数与预设抓取模型；根据所述环境状态参数，从所述预设抓取模型中遍历出最优抓取策略；根据所述最优抓取策略，控制所述机器人抓取物料。可选地，所述根据所述环境状态参数，从所述预设抓取模型中遍历出最优抓取策略，包括：根据预设动态规划方程及所述环境状态参数，从所述预设抓取模型中遍历出最优抓取策略。可选地，所述根据所述最优抓取策略，控制所述机器人抓取物料，包括：接收抓取指令，所述抓取指令包括相对位移与夹爪状态参数；根据所述相对位移与夹爪状态参数，控制所述机器人的夹爪抓取物料放置于预设位置。可选地，所述夹爪状态参数包括张开抓取参数与关闭抓取参数；所述根据所述相对位移与夹爪状态参数，控制所述机器人的夹爪抓取物料放置于预设位置，包括：若所述夹爪状态参数为张开抓取参数，则控制所述机器人的夹爪按照所述相对位移移动至所述物料并抓取所述物料；若所述夹爪状态参数为关闭抓取参数，则控制所述机器人的夹爪将所述物料放置于预设位置。可选地，所述控制所述机器人的夹爪将所述物料放置于预设位置，包括...

【技术保护点】
1.一种基于深度强化学习的机器人抓取方法，其特征在于，所述方法包括：获取环境状态参数与预设抓取模型；根据所述环境状态参数，从所述预设抓取模型中遍历出最优抓取策略；根据所述最优抓取策略，控制所述机器人抓取物料。

【技术特征摘要】
1.一种基于深度强化学习的机器人抓取方法，其特征在于，所述方法包括：获取环境状态参数与预设抓取模型；根据所述环境状态参数，从所述预设抓取模型中遍历出最优抓取策略；根据所述最优抓取策略，控制所述机器人抓取物料。2.根据权利要求1所述的方法，其特征在于，所述根据所述环境状态参数，从所述预设抓取模型中遍历出最优抓取策略，包括：根据预设动态规划方程及所述环境状态参数，从所述预设抓取模型中遍历出最优抓取策略。3.根据权利要求2所述的方法，其特征在于，所述根据所述最优抓取策略，控制所述机器人抓取物料，包括：接收抓取指令，所述抓取指令包括相对位移与夹爪状态参数；根据所述相对位移与夹爪状态参数，控制所述机器人的夹爪抓取物料放置于预设位置。4.根据权利要求3所述的方法，其特征在于，所述夹爪状态参数包括张开抓取参数与关闭抓取参数；所述根据所述相对位移与夹爪状态参数，控制所述机器人的夹爪抓取物料放置于预设位置，包括：若所述夹爪状态参数为张开抓取参数，则控制所述机器人的夹爪按照所述相对位移移动至所述物料并抓取所述物料；若所述夹爪状态参数为关闭抓取参数，则控制所述机器人的夹爪将所述物料放置于预设位置。5.根据权利要求4所述的方法，其特征在于，所述控制所述机器人的夹爪将所述物料放置于预设位置，包括：接收物料提起指令；根据所述物料提起指令，控制所述机器人的夹爪提起所述物料，并将所述物料放置于预设位置。6.根据权利要求1至5任一项所述的方法，其特征在于，所述环境状态参数包括：抓取物料...

【专利技术属性】
技术研发人员：黄睿，郎需林，刘培超，林俊凯，林炯辉，
申请(专利权)人：深圳市越疆科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人