当前位置: 首页 > 专利查询>复旦大学专利>正文

基于感知增强和场景迁移的深度强化学习机器人抓取方法技术

技术编号:32548966 阅读:55 留言:0更新日期:2022-03-05 11:48
本发明专利技术公开了一种基于感知增强和场景迁移的深度强化学习机器人抓取方法,主要涉及智能机器人领域;包括步骤:S11、通过RGB

【技术实现步骤摘要】
基于感知增强和场景迁移的深度强化学习机器人抓取方法


[0001]本专利技术涉及智能机器人领域,具体是基于感知增强和场景迁移的深度强化学习机器人抓取方法。

技术介绍

[0002]机器人抓取技术就是借助机械臂和夹爪将目标对象抓取起来,它是许多机器人任务的基础,是很多操作的前提环节。许多工业场景中都离不开抓取,比如在码垛中需要先将对象抓取起来才能进行堆放,在分拣中需要先将对象抓取起来才能进行分类放置,在装配中需要先将零件抓取起来才能进行组装。
[0003]目前,工业上应用的比较多的机器人抓取算法是通过模板匹配的方法,具体流程是首先对要抓取的对象建立CAD模型,将所有的CAD模型保存起来形成模板数据库,然后扫描抓取环境得到场景点云数据,使用模板在场景点云中通过特征信息进行匹配,得到抓取对象的位姿,这种方法多用于目标物体单一的情况,如果要抓取的对象种类繁多,将难以保证模板匹配准确性。面对非结构化环境的复杂性,人工智能技术的发展为机器人抓取提供新思路,基于深度学习的机器人抓取技术主要是标注一些带有正确位姿标签的数据,通过深度学习网络进行有监督训练,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于感知增强和场景迁移的深度强化学习机器人抓取方法,其特征在于:首先进行仿真环境训练,获得算法模型,然后再进行真实环境应用;所述仿真环境训练包括步骤:S11、通过RGB

D相机获取场景信息作为状态;S12、通过DenseNet提取特征;S13、通过感知增强模块对抓取对象特征增强;S14、变换得到动作空间Q表,执行Q值最大的动作;S15、判定是否抓取成功,如果抓取成功则给予奖励,否则给予惩罚,并进行模型更新;所述真实环境应用包括步骤:S21、通过RGB

D相机获取场景信息作为状态;S22、通过场景迁移模块,将真实抓取场景变换成仿真风格的场景;S23、载入仿真环境训练好的模型;S24、通过DenseNet提取特征;S25、通过感知增强模块对抓取对象特征增强;S26、变换得到动作空间Q表,执行Q值最大的动作。2.根据权利要求1所述的基于感知增强和场景迁移的深度强化学习机器人抓取方法,其特征在于:所述步骤S11和S21中,将通过RGB

D相机拍摄的RGB

D图像进行正交变换并根据工作区域得到224
×
224尺寸的RGB

D俯视图像,以此作为状态输送给算法模型。3.根据权利要求1所述的基于感知增强和场景迁移的深度强化学习机器人抓取方法,其特征在于:所述步骤S13和S25中,感知增强模块包括DenseNet卷积网络、基于正弦相似度的感知增强模块以及全卷积网络,在进行特征增强时,首先将实际抓取场景的RGB

D图送入DenseNet卷积网络进行特征提取,得到特征矩阵(1
×
2048<...

【专利技术属性】
技术研发人员:杨子鹏商慧亮
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1