【技术实现步骤摘要】
一种基于模仿学习的服务机器人指定物体抓取算法
[0001]本专利技术涉及机器人模仿学习的
,特别涉及一种基于模仿学习的服务机器人指定物体抓取算法。
技术介绍
[0002]抓取是人类最普遍的日常活动之一,让服务机器人学会如何在复杂非结构化场景中鲁棒的抓取指定物体具有极高的应用价值。目前很多机械臂抓取应用都是基于编程或者拖动示教等方法实现的。基于编程的方法对于没有专业知识的普通用户而言十分不友好,不利于服务机器人的推广;基于拖动示教的方法泛化性能弱,只能不断重复之前示范的轨迹。上述方法均无法便捷、高效地赋予服务机器人在复杂非结构化场景中抓取指定物体的能力。
技术实现思路
[0003]针对现有技术中存在的不足之处,本专利技术的目的是提供一种基于模仿学习的服务机器人指定物体抓取算法,服务机器人可以更加快速和鲁棒地学会在复杂非结构化场景中抓取指定物体。为了实现根据本专利技术的上述目的和其他优点,提供了一种基于模仿学习的服务机器人指定物体抓取算法,包括:
[0004]S1、收集人类专家抓取指定物体的示范数据 ...
【技术保护点】
【技术特征摘要】
1.一种基于模仿学习的服务机器人指定物体抓取算法,其特征在于,包括以下步骤:S1、收集人类专家抓取指定物体的示范数据;S2、通过收集到人类专家示范数据训练动作识别网络和物体识别网;S3、在复杂非结构化环境中进行强化学习训练。2.如权利要求1所述的一种基于模仿学习的服务机器人指定物体抓取算法,其特征在于,步骤S1中示范数据收集过程中在初始场景的RGB图像上,指定目标物体,人类专家依次抓取场景中的所有物体,收集轨迹,作为训练动作识别网络的正例,同时收集一些人类专家在场景中随意挥动手臂的轨迹作为负例。3.如权利要求2所述的一种基于模仿学习的服务机器人指定物体抓取算法,其特征在于,将动作识别网络的正例的轨迹作为物体识别网络的训练数据,同一场景下,人类专家抓取物体与目标物体一致的轨迹为正例,不一致的轨迹为负例。4.如权利要求3所述的一种基于模仿学习的服务机器人指定物体抓取算法,其特征在于,步骤S2中对于动作识别网络,网络的输入中的序列轨迹图像为D1,其中人类专家抓取物体的轨迹为正例,人类专家随意挥动手臂的轨迹为负例,动作...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。