一种基于任务嵌入网络的机械臂模仿学习的方法技术

技术编号:26971432 阅读:15 留言:0更新日期:2021-01-06 00:02
本发明专利技术属于人工智能和机器人控制领域,特别涉及一种基于任务嵌入网络的机械臂模仿学习的方法,包括:创建示教任务数据集;构建任务嵌入网络,学习示教任务的任务原型;构建深度神经网络,以拼接后的机械臂示教任务演示视频为输入,输出机械臂的动作值;对所构建的任务嵌入网络和深度神经网络进行联合训练,训练得到示教任务模型;结合所搭建的机械臂虚拟仿真环境,将示教任务模型作为机械臂的控制策略指导机械臂完成对于示教任务的模仿。本发明专利技术可以解决目前模仿学习方法需要巨量的训练集和试错、正确率较低、缺乏足够的泛化能力、容易遗忘先前学会的示教任务的缺陷。

【技术实现步骤摘要】
一种基于任务嵌入网络的机械臂模仿学习的方法
本专利技术属于人工智能和机器人控制领域,特别涉及一种基于任务嵌入网络的机械臂模仿学习的方法。
技术介绍
当前,机器人技术在诸多行业都得到了广泛的应用。机械臂作为机器人最主要的执行机构,近年来越来越多的工程技术人员对它展开了各种研究。随着人工智能技术的飞速发展,模仿学习机制的提出为机械臂注入了新鲜血液,在机械臂的智能性的提升方面发挥出巨大的作用。一方面,相对于传统的机械臂编程控制,模仿学习使得机械臂能够模仿示教任务的行为实现快速学习,减少了对于操控人员的专业性要求,具有更高的工作效率。另一方面,模仿学习使得机械臂能够获取环境信息,不依赖于先前规划的动作轨迹进行重复运动,具有更完善的环境感知能力和适应能力,并具备更高的智能性。对于机械臂模仿学习,一般由示教者、学习器和执行器三个模块组成。机械臂通过行为观测和感知,获取示教者的示教信息,通过模仿学习算法将示教信息和模仿者自身特征结合完成模仿。目前,对于机械臂模仿学习的研究,主要集中在学习器的研究,分为两个趋势:一是低水平学习;二是高水平学习。在和其他本文档来自技高网...

【技术保护点】
1.一种基于任务嵌入网络的机械臂模仿学习的方法,其特征在于,包括如下步骤:/nS1:搭建机械臂虚拟仿真环境并操控机械臂完成多种示教任务,创建示教任务数据集;/nS2:构建任务嵌入网络,所述任务嵌入网络以示教任务为输入,输出任务组合嵌入,所述任务组合嵌入与任务遍历模块输出的特征掩码相乘,得到示教任务的任务原型;/nS3:构建深度神经网络,所述深度神经网络以拼接后的示教任务演示视频为输入,输出机械臂的动作值,所述拼接后的示教任务演示视频通过将所述任务原型平铺并按通道和示教任务演示视频拼接后得到;/nS4:基于步骤S1中创建的示教任务数据集,使用监督学习训练方法对所构建的任务嵌入网络和深度神经网络进...

【技术特征摘要】
1.一种基于任务嵌入网络的机械臂模仿学习的方法,其特征在于,包括如下步骤:
S1:搭建机械臂虚拟仿真环境并操控机械臂完成多种示教任务,创建示教任务数据集;
S2:构建任务嵌入网络,所述任务嵌入网络以示教任务为输入,输出任务组合嵌入,所述任务组合嵌入与任务遍历模块输出的特征掩码相乘,得到示教任务的任务原型;
S3:构建深度神经网络,所述深度神经网络以拼接后的示教任务演示视频为输入,输出机械臂的动作值,所述拼接后的示教任务演示视频通过将所述任务原型平铺并按通道和示教任务演示视频拼接后得到;
S4:基于步骤S1中创建的示教任务数据集,使用监督学习训练方法对所构建的任务嵌入网络和深度神经网络进行联合训练,训练得到示教任务模型;
S5:结合所搭建的机械臂虚拟仿真环境,将步骤S4中得到的示教任务模型作为机械臂的控制策略,指导机械臂完成对于示教任务的模仿。


2.根据权利要求1所述的方法,其特征在于,步骤S1中,所述示教任务数据集包括机械臂的观测值和动作值,所述观测值包括从机械臂虚拟仿真环境中导出的示教任务演示视频,所述动作值包括示教任务过程中机械臂的关节角度、关节速度和末端执行器姿态变化情况。


3.根据权利要求1所述的方法,其特征在于,步骤S2中,构建任务嵌入网络并输出任务组合嵌入具体过程为:从一个示教任务中采样得到K个样本,使用三个卷积层和三个全连接层构建任务嵌入网络fθ:RD→RN,RD、RN分别代表D维欧氏空间和N维欧氏空间;利用任务嵌入网络fθ:RD→RN为每一个样本计算一个标准化N维向量,然后通过取样本向量的标...

【专利技术属性】
技术研发人员:雷小永周继祥赵永嘉谢建峰戴树岭
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1