【技术实现步骤摘要】
一种多模异构信息融合的机器人装配技能学习方法及系统
本专利技术涉及机器人技能学习领域,尤其涉及一种多模异构信息融合的机器人装配技能学习方法及系统。
技术介绍
机器人装配技能学习是目前人工智能在机器人领域的重点与难点。由于该装配过程具有复杂动态的环境、形状各异的操作对象、物体相对状态转移频繁等特点,造成不确定性因素尤其明显,对机器人操作的灵活性和智能性提出了更高的要求。传统机器人装配作业通常是依靠人类示教再现或离线编程的方式完成,在特定场景下简单形状的部件装配工作中已经取得一定成效,然而该方法难以满足于柔性制造下环境复杂、精度要求高的装配任务,制约着机器人的应用。近年来,随着深度学习技术的不断突破,能够为机器人提供更准确的环境感知信息,并结合强化学习形成了深度强化学习,已被广泛应用于机器人抓取、路线规划、推拉等简单操作任务,并在工业、物流等领域取得不错的表现,但是在机器人装配上依然是极具挑战性的任务。目前,为解决机器人自主装配任务这一问题,基于深度强化学习的机器人装配技能学习方法也逐渐被提出来,例如国外哈佛大学采用深度 ...
【技术保护点】
1.一种多模异构信息融合的机器人装配技能学习方法,其特征在于,所述方法包括:/n对机器人进行初始化启动,采集所述机器人的各类感知信息;/n基于神经网络模型对所述各类感知信息进行多模异构融合处理,生成融合特征向量输出;/n将所述融合特征向量导入深度强化学习算法中进行训练,获取所述机器人的最新动作指令;/n利用阻抗控制器对所述最新动作指令进行响应,生成位姿控制信号,并通过所述位姿控制信号控制所述机器人完成装配任务。/n
【技术特征摘要】
1.一种多模异构信息融合的机器人装配技能学习方法,其特征在于,所述方法包括:
对机器人进行初始化启动,采集所述机器人的各类感知信息;
基于神经网络模型对所述各类感知信息进行多模异构融合处理,生成融合特征向量输出;
将所述融合特征向量导入深度强化学习算法中进行训练,获取所述机器人的最新动作指令;
利用阻抗控制器对所述最新动作指令进行响应,生成位姿控制信号,并通过所述位姿控制信号控制所述机器人完成装配任务。
2.根据权利要求1所述的多模异构信息融合的机器人装配技能学习方法,其特征在于,所述各类感知信息包括力矩信息、视觉信息、本体位姿信息和装配过程中的声音信息。
3.根据权利要求2所述的多模异构信息融合的机器人装配技能学习方法,其特征在于,所述基于神经网络模型对所述各类感知信息进行多模异构融合处理,生成融合特征向量输出包括:
从所述力矩信息中提取出最新的32个数据作为32×6的时间序列,并以2个步长为基准对所述时间序列进行五层因果卷积,输出第一特征向量;
利用六层卷积神经网络对所述视觉信息进行编码输出128×128×3的RGB图像,并利用全连接层将所述RGB图像激活转换为第二特征向量;
利用双隐含层多层感知器对所述本体位姿信息进行编码输出第三特征向量,且所述本体位姿信息包括所述机器人末端执行器的当前位置信息与当前速度信息;
利用支持向量机对所述声音信息进行编码输出第四特征向量;
基于双隐含层多层感知器将所述第一特征向量、所述第二特征向量、所述第三特征向量和所述第四特征向量进行相互连接,形成融合特征向量。
4.根据权利要求1所述的多模异构信息融合的机器人装配技能学习方法,其特征在于,所述将所述融合特征向量导入深度强化学习算法中进行训练,获取所述机器人的最新动作指令包括:
对所述深度强化学习算法中的相关参数值进行初始化,其中所述相关参数值包括动作网络的参数值与评价网络的参数值;
将所述融合特征向量导入所述评价网络中进行参数值更新,并计算所述评价网络的当前策略梯度信息;
结合所述当前策略梯度信息对所述动作网络的损失函数进行更新,再将所述融合特征向量导入所述动作网络中进行参数值更新,以输出所述机器人的最新动作指令。
5.根据权利要求1所述的多模异构信息融合的机器人装配技能学习方法,其特征在于,所述利用阻抗控制器对所述最新动作指令进行响应,生成位姿控制信号包括:
利用所述阻抗控制器模拟出一个机械弹簧阻尼系统,并将所述最新动作指令输入所述机械弹簧阻尼系统进行指令解析;
基于逆向动力学理论将解析结果转换为所述机器人...
【专利技术属性】
技术研发人员:吴鸿敏,程韬波,苏乾鑫,周雪峰,徐智浩,鄢武,
申请(专利权)人:广东省科学院智能制造研究所,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。