【技术实现步骤摘要】
机器人控制装置和用于控制机器人的方法
不同的实施例总体涉及机器人控制装置和用于控制机器人的方法。
技术介绍
例如在生产设施中,操作任务非常重要。在此,基本任务是,将机器人的操作机(例如夹具)开动到预先给定的目标状态中。机器人在此包括一系列被链接的关节,这些关节具有不同的自由度(针对英语DegreesOfFreedom的DOF)。存在不同的方案来解决该问题。基于强化学习(Reinforcement-Learning)方法的神经网络是用于控制一般自主的系统的可能性,所述神经网络也可以被用于控制多关节的机器人方法。在机器人控制中,大多使用显式坐标系(例如笛卡尔坐标或者球坐标),用于描述空间系统状态。A.Banino等人的出版物“Vector-basednavigationusinggrid-likerepresentationsinartificialagents”(Nature,2018年)描述了以生物学方式来激励的神经网络的应用,为了表示空间坐标,所述神经网络使用所谓的位置细胞(Place-Zellen)和网格 ...
【技术保护点】
1.一种针对多关节机器人的机器人控制装置,所述机器人具有多个被链接的机器人连杆,所述机器人控制装置具有:/n多个递归神经网络;/n输入层,所述输入层设立为,给每个递归神经网络输送针对相应的机器人连杆的相应运动信息,/n其中每个递归神经网络都训练来,从输送给所述每个递归神经网络的运动信息中确定所述相应的机器人连杆的位置状态,并且输出所述位置状态;和/n神经控制网络,所述神经控制网络训练来,从由所述递归神经网络输出的和作为输入量输送给所述神经控制网络的位置状态中,确定针对所述机器人连杆的控制量。/n
【技术特征摘要】
20200109 DE 102020200165.01.一种针对多关节机器人的机器人控制装置,所述机器人具有多个被链接的机器人连杆,所述机器人控制装置具有:
多个递归神经网络;
输入层,所述输入层设立为,给每个递归神经网络输送针对相应的机器人连杆的相应运动信息,
其中每个递归神经网络都训练来,从输送给所述每个递归神经网络的运动信息中确定所述相应的机器人连杆的位置状态,并且输出所述位置状态;和
神经控制网络,所述神经控制网络训练来,从由所述递归神经网络输出的和作为输入量输送给所述神经控制网络的位置状态中,确定针对所述机器人连杆的控制量。
2.根据权利要求1所述的机器人控制装置,其中,每个递归神经网络都训练来,确定呈网格编码图示的所述位置状态;并且所述神经控制网络训练来,处理呈所述网格编码图示的所述位置状态。
3.根据权利要求1或者2所述的机器人控制装置,其中,每个递归神经网络都具有神经网格细胞集合,并且每个递归神经网络和相应的网格细胞集合都训练为使得,所述相应的机器人连杆的所确定的位置状态越靠近与每个网络细胞关联的空间网格的网格点,针对所述网格的每个网格细胞就越活跃。
4.根据权利要求3所述的机器人控制装置,其中,对于每个递归神经网络,所述神经网格细胞集合具有多个如下网格细胞:所述网格细胞与在空间上不同地定向的网格关联。
5.根据权利要求1至4中任一项所述的机器人控制装置,其中,所述递归神经网络是长短期记忆网络和/或门控递归单元网络。
6.根据权利要求1至5中任一项所述的机器人控制装置,其中,所述多个递归神经网络具有如下递归神经网络:该递归神经网络训练来,确定和输出所述机器人控制装置的终端执行器的位置状态;并且所述多个递归神经网络具有如下至少...
【专利技术属性】
技术研发人员:V·费舍尔,
申请(专利权)人:罗伯特·博世有限公司,
类型:发明
国别省市:德国;DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。