The invention discloses a method of robot imitation learning based on dynamic system model, which realizes robot imitation of teaching motion by learning. Specifically, the teaching motion is modeled as a non-linear dynamic system model through the Gauss mixture model, and the stability of the motion model is guaranteed by adding stability constraints. The parameter learning problem of the motion model is transformed into a constrained optimization problem to obtain a complete description of the motion model. Finally, the learning motion model is used as a control strategy to guide the robot to imitate the teaching motion. The method has good stability for teaching motion with fixed target points, converges all generated motion trajectories to target points, has good expressive ability for simple and complex teaching motion, and has good generalization ability of motion model, and can generate smooth and convergent motion trajectories outside the teaching motion range.
【技术实现步骤摘要】
一种基于动态系统模型的机器人模仿学习的方法
本专利技术属于人工智能和机器人控制领域,尤其涉及一种基于动态系统模型的机器人模仿学习的方法。
技术介绍
当前,在机器人技术的研究中,如何使机器人具备类似于人类的智能行为已成为一大研究热点。而从人类学习中发展而来的模仿学习,作为机器人直接获取知识和技能的方式之一,在机器人的智能性的提升方面愈来愈发挥出巨大的作用,越来越多地受到学术界的关注和研究。其主要在于,一方面,相对于传统的机器人编程控制,模仿学习将使得机器人编程更加容易,减少了对于操控人员的专业性要求,且大大提高了机器人的作业效率;另一方面,模仿学习赋予机器人获取知识和学习知识的能力,使其能够快速学习,并具备更高的智能性。对于机器人模仿学习,一般由三个过程组成:示教过程,学习过程,再现过程。目前,对于机器人模仿学习的研究,学术界和工业界主要集中在对学习过程的研究,而且已经出现了多种模仿学习的方法用来实现机器人的学习过程。这些方法主要分为三个大的类别,一是基于监督学习的方法,二是基于强化学习的方法,三是基于生成对抗网络的方法。这些方法的共同特点是,如何学习得到一个最优的控制策略,以此来指导机器人对于各种任务进行模仿或再现。虽然以上各种方法的出现解决了机器人模仿学习中的一些问题,但是对于机器人模仿学习,仍然存在着学习得到的运动模型或控制策略稳定性差、泛化能力差的问题,限制了机器人模仿学习的性能。具体表现在学习得到的运动模型并不能完全收敛到示教运动的目标点,对于示教运动范围外的空间缺乏足够的泛化能力,而且由于示教运动的复杂性,运动模型往往缺乏对于示教运动的表达能力。 ...
【技术保护点】
1.一种基于动态系统模型的机器人模仿学习的方法,其特征在于,具体步骤如下:步骤1、示教者通过手把手的方式指导机器人手臂完成一次或多次的示教运动,机器人由其内部的关节传感器记录示教运动过程中的关节角度变化情况,通过机械臂的正向运动学计算得到机械臂末端执行器的位置和速度变化信息;步骤2、通过高斯混合模型GMM将示教运动轨迹数据建模为一非线性动态系统模型;由GMM得到关于示教运动模型的参数化表示;步骤3、考虑所建模的运动模型的稳定性问题,基于李雅普诺夫稳定性理论,构造满足要求的李雅普诺夫函数,结合动态系统稳定性的条件求解模型在示教运动目标点全局稳定的约束;步骤4、在得到稳定性约束后,进行模型参数的学习;将所建模得到的参数化的运动模型的参数学习问题转化为求解一个约束优化问题,借助于非线性规划的方法求解约束优化问题,得到最优模型参数,进而得到对于运动模型的完整描述;步骤5、结合所构建的机器人模仿学习系统,将学习得到的运动模型作为机器人的控制策略指导其完成对于示教运动的模仿。
【技术特征摘要】
1.一种基于动态系统模型的机器人模仿学习的方法,其特征在于,具体步骤如下:步骤1、示教者通过手把手的方式指导机器人手臂完成一次或多次的示教运动,机器人由其内部的关节传感器记录示教运动过程中的关节角度变化情况,通过机械臂的正向运动学计算得到机械臂末端执行器的位置和速度变化信息;步骤2、通过高斯混合模型GMM将示教运动轨迹数据建模为一非线性动态系统模型;由GMM得到关于示教运动模型的参数化表示;步骤3、考虑所建模的运动模型的稳定性问题,基于李雅普诺夫稳定性理论,构造满足要求的李雅普诺夫函数,结合动态系统稳定性的条件求解模型在示教运动目标点全局稳定的约束;步骤4、在得到稳定性约束后,进行模型参数的学习;将所建模得到的参数化的运动模型的参数学习问题转化为求解一个约束优化问题,借助于非线性规划的方法求解约束优化问题,得到最优模型参数,进而得到对于运动模型的完整描述;步骤5、结合所构建的机器人模仿学习系统,将学习得到的运动模型作为机器人的控制策略指导其完成对于示教运动的模仿。2.根据权利要求1所述的一种基于动态系统模型的机器人模仿学习的方法,其特征在于:步骤1中通过示教者对机器人进行运动的示教,由其内部的关节传感器记录示教运动过程中的关节角度变化情况,通过机械臂的正向运动学计算得到机械臂末端执行器的位置和速度变化信息,记为示教运动轨迹数据集其中ζ表示位置,表示速度,t表示时间,N=1,2,3,......表示示教运动轨迹的条数。3.根据权利要求1所述的一种基于动态系统模型的机器人模仿学习的方法,其特征在于,步骤2具体如下:给定一组N条示教运动轨迹数据的集合GMM由以下概率密度函数表示:以上两式中GP(·)是高斯过程概率密度函数,K为GMM中混合模型的个数,ωk是第k个高斯过程的权重,且μk为该密度函数的均值向量,Σk为对应的协方差矩阵;对于给定ζ,的条件概率分布是:其中N(·)同样是服从高斯分布的概率密度函数,表示第k个高斯分布的情况,为对应的均值向量,为对应的方差矩阵,而且有公式(4)(5)中Σζζk分别是变量和变量ζ的方差矩阵,是变量与ζ之间的协方差矩阵,和μζk分别表示为对应于和ζ的均值向量,而且以上均表示为第k个高斯分布时的情况;由公式(3),对应于ζ的条件概率可定义而且有其中变量i与k表示的含义相同;由公式(6)的...
【专利技术属性】
技术研发人员:于建均,姚红柯,阮晓钢,安硕,王洋,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。