飞行机器人位姿神经网络预测控制器制造技术

技术编号:13864724 阅读:156 留言:0更新日期:2016-10-19 18:41
本发明专利技术公开了一种飞行机器人位姿神经网络预测控制器,特别适用于多旋翼飞行机器人的位姿控制。控制器包括:滚动优化器、神经网络预测模型、逆神经网络模型、延迟环节、反馈环节、加法比较器、减法比较器;控制器使用神经网络对飞行机器人动态过程进行建模、预测;使用逆神经网络确定迭代优化算法的初值;采用牛顿-拉夫逊算法进行局部优化;控制器还具有反馈控制功能。相比于机理建模,神经网络模型具有更高的精度,基于此模型的预测控制具有更高的控制性能;采用了目标函数优化的方法,能在保证控制性能的前提下尽量减少电能消耗;与PID控制相比,控制超调小,控制效果更加平稳;与滑模控制相比,不会产生抖震问题。

【技术实现步骤摘要】

本专利技术涉及一种飞行机器人的位姿控制器,特别是用于多旋翼飞行机器人的位姿控制器,属于机器人

技术介绍
飞行机器人一般是指搭载了各种传感器,具有一定感知力和智能的无人驾驶飞行器。最近几年,随着科学技术的发展,已经相继有一些飞行机器人的成功应用案例,例如,加拿大沃特卢的艾伦(Aeryon)实验室研制Scout是一种会令犯罪分子感到恐惧的新型飞行机器人,可取代监控摄像头;在日本,飞行机器人帮助农民管理稻田,监测谷物生长,播撒农药;在非洲,带有摄像机的飞行机器人追踪捕杀野生动物的人。当前,各行业对飞行机器人的需求量较大,有专家预测2015年后,飞行机器人的商业应用将出现爆炸性地增长,广阔地应用前景也促进了飞行机器人技术的研究,由于目前飞行机器人一般采用多旋翼飞行器,因此对多旋翼飞行器的控制技术研究成为热点;多旋翼飞行器属于多输入、多输出、具有强耦合、滞后等的非线性控制系统,机理建模大多使用牛顿-欧拉方程,这种模型往往存在失配度较高的问题;对多旋翼飞行器的控制,目前使用最多的仍然是PID控制,由于PID控制本质上是根据已经产生的误差来实现控制的,因此难以在误差产生前就给出一个用于消除误差的控制量,控制精度并不高;有文献提出采用滑模控制,但是滑模控制所存在的“抖震”问题难以解决;也有文献提出了预测控制,但是由于所使用模型存在失配度较高问题,控制效果并不理想。另外,由于飞行机器人都是采用电池供电,而电池又都较重,因此,电池的持续工作时间一直是飞行机器人技术的瓶颈,如何在保证控制精度的前提下,最大程度地减少电能消耗也是控制中存在的较大问题,而PID控制及滑模控制难以解决这个问题。在各种智能控制方法中,模型预测控制(MPC)来源于工业实践,是基于预测模型的有限时域优化控制。近年来MPC获得了广泛应用,但从应用对象来看,主要还限于线性或准线性过程,造成这一现象主要是由于在非线性机理建模要耗费很大代价,而且很难得到准确的模型。人工神经网络能够充分逼近复杂的非线性映射关系,具有学习与适应不确定系统的动态特性和较强的鲁棒性和容错性的特点,这使得其成为对非线性系统建立预测模型和优化控制的关键技术之一。如果将人工神经网络与预测控制算法相结合就能够得到适用于非线性系统控制的神经网络预测控制。
技术实现思路
本专利技术公开了一种飞行机器人位姿神经网络预测控制器,特别适用于多旋翼飞行机器人的位姿控制;主要目的是解决飞行机器人的较精确建模问题,以及在保证控制性能前提下减少电能消耗的问题。本专利技术所采用的技术方案是:选用神经网络对机器人的动态过程进行建模,通过调节神经网络的权值来逼近该非线性过程;通过智能控制中的预测控制方法,基于建立的神经网络模型来实现预测控制,滚动优化采用牛顿-拉夫逊算法以提高算法的实时性,算法的初始值选取由逆神经网络完成;根据实际测量输出位姿参数与预测值的比较实现反馈校正。飞行机器人的动态过程用离散非线性方程可表示为: w(k+1) = f(u(k),u(k-1),…,u(k-nu+1),w(k) ,w(k-1),…,w(k-nw+1))其中:w(k+1),w(k) ,w(k-1),…,w(k-nw+1)分别表示第k+1,k,k-1,…,k-nw+1时刻飞行机器人的位姿参数值;u(k),u(k-1),…,u(k-nu+1)分别表示第k,k-1,…,k-nu+1时刻飞行机器人的控制量值;nw, nu分别表示延迟的阶数,这些数值都可以通过实验的方法测得;函数f表示一个未知的非线性映射关系。 将Rp=[u(k),u(k-1),…,u(k-nu+1),w(k),w(k-1),…,w(k-nw+1)]作为神经网络的输入,将w(k+1)作为神经网络的输出,只需根据以上测量的数值训练神经网络,就可以确定神经网络的权值,从而确定一个神经网络使得该神经网络能够逼近飞行机器人的动态特性。对飞行机器人的控制器而言,在第k时刻,u(k-1),…,u(k-nu+1), w(k) ,w(k-1),…,w(k-nw+1)显然都是已知的常数,此时,只要给出一个控制量u(k),利用该神经网络就可以计算出下一个时刻的位姿参数w(k+1),所以,这个训练好的神经网络就可以作为一个飞行机器人位姿的预测模型。为了实现在保证控制性能前提下减少电能消耗的目的,技术上可以采用滚动优化的方法,优化的目标函数确定为: J = (wm(k+1)–wr’(k+1))2+λu(k)2式中:wm(k+1)表示由神经网络模型预测的k+1时刻的位姿值,wr’(k+1)表示经校正后外部输入的参考位姿值,(wm(k+1)–wr’(k+1))2的值越小,控制性能就越好,u(k)2的值越小,则消耗的电能就越少,λ为权重因子,用于在控制性能与电能消耗之间进行折中。目标函数的最小值,对应着能够在保证控制性能前提下减少电能消耗的最优控制量。为保证控制系统的实时性,对目标函数的寻优采用一种局部数值优化算法即牛顿-拉夫逊算法,其迭代公式为: 式中:u(k)j+1,u(k)j分别表示第j+1次和第j次迭代的控制量,右边最后一项的分子表示目标函数J对控制量u(k)的一阶偏导数在u(k)=u(k)j时的取值,分母表示目标函数J对控制量u(k)的二阶偏导数在u(k)=u(k)j时的取值。由迭代公式知,迭代需要设定一个初始值即u(k)0,最为理想的方案是选取具有最优控制性能的控制量为初始值,这样做的好处是可以防止算法落入其它极小值,从而保证系统的控制性能;为此,可以采用一个逆神经网络来实现,飞行机器人的逆动态过程可表示为离散非线性方程: u(k) = g(u(k-1),…,u(k-nu+1), w(k+1),w(k) ,w(k-1),…,w(k-nw+1))其中:函数g表示f的逆非线性映射关系;此时只要将Ri=[ u(k-1),…,u(k-nu+1),wr’(k +1),w(k), w(k-1),…,w(k-nw+1)]作为神经网络的输入,将u(k)作为神经网络的输出,wr’(k+1)取为实验数据w(k+1),就仍然可以利用实验测量的数据来训练逆神经网络,这样神经网络的输出能够使得wm(k+1) = wr’(k+1),所以对应着最优的控制性能。反馈校正部分利用预测位姿值与实际检测值得到误差来实现,k时刻的误差为w(k)-wm(k),校正后为:e=δ(w(k)-wm(k)),其中δ为反馈校正系数;反馈校正的实现通过修正参考输入来实现,设k时刻外部参考输入为wr(k +1),则校正后的参考输入为:wr’(k+1) = wr (k+1)+ δ(w(k)-wm(k))。对延迟的阶数nw, nu,其实现方案采用利用存储器的方法,例如对nu阶延迟,使用nu个存储单元,在第k 采样时刻,分别存储第k,k-1,…,k-nu+1个采样时刻的值,在第k+1 采样时刻,更新存储单元为k+1→k,k→k-1,…, k-nu+2→k-nu+1,丢弃第k-nu+1时刻的值。综上所述,飞行机器人神经网络预测控制器通过以下步骤完成:第一步:初始化。第二步:反馈校正。第三步:计算滚动优化的初始值。第四步:根据牛顿-拉夫逊迭代公式进行滚动优化得到最优控制量。第五步:用上一步得到的最优控制量进行控本文档来自技高网
...

【技术保护点】
飞行机器人位姿神经网络预测控制器,包括:滚动优化器、神经网络预测模型、逆神经网络模型、nu阶延迟环节、nw阶延迟环节、一阶延迟环节、反馈环节、加法比较器、减法比较器;神经网络预测控制器使用神经网络预测模型对飞行机器人动态过程进行建模、预测;使用逆神经网络确定迭代优化算法的初值;采用牛顿‑拉夫逊算法进行优化;控制器具有反馈控制功能。

【技术特征摘要】
1.飞行机器人位姿神经网络预测控制器,包括:滚动优化器、神经网络预测模型、逆神经网络模型、nu阶延迟环节、nw阶延迟环节、一阶延迟环节、反馈环节、加法比较器、减法比较器;神经网络预测控制器使用神经网络预测模型对飞行机器人动态过程进行建模、预测;使用逆神经网络确定迭代优化算法的初值;采用牛顿-拉夫逊算法进行优化;控制器具有反馈控制功能。2.根据权利要求1,所述的滚动优化器,其特征是优化的目标函数确定为J = ( wr’(k+1)- wm(k+1))2+λu(k) 2,其中,wr’(k+1)、wm(k+1)分别为第k+1采样时刻的校正后参考位姿和预测位姿,位姿参数为w(k+1) = [ψ(k+1), φ(k+1),θ(k+1)],ψ(k+1),φ(k+1),θ(k+1)分别为k+1时刻的偏航角、横滚角、俯仰角,u(k)为第k采样时刻的控制量;采用牛顿-拉夫逊算法进行局部优化,其迭代公式为:式中:u(k)j+1, u(k)j分别表示第j+1次和第j次迭代的控制量,右边最后一项的分子表示目标函数J对控制量u(k)的一阶偏导数在u(k)= u(k)j时的取值,分母表示目标函数J对控制量u(k)的二阶偏导数在u(k)= u(k)j时的取值;迭代终止条件为:︱u(k)j+1 -u(k)j︱< α,α为一个较小的正常数;为保证算法的实时性,设置最大迭代次数ξ,若迭代次数高于该值,则终止迭代过程;迭代完成后最优控制量按公式u*(k) = (u(k)j+1 + u(k)j) / 2得到。3.根据权利要求1,所述的神经网络预测模型及逆神经网络模型,其特征是包含输入向量、输入层偏置向量、输入权值矩阵、累加器、神经元激活函数、输出层偏置向量、输出权值矩阵、输出向量;神经元激活函数使用sigmoid函数:a(t)=1/(1+e-t);神经网络预测模型的输入向量为Rp= [u(k), u(k-1),…, u(k-nu+1), w(k), w(k-1),…, w(k-nw+1)],其中nw, nu分别表示延迟的阶数,输入向量的个数为4 nu +3nw;输出向量为k+1时刻的预测位姿wm(k+1);逆神经网络模型的输入向量为Ri= [ wr’(k+1), u(k-1),…, u(k-nu+1), w(k), w(k-1),…, w(k-nw+1)],输入向量的个数为4 nu +3nw-1;输出向量为k时刻的控制量u(k)。4.根据权利要求1...

【专利技术属性】
技术研发人员:樊兆峰
申请(专利权)人:徐州工程学院
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1