当前位置: 首页 > 专利查询>浙江大学专利>正文

SISO紧格式无模型控制器基于集成学习的参数自整定方法技术

技术编号:26530240 阅读:28 留言:0更新日期:2020-12-01 14:08
本发明专利技术公开了一种SISO紧格式无模型控制器基于集成学习的参数自整定方法,所述集成学习算法包含PSO算法、BP神经网络以及循环神经网络三种个体算法。以系统误差作为集成学习算法的输入,首先进行三种个体算法对SISO紧格式无模型控制器的参数在线整定并输出三组临时整定参数,将结果分别输入到控制器中计算被控对象的控制输入,计算得到三组临时系统误差并利用softmax函数计算个体算法的权重比,将权重比与临时整定参数进行加权求和作为最终SISO紧格式无模型控制器待整定参数,实现参数自整定。本发明专利技术提出的SISO紧格式无模型控制器基于集成学习的参数自整定方法,结合不同个体算法优势,增强算法泛化性,克服控制器参数在线整定难题,对SISO系统具有良好的控制效果。

【技术实现步骤摘要】
SISO紧格式无模型控制器基于集成学习的参数自整定方法
本专利技术属于自动化控制领域,尤其是涉及一种SISO紧格式无模型控制器基于集成学习的参数自整定方法。
技术介绍
SISO(SingleInputandSingleOutput,单输入单输出)系统广泛存在于炼油、化工、火电、机械、电气、石化、制药、食品、造纸、水处理、冶金、水泥、橡胶等行业的反应器、精馏塔、机器、设备、装置、生产线、车间、工厂等被控对象中。随着科技水平的不断提高,工业装置日益大型化与复杂化,使生产过程呈现出越来越多的强非线性、时变等特征,而以PID为代表的传统控制器在控制具有强非线性、时变等特征的复杂被控对象时往往难以达到理想的控制效果。无模型控制器是一种新型的基于数据驱动的控制模型,对未知非线性时变系统具有很好的控制效果,因此具有良好的应用前景。针对SISO系统的无模型控制器的现有实现方法中包括SISO紧格式无模型控制器。SISO紧格式无模型控制器是一种新型的数据驱动控制方法,其特征在于不需要掌握被控对象的任何数学原理,仅需要SISO被控对象实时测量的输入输出数据就可以进行控制器的分析和设计,具有实现方法简单、计算负担小且鲁棒性强等优点,对未知非线性时变SISO系统也能够进行较好的控制。SISO紧格式无模型控制器的理论基础,由侯忠生与金尚泰在其合著的《无模型自适应控制—理论与应用》(科学出版社,2013年,第55页)中提出,其控制算法如下:其中,u(k)为k时刻的系统控制输入;e(k)为k时刻的系统误差;φc(k)为k时刻的SISO系统伪偏导数估计值;λ为惩罚因子,ρ为步长因子。然而,SISO紧格式无模型控制器在投入实际工业场景之前需要根据行业的专业知识与经验来预先设定惩罚因子λ和步长因子ρ等参数的数值,错误的参数值设定可能会导致工况故障等问题,同时无模型控制器在实际投用过程中也尚未实现惩罚因子λ和步长因子ρ等参数的在线自整定。控制器参数有效整定手段的缺乏,不仅使SISO紧格式无模型控制器的使用调试过程中耗时耗力,而且有时还会严重影响SISO紧格式无模型控制器的控制效果,限制了SISO紧格式无模型控制器的广泛应用。为了打破制约SISO紧格式无模型控制器推广应用的瓶颈,SISO紧格式无模型控制器在实际投用过程中还需要解决在线自整定参数的难题。
技术实现思路
本专利技术的目的在于,提供一种SISO紧格式无模型控制器基于集成学习的参数自整定方法,以解决SISO紧格式无模型控制器的参数在线自整定问题。为此,本专利技术的上述目的通过以下技术方案来实现,包括以下步骤:步骤(1):SISO紧格式无模型控制器参数包含惩罚因子λ和步长因子ρ;确定SISO紧格式无模型控制器待整定参数,所述SISO紧格式无模型控制器待整定参数,为所述SISO紧格式无模型控制器参数的部分或全部,包含惩罚因子λ和步长因子ρ的任意之一或其组合;确定集成学习算法中个体算法的数目为3;确定集成学习算法中具体个体算法包含PSO算法、BP神经网络和循环神经网络;确定PSO算法的迭代次数、种群规模;初始化PSO算法中粒子群的位置与速度;确定BP神经网络的输入层节点数、隐含层单元数、输出层节点数,所述输出层节点数不少于所述SISO紧格式无模型控制器待整定参数个数;初始化BP神经网络隐含层和输出层中所有待训练学习的权系数;确定BP神经网络反向传播的学习率参数值;确定循环神经网络的输入层节点数、隐含层单元数、输出层节点数,所述输出层节点数不少于所述SISO紧格式无模型控制器待整定参数个数;初始化循环神经网络隐含层和输出层中所有待训练学习的权系数;确定循环神经网络反向传播的学习率参数值;步骤(2):将当前时刻记为k时刻,基于系统输出期望值与系统输出实际值,采用系统误差计算函数计算得到k时刻的系统误差,记为e(k);步骤(3):将步骤(2)计算得到的系统误差及其函数组、系统输出期望值、系统输出实际值的任意之一或任意种组合,作为系统误差集合,所述的系统误差集合作为集成学习算法的输入集合;步骤(4):基于步骤(3)所述的集成学习算法的输入集合,步骤(1)中所述的集成学习算法中的个体算法进行并行运算,各自运算方法如下:当所述个体算法为PSO算法时,PSO算法粒子群规模为待整定参数的数目,初始化PSO算法中的所有粒子的位置,计算粒子群中每一个粒子的适应度值,通过对比粒子的适应度值确定每一个粒子在历次迭代中个体最优位置和整个粒子群在历次迭代中的群体最优位置,基于所述个体最优位置和群体最优位置对粒子进行速度和位置的更新,更新公式如下:V(i)=wV(i)+c1r1(gbest(i)-pop(i))+c2r2(zbest-pop(i))pop(i)=pop(i)+wV(i)其中V(i)是待更新的粒子个体速度,pop(i)是待更新的粒子个体位置,zbest是当前群体最优粒子,gbest是当前个体最优粒子,c1和c2是非负的常数,r1和r2是分布于0到1之间的随机数,w是惯性权重系数;最终输出的群体最优粒子作为所述SISO紧格式无模型控制器待整定参数的值λ1和/或ρ1,记为候选参数集合1;当所述个体算法为BP神经网络时,基于步骤(3)的输入,BP神经网络进行前向运算,首先计算当前时刻的输入与待训练权系数的乘积并输入至激活函数,得到隐含层状态值,接着将隐含层输出与输出层权系数相乘并通过激活函数即可得到最终输出层的值输出的值作为所述SISO紧格式无模型控制器待整定参数的值λ2和/或ρ2,记为候选参数集合2;当所述个体算法为循环神经网络时,基于步骤(3)的输入,循环神经网络进行前向运算,首先计算当前时刻的输入与待训练权系数的乘积以及上一时刻的隐含层状态值与待训练权系数的乘积,将两个乘积的结果进行求和并输入至激活函数,得到当前时刻的隐含层状态值;将当前时刻隐含层状态值乘以权系数并通过激活函数得到最终输出层的值,输出的值作为所述SISO紧格式无模型控制器待整定参数的值λ3和/或ρ3,记为候选参数集合3;步骤(5):将步骤(4)所述的候选参数集合1、候选参数集合2以及候选参数集合3,分别作用于SISO紧格式无模型控制器中,进而分别计算得到三组SISO紧格式无模型控制器针对被控对象在k时刻的控制输入u1(k)、u2(k)以及u3(k);步骤(6):步骤(5)所述控制输入u1(k)、u2(k)和u3(k)分别作用于被控对象后,得到三组被控对象在后一时刻的系统输出实际值,根据系统的期望输出值采用步骤(2)中的误差计算函数计算集成学习中个体算法参数整定所产生对应的临时系统误差,记为err1(k)、err2(k)和err3(k);步骤(7):基于步骤(6)的临时系统误差err2(k)和err3(k),集成学习中的BP神经网络和循环神经网络以最小化各自系统误差函数的值为目标,采用基于链式法则的梯度下降法进行神经网络反向传播计算,目的是更新各自神经网络所有待训练学习的权系数,作为下一时刻神经网络进行前向计算的权系数;所述梯度下本文档来自技高网
...

【技术保护点】
1.SISO紧格式无模型控制器基于集成学习的参数自整定方法,其特征在于包括以下步骤:/n步骤(1):SISO紧格式无模型控制器参数包含惩罚因子λ和步长因子ρ;确定SISO紧格式无模型控制器待整定参数,所述SISO紧格式无模型控制器待整定参数,为所述SISO紧格式无模型控制器参数的部分或全部,包含惩罚因子λ和步长因子ρ的任意之一或其组合;确定集成学习算法中个体算法的数目为3;确定集成学习算法中具体个体算法包含PSO算法、BP神经网络和循环神经网络;确定PSO算法的迭代次数、种群规模;初始化PSO算法中粒子群的位置与速度;确定BP神经网络的输入层节点数、隐含层单元数、输出层节点数,所述输出层节点数不少于所述SISO紧格式无模型控制器待整定参数个数;初始化BP神经网络隐含层和输出层中所有待训练学习的权系数;确定BP神经网络反向传播的学习率参数值;确定循环神经网络的输入层节点数、隐含层单元数、输出层节点数,所述输出层节点数不少于所述SISO紧格式无模型控制器待整定参数个数;初始化循环神经网络隐含层和输出层中所有待训练学习的权系数;确定循环神经网络反向传播的学习率参数值;/n步骤(2):将当前时刻记为k时刻,基于系统输出期望值与系统输出实际值,采用系统误差计算函数计算得到k时刻的系统误差,记为e(k);/n步骤(3):将步骤(2)计算得到的系统误差及其函数组、系统输出期望值、系统输出实际值的任意之一或任意种组合,作为系统误差集合,所述的系统误差集合作为集成学习算法的输入集合;/n步骤(4):基于步骤(3)所述的集成学习算法的输入集合,步骤(1)中所述的集成学习算法中的个体算法进行并行运算,各自运算方法如下:/n当所述个体算法为PSO算法时,PSO算法粒子群规模为待整定参数的数目,初始化PSO算法中的所有粒子的位置,计算粒子群中每一个粒子的适应度值,通过对比粒子的适应度值确定每一个粒子在历次迭代中个体最优位置和整个粒子群在历次迭代中的群体最优位置,基于所述个体最优位置和群体最优位置对粒子进行速度和位置的更新,更新公式如下:/nV(i)=wV(i)+c...

【技术特征摘要】
1.SISO紧格式无模型控制器基于集成学习的参数自整定方法,其特征在于包括以下步骤:
步骤(1):SISO紧格式无模型控制器参数包含惩罚因子λ和步长因子ρ;确定SISO紧格式无模型控制器待整定参数,所述SISO紧格式无模型控制器待整定参数,为所述SISO紧格式无模型控制器参数的部分或全部,包含惩罚因子λ和步长因子ρ的任意之一或其组合;确定集成学习算法中个体算法的数目为3;确定集成学习算法中具体个体算法包含PSO算法、BP神经网络和循环神经网络;确定PSO算法的迭代次数、种群规模;初始化PSO算法中粒子群的位置与速度;确定BP神经网络的输入层节点数、隐含层单元数、输出层节点数,所述输出层节点数不少于所述SISO紧格式无模型控制器待整定参数个数;初始化BP神经网络隐含层和输出层中所有待训练学习的权系数;确定BP神经网络反向传播的学习率参数值;确定循环神经网络的输入层节点数、隐含层单元数、输出层节点数,所述输出层节点数不少于所述SISO紧格式无模型控制器待整定参数个数;初始化循环神经网络隐含层和输出层中所有待训练学习的权系数;确定循环神经网络反向传播的学习率参数值;
步骤(2):将当前时刻记为k时刻,基于系统输出期望值与系统输出实际值,采用系统误差计算函数计算得到k时刻的系统误差,记为e(k);
步骤(3):将步骤(2)计算得到的系统误差及其函数组、系统输出期望值、系统输出实际值的任意之一或任意种组合,作为系统误差集合,所述的系统误差集合作为集成学习算法的输入集合;
步骤(4):基于步骤(3)所述的集成学习算法的输入集合,步骤(1)中所述的集成学习算法中的个体算法进行并行运算,各自运算方法如下:
当所述个体算法为PSO算法时,PSO算法粒子群规模为待整定参数的数目,初始化PSO算法中的所有粒子的位置,计算粒子群中每一个粒子的适应度值,通过对比粒子的适应度值确定每一个粒子在历次迭代中个体最优位置和整个粒子群在历次迭代中的群体最优位置,基于所述个体最优位置和群体最优位置对粒子进行速度和位置的更新,更新公式如下:
V(i)=wV(i)+c1r1(gbest(i)-pop(i))+c2r2(zbest-pop(i))
pop(i)=pop(i)+wV(i)
其中V(i)是待更新的粒子个体速度,pop(i)是待更新的粒子个体位置,zbest是当前群体最优粒子,gbest是当前个体最优粒子,c1和c2是非负的常数,r1和r2是分布于0到1之间的随机数,w是惯性权重系数;最终输出的群体最优粒子作为所述SISO紧格式无模型控制器待整定参数的值λ1和/或ρ1,记为候选参数集合1;
当所述个体算法为BP神经网络时,基于步骤(3)的输入,BP神经网络进行前向运算,首先计算当前时刻的输入与待训练权系数的乘积并输入至激活函数,得到隐含层状态值,接着将隐含层输出与输出层权系数相乘并通过激活函数即可得到最终输出层的值输出的值作为所述SISO紧格式无模型控制器待整定参数的值λ2和/或ρ2,记为候选参数集合2;
当所述个体算法为循环神经网络时,基于步骤(3)的输入,循环神经网络进行前向运算,首先计算当前时刻的输入与待训练权系数的乘积以及上一时刻的隐含层状态值与待训练权系数的乘积,将两个乘积的结果进行求和并输入至激活函数,得到当前时刻的隐含层状态值;将当前时刻隐含层状态值乘以权系数并通过激活函数得到最终输出层的值,输出的值作为所述SISO紧格式无模型控制器待整定参数的值λ3和/或ρ3,记为候选参数集合3;
步骤(5):将步骤(4)所述的候选参数集合1、候选参数集合2以及候选参数集合3,分别作用于SISO紧格式无模型控制器中,进而分别计算得到三组SISO紧格式无模型控制器针对被控对象在k时刻的控制输入u1(k)、u2(k)以及u3(k);
步骤(6):步骤(5)所述控制输入u1(k)、u2(k)和u3(k)分别作用于被控对象后,得到三组被控对象在后一时刻的系统输出实际值,根据系统的期望输出值采用步骤(2)中的误差计算函数计算集成学习中个体算法参数整定所产生对应的临时系统误差,记为err1(k)、err2(k)和err3(k);
步骤(7):基于步骤(6)的临时系统误差err2(k)和err3(k),集成学习中的BP神经网络和循环神经网络以最小化各自系统误差函数的值为目标,采用基于链式法则的梯度下降法进行神经网络反向传播计算,目的是更新各自神经网络所有待训练学习的权系数,作为下一时刻神经网络进行前向计算的权系数;所述梯度下降法公式如下:



其中w为各种神经网络中待训练学习的权系数,J(w)是关于权系数w的系统误差函数,α是学习率,为0到1之间的实数;所述反向传播计算过程中,在更新神经网络所有待训练学习的权系数时,使用步骤(5)中所述控制输入u2(k)以及u3(k)分别针对SISO紧格式无模型控制器候选...

【专利技术属性】
技术研发人员:卢建刚杨晔陈晨陈金水王文海
申请(专利权)人:浙江大学之江实验室
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1