基于多智能体TLBO算法的球磨机制粉优化控制方法技术

技术编号:29045729 阅读:23 留言:0更新日期:2021-06-26 06:00
本发明专利技术公开了基于多智能体TLBO算法的球磨机制粉优化控制方法,在建立瓷砖球磨机制粉控制系统模型后,通过对教学因子TF的进行了改进;在改进“学”阶段引入了多智能体算子,对基本TLBO算法做出改进,将改进的TLBO算法用于瓷砖球磨机制粉系统控制器,对参数进行优化。本发明专利技术的控制方法,能够在种群中产生方向剧烈变化的随机游走,扩大搜索范围,使得种群多样性增加,避免TLBO算法陷入局部最优,能够提高瓷砖生产过程的制粉工艺效率,具有较好的经济效益,减少人工成本、缩短球磨时间、节省电耗以及减少粉尘污染,推动球磨技术的产业化,不仅会取得很好的经济效应和社会效应,也会推动瓷砖行业的可持续发展。行业的可持续发展。

【技术实现步骤摘要】
基于多智能体TLBO算法的球磨机制粉优化控制方法


[0001]本专利技术涉及球磨机制粉的控制方法,特别涉及基于多智能体TLBO算法的球磨机制粉优化控制方法。

技术介绍

[0002]在工业生产领域,常常需要用到无机粉体。球磨机是常用的制粉设备,也是制粉系统的核心设备,在电力、化工、冶金、陶瓷等领域有着不可替代的地位。目前,陶瓷企业都采用大型球磨机进行粉磨,采用喷雾干燥塔进行造粒,用喷雾干燥塔制备的粉料含水率小,粒度分布范围满足成形要求,因此广泛应用于陶瓷自动化生产。球磨机是一个复杂的对象,具有时滞性大、耦合性强、变量多、非线性等特点。典型的球磨机系统模型可以看作是具有三个输入量和三个输出量,加上多干扰量的复杂系统,三个输入量即给煤量、热风量、再循环风量,三个输出量即进出口压差、入口负压、出口温度。使得实现其优化控制成为一个复杂的问题。
[0003]已有的球磨机制粉系统常用控制方法主要有常规比例积分微分(PID)控制,解耦控制、预测控制、模糊控制、自寻优控制、神经网络控制等。教与学优化(teaching

learning

based optimization,TLBO)算法是一种新型的智能优化技术,其利用群体信息进行启发式搜索。TLBO算法对优化对象的优化速度快,收敛特性强。但是TLBO算法在解决复杂高维问题时,表现容易陷入局部最优,多样性丢失过快等不足的问题。
[0004]如何对TLBO算法进行优化,使其可以更好地应用于球磨机制粉的优化控制方法中,是一项有待解决的技术问题。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的至少一个不足,提供一种基于多智能体TLBO算法的球磨机制粉优化控制方法。
[0006]本专利技术所采取的技术方案是:
[0007]本专利技术的第一个方面,提供:
[0008]基于多智能体TLBO算法的球磨机制粉优化控制方法,包括:
[0009]建立球磨机制粉控制模型;
[0010]对基本TLBO算法进行改进,包括教学因子TF的改进,改进之后的教学因子如式(1):
[0011][0012]式(1)中,令TF最大值TF
max
,TF
i
的初始值设计TF1=1,iter_max表示最大迭代次数,iter表示当前迭代次数;
[0013]建立控制器的状态空间模型,将改进的TLBO算法用于球磨机制粉系统控制器的参数优化。
[0014]在一些实例中,基本TLBO算法的改进还包括多智能体构造,构造过程如下:
[0015]构造多智能体状态空间函数:在多智能体系统中当选取未经过学习的学员表示为智能体的联合状态空间S=[s1,s2,

s
n
],式中:s1~s
n
是未经过学习的学员的多智能体状态空间;
[0016]构造多智能体动作相位:使用联合动作相位A=[a1,a2,

a
n
][0017]式中:a1~a
n
为动作相位。
[0018]在一些实例中,基本TLBO算法的改进还包括Stackelberg博弈均衡:
[0019]选取最优秀的学员作为领导者,目标函数为f
领导者
(x)
[0020]f
领导者
(x)=max(U
领导者智能体
(s,[a1,

a
n
]))
[0021][0022]式中:ω
i
(s,[a1,

a
n
])学员群体中领导者智能体i的性能函数,θ
i
(s,[a1,

a
n
])学员群体中领导者智能体i的损失函数,n表示整个学员群体中领导者智能体的个数;
[0023]最优化学员自身收益,目标函数为f
跟随者
(x):
[0024]f
跟随者
(x)=max(U
跟随智能体
(s,[a1,

a
n
]))
[0025][0026]式中:φ
i
(s,[a1,

a
n
])学员群体中跟随者智能体i的性能函数,学员群体中跟随者智能体i的损失函数,k整个学员群体中跟随者智能体的个数。
[0027]在一些实例中,基本TLBO算法的改进还包括改进“学”阶段:
[0028]多智能体TLBO算法依次选中每一个学员,然后挑选一个优秀的学员作为比较,基于自学习的学习过程为:
[0029][0030]式(2)中:X
new,i
,表示第i个学员学习后的状态值;X
old,i
表示原来的状态值;r1,r2表示[0,1]之间的随机数。
[0031]在一些实例中,控制器的状态空间模型为:
[0032][0033]使用TLBO算法多智能体学员对控制器K
a
,K
b
统一进行编码:统一进行编码:
[0034]设计多智能体TLBO算法的适应度函数J,选择ITAE作为目标函数,其表达式为:
[0035][0036]式(3)中,t表示时间,e(t)为系统误差;
[0037]调用多智能体TLBO算法进行优化,由系统误差通过ITAE函数计算学员/个体适应度Ji;判断适应度函数值是否达到要求,输出最优学员/个体对应的参数。
[0038]在一些实例中,所述球磨机制粉控制系统模型为双输入双输出的耦合对象,分解后的双输入双输出耦合对象的数学模型表示为:
[0039]C(s)=G(s)R(s)
[0040]其中C(s)是输出信号,R(s)是输入信号,G(s)是传递函数矩阵,即:
[0041][0042]其中,T是出口温度,P是入口负压,R
T
是热风量,R
P
是再循环风量,G
11
(s)是T对R
T
的传递函数,G
12
(s)是T对R
P
的传递函数,G
21
(s)是P对R
T
的传递函数,G
22
(s)是P对R
P
的传递函数。
[0043]在一些实例中,整个球磨机控制系统算法流程如下:
[0044]S1)TLBO学员/个体数量及科目初始化,设定最大迭代次数iter_max;
[0045]S2)将进行编码,依次代入控制器;
[0046]S3)计算球磨机输出,并计算系统误差;
[0047]S4)由系统误差通过ITAE函数计算学员/个体适应度;
[0048]S5)调用多智能体TLBO算法优化,更新学员/个体参数值;
[0049]S6)判断适应度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于多智能体TLBO算法的球磨机制粉优化控制方法,包括:建立球磨机制粉控制模型;对基本TLBO算法进行改进,包括教学因子TF的改进,改进之后的教学因子如式(1):式(1)中,令TF最大值TF
max
,TF
i
的初始值设计TF1=1,iter_max表示最大迭代次数,iter表示当前迭代次数;建立控制器的状态空间模型,将改进的TLBO算法用于球磨机制粉系统控制器的参数优化。2.根据权利要求1所述的球磨机制粉优化控制方法,其特征在于:基本TLBO算法的改进还包括多智能体构造,构造过程如下:构造多智能体状态空间函数:在多智能体系统中当选取未经过学习的学员表示为智能体的联合状态空间S=[s1,s2,

s
n
],式中:s1~s
n
是未经过学习的学员的多智能体状态空间;构造多智能体动作相位:使用联合动作相位A=[a1,a2,

a
n
]式中:a1~a
n
为动作相位。3.根据权利要求2所述的球磨机制粉优化控制方法,其特征在于:基本TLBO算法的改进还包括Stackelberg博弈均衡:选取最优秀的学员作为领导者,目标函数为f
领导者
(x)f
领导者
(x)=max(U
领导者智能体
(s,[a1,

a
n
]))式中:ω
i
(s,[a1,

a
n
])学员群体中领导者智能体i的性能函数,θ
i
(s,[a1,

a
n
])学员群体中领导者智能体i的损失函数,n表示整个学员群体中领导者智能体的个数;最优化学员自身收益,目标函数为f
跟随者
(x):f
跟随者
(x)=max(U
跟随智能体
(s,[a1,

a
n
]))式中:φ
i
(s,[a1,

a
n
])学员群体中跟随者智能体i的性能函数,学员群体中跟随者智能体i的损失函数,k整个学员群体中跟随者智能体的个数。4.根据权利要求2或3所述的球磨机制粉优化控制方法,其特征在于:基本TLBO算法的改进还包括改进“学”阶段:多智能体TLBO算法依次选中每一个学员,然后挑选一个优秀的学员作为比较,基于自学习的学习过程为:式(2)中:X
new,i
,表示第i个学员学习后的状态值;X
old,i
表示原来的状态值;r1,r2表示[0,1]之间的随机数。
5.根据权利要求1~4任一项所述的球磨机制粉优化控制方法,其特征在于:控制器的状态空间模型为:状态空间模型为:使用TLBO算法多智能体学...

【专利技术属性】
技术研发人员:谢巍张浪文张翼秦伍
申请(专利权)人:广东道氏技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1