遗传编程与强化学习相融合的可解释智能流动控制方法技术

技术编号:44335025 阅读:17 留言:0更新日期:2025-02-18 20:44
公开一种遗传编程与强化学习相融合的可解释智能流动控制方法:本发明专利技术将神经网络中的自动微分机制引入到线性遗传编程中,通过梯度下降算法自动调整线性遗传编程所得到的显式表达式,能够大幅减少控制律优化所需要的时间;显式符号表达控制律相比神经网络控制律有着更强的可解释性,便于研究人员更好理解控制机理和发现新的物理知识;该框架可以根据不同控制目标设置状态传感器和不同的奖励函数,具有很强的通用性。

【技术实现步骤摘要】

本专利技术涉及主动流动控制领域,尤其是一种遗传编程与强化学习相融合的可解释智能流动控制方法


技术介绍

1、主动流动控制(afc)通过激励器向流场输入额外能量以改善飞行器的整体性能,从而增大升力和减小飞行阻力。大部分afc的研究和应用是在固定控制参数下的开环控制,相比于开环控制,闭环控制可以根据状态传感器的实时反馈调整控制参数或控制策略,从而提高afc的控制收益和鲁棒性。当前,以线性遗传编程(lgp)和深度强化学习(drl)为代表的智能闭环控制方法已经被广泛用于afc领域,如圆柱绕流、翼型分离控制等。然而在现有的智能流动控制框架中,仍存在几个亟待解决的问题。第一,尽管lgp方法简单易行并且可以避免陷入局部最优策略,但是整个控制律优化过程包含数百次的迭代,往往需要耗费几个小时的时间(li,r.,noack,b.r.,cordier,l.,borée,j.,harambat,f.(2017).dragreduction of a car model by linear genetic programming control.experiments influi本文档来自技高网...

【技术保护点】

1.遗传编程与强化学习相融合的可解释智能流动控制方法,其特征在于,该方法包含两个流动控制策略优化阶段:遗传编程初筛符号表达式过程和强化学习微调控制律参数过程;具体如下:

2.如权利要求1所述的遗传编程与强化学习相融合的可解释智能流动控制方法,其特征在于,控制律推理过程被部署在现场可编程门阵列FPGA上,控制律的优化过程在电脑主机CPU上进行,在FPGA上运行的实时控制循环和在CPU上运行的策略优化循环同时进行;在实时控制循环中,FPGA通过热线风速仪对剪切层内部的速度脉动进行测量,通过模数转换器对测量结果进行转化,得到当前流场的状态st;将状态st输入到显式符号控制律,得出控...

【技术特征摘要】

1.遗传编程与强化学习相融合的可解释智能流动控制方法,其特征在于,该方法包含两个流动控制策略优化阶段:遗传编程初筛符号表达式过程和强化学习微调控制律参数过程;具体如下:

2.如权利要求1所述的遗传编程与强化学习相融合的可解释智能流动控制方法,其特征在于,控制律推理过程被部署在现场可编程门阵列fpga上,控制律的优化过程在电脑主机cpu上进行,在fpga上运行的实时控制循环和在cpu上运行的策略优化循环同时进行;在实时控制循环中,fpga通过热线风速仪对剪切层内部的速度脉动进行测量,通过模数转换器对测量结果进行转化,得到当前流场的状态st;将状态st输入到显式符号控制律,得出控制指令at;该控制指令at经数模转换器转换成控制电压信号,施加到等离子体激励器,对流场产生扰动,使得流场迁移至新的状态st+1。

3.如权利要求1所述的遗传编程与强化学习相融合的可解释智能流动控制方法,其特征在于,适应度的设置因流场和控制目标而异,在实际流动控制中采用时均的升力、阻力、分离区的面积、表面压力的脉动这些参数作为适应度。

4.如权利要求1所述的遗传编程与强化学习相融合的可解释智能流动控制方法,其特征在于,lgp算法对每个控制律的适应度进行评估的...

【专利技术属性】
技术研发人员:宗豪华相嘉伟吴云梁华苏志李金平
申请(专利权)人:中国人民解放军空军工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1