一种基于深度强化学习和迁移学习的增升装置优化方法制造方法及图纸

技术编号:30546342 阅读:21 留言:0更新日期:2021-10-30 13:25
本发明专利技术公开一种基于深度强化学习和迁移学习的增升装置优化方法,将深度强化学习方法引入至增升装置的起降构型优化设计中,同时利用迁移学习预训练的方式,搭建起二维优化结果和三维优化的关系,从而有效地利用二维优化的结果来加速三维优化效率。本发明专利技术结合二维计算快、三维计算准的特点,从算法层面上搭建起二者衔接的桥梁,提供一种高效率又精准的优化方法。法。法。

【技术实现步骤摘要】
一种基于深度强化学习和迁移学习的增升装置优化方法


[0001]本专利技术属于飞机设计领域,提出一种基于深度强化学习和迁移学习的增升装置优化方法。

技术介绍

[0002]大型飞机起降阶段增升装置的优化设计,可以提升飞机的经济性和安全性,是关键技术。增升装置的流动机理复杂,难以通过理论推导求解。而计算流体力学手段,一套三维三段翼的翼身组合体网格至少在百万甚至千万以上,需要消耗大量的计算资源和时间,因此对优化算法的效率有较高要求。目前常用的优化算法以启发式算法为主,其中又以遗传算法为代表被广泛应用,但其只针对纯二维优化或三维优化,前者虽然计算速度较快,但性能与真实流动存在差异,只能在一些假设下通过物理方程推导二维和三维的流动关系,具有局限性。而纯三维优化对计算资源和时间的占用相当大;且二维优化结果无法为三维优化提供指导。目前增升装置朝着简单形式的方向发展,其设计目标包括但不限于气动、机构、结构、噪声、重量、可靠性等多方面因素,是个典型的多学科交叉耦合设计问题,这对优化方法又是个极大的挑战。目前人工智能技术得到了大量发展,其中深度强化学习,结合了深度学本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习和迁移学习的增升装置优化方法,其特征在于:具体过程如下:A、二维优化阶段步骤1:给定目标值函数;对于单目标优化,优化目标直接视为目标值,对于多目标优化,采用线性加权的方式将其转化为单目标;步骤2:建立智能体,包含在线演员网络和在线评论家网络,以及目标演员网络和目标评论家网络;在线演员神经网络和在线评论家网络内部参数采用正交随机初始化;步骤3:建立空的经验池,将当前增升装置参数输入给在线演员神经网络,其输出决策,即新构型增升装置参数;步骤4:计算新构型增升装置气动性能;步骤5:根据气动性能计算奖励函数得到奖励值;步骤6:将状态、动作、奖励值序列存入经验池中;其中状态值为旧构型增生装置参数,动作值为新构型增升装置参数;步骤7:从当前的经验池中随机取出经验轨迹,分别训练在线评论家网络和在线演员网络,并更新目标演员网络和目标评论家网络;步骤8:用新构型增升装置参数更新旧...

【专利技术属性】
技术研发人员:刘沛清戴佳骅栾博语李庆辉夏慧张雅璇
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1