【技术实现步骤摘要】
一种基于深度强化学习和迁移学习的增升装置优化方法
[0001]本专利技术属于飞机设计领域,提出一种基于深度强化学习和迁移学习的增升装置优化方法。
技术介绍
[0002]大型飞机起降阶段增升装置的优化设计,可以提升飞机的经济性和安全性,是关键技术。增升装置的流动机理复杂,难以通过理论推导求解。而计算流体力学手段,一套三维三段翼的翼身组合体网格至少在百万甚至千万以上,需要消耗大量的计算资源和时间,因此对优化算法的效率有较高要求。目前常用的优化算法以启发式算法为主,其中又以遗传算法为代表被广泛应用,但其只针对纯二维优化或三维优化,前者虽然计算速度较快,但性能与真实流动存在差异,只能在一些假设下通过物理方程推导二维和三维的流动关系,具有局限性。而纯三维优化对计算资源和时间的占用相当大;且二维优化结果无法为三维优化提供指导。目前增升装置朝着简单形式的方向发展,其设计目标包括但不限于气动、机构、结构、噪声、重量、可靠性等多方面因素,是个典型的多学科交叉耦合设计问题,这对优化方法又是个极大的挑战。目前人工智能技术得到了大量发展,其中深度强 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度强化学习和迁移学习的增升装置优化方法,其特征在于:具体过程如下:A、二维优化阶段步骤1:给定目标值函数;对于单目标优化,优化目标直接视为目标值,对于多目标优化,采用线性加权的方式将其转化为单目标;步骤2:建立智能体,包含在线演员网络和在线评论家网络,以及目标演员网络和目标评论家网络;在线演员神经网络和在线评论家网络内部参数采用正交随机初始化;步骤3:建立空的经验池,将当前增升装置参数输入给在线演员神经网络,其输出决策,即新构型增升装置参数;步骤4:计算新构型增升装置气动性能;步骤5:根据气动性能计算奖励函数得到奖励值;步骤6:将状态、动作、奖励值序列存入经验池中;其中状态值为旧构型增生装置参数,动作值为新构型增升装置参数;步骤7:从当前的经验池中随机取出经验轨迹,分别训练在线评论家网络和在线演员网络,并更新目标演员网络和目标评论家网络;步骤8:用新构型增升装置参数更新旧...
【专利技术属性】
技术研发人员:刘沛清,戴佳骅,栾博语,李庆辉,夏慧,张雅璇,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。