当前位置: 首页 > 专利查询>厦门大学专利>正文

一种基于深度强化学习的旋翼翼型优化方法及系统技术方案

技术编号:36893641 阅读:68 留言:0更新日期:2023-03-15 22:11
本发明专利技术涉及一种基于深度强化学习的旋翼翼型优化方法及系统,属于翼型设计领域。通过智能体与环境之间进行大量的交互学习,获得优化策略,可以对目标翼型进行动态失速优化获得更好性能的新翼型,优化策略所对应的优化过程具有物理可解释性;采用深度神经网络建立的用于预测旋翼翼型气动力迟滞回线的代理模型,具有更好的非线性预测能力。有更好的非线性预测能力。有更好的非线性预测能力。

【技术实现步骤摘要】
一种基于深度强化学习的旋翼翼型优化方法及系统


[0001]本专利技术涉及翼型设计领域,特别是涉及一种基于深度强化学习的旋翼翼型优化方法及系统。

技术介绍

[0002]旋翼是直升机的重要部件,决定着其飞行性能。动态失速是旋翼常面临的流动现象,会使得旋翼的拉力系数下降,阻力系数上升,大大降低旋翼的气动性能。因此,如何抑制动态失速是旋翼设计需要解决的关键问题。翼型是旋翼的基本元素,决定着旋翼的气动性能。若能设计一款旋翼翼型能抑制动态失速,那将从根本上缓解旋翼动态失速,提高其气动性能。
[0003]优化是翼型设计的重要手段。近年来针对旋翼翼型气动优化,学者们开展了相关研究。2012年Mani等采用伴随方法对SC1095旋翼翼型进行了优化,得到了能够抑制动态失速的翼型。2015年王清等基于二次序列规划的优化算法,开展了旋翼翼型动态失速优化研究。2020年喻伯平等采用基于代理模型方法对旋翼翼型进行动态失速优化。可以看到:这些翼型优化方法虽然取得了一定的优化效果,但都是通过大规模寻优实现的,没有从翼型优化过程中学习经验,优化策略在物理上不具有可解释性,也难以对未来翼型设计提供指导。
[0004]近年来,强化学习的发展引起了众多学者的广泛关注,在电脑游戏、机器人控制、自然语言处理等领域得到了广泛应用。该方法通过智能体与环境的交互学习可以获得最大化回报的策略。相比于其他机器学习方法,该方法很好地改善了模型的“黑箱”属性,具有从大量试验和试错中积累经验的能力,并且从原理上来看,强化学习本身不受系统的非线性特性限制。最近,在流体力学领域,强化学习也得到了一定的应用。有学者将强化学习引入到流动控制领域,Rabault等利用强化学习算法对圆柱上下端进行零质量射流控制,实现了抑制卡门涡街、降低阻力的效果。还有学者将强化学习引入鱼群流动行为研究,Verma等采用强化学习算法对鱼的游动位置和身体变形进行训练,提高鱼的游动效率。结果表明,强化学习能够很好地学习到射流控制策略或者鱼类游动策略。可以预见若将强化学习应用到旋翼翼型动态失速优化中,通过学习规律可以获得物理上可解释的优化策略,从而更好地指导旋翼翼型设计工作,真正发挥方法的“智能”优点。

技术实现思路

[0005]本专利技术的目的是提供一种基于深度强化学习的旋翼翼型优化方法及系统,使得优化过程具有物理可解释性,并提高非线性预测能力。
[0006]为实现上述目的,本专利技术提供了如下方案:
[0007]一种基于深度强化学习的旋翼翼型优化方法,包括:
[0008]对直升机旋翼翼型进行参数化表示,并建立翼型数据库;所述翼型数据库中的每个翼型由一组参数值表示;
[0009]确定翼型数据库中各个翼型对应的气动力迟滞回线;
[0010]将各个翼型参数和各个翼型对应的气动力迟滞回线构成训练数据集;
[0011]利用所述训练数据集训练深度神经网络,获得用于预测气动力迟滞回线的代理模型;
[0012]以抑制旋翼翼型的动态失速为目标,采用代理模型建立强化学习需要的环境;
[0013]利用建立的环境,采用强化学习算法训练智能体,得到优化策略,获得优化后的翼型。
[0014]可选的,所述对直升机旋翼翼型进行参数化表示,并建立翼型数据库,具体包括:
[0015]采用形状类别函数变换方法将直升机旋翼翼型的上下表面分别用6个参数表示;
[0016]在设计域内采用拉丁超立方方法对每个参数的值进行采样,获得多组翼型,构成翼型数据库;所述设计域为翼型几何外形变化的范围。
[0017]可选的,所述确定翼型数据库中各个翼型对应的气动力迟滞回线,具体包括:
[0018]采用计算流体力学求解器对翼型数据库中的每个翼型进行数值模拟,计算各个翼型对应的气动力迟滞回线;所述气动力迟滞回线包括升力系数迟滞回线、阻力系数迟滞回线和力矩系数迟滞回线。
[0019]可选的,所述强化学习中的状态为翼型的12个参数,动作为对于12个参数的增减操作,回报设置为翼型阻力系数和力矩系数峰值的降低值;
[0020]建立强化学习需要的环境为:翼型airfoil

i,在动作action

i下获得回报reward

i的数组。
[0021]可选的,所述利用建立的环境,采用强化学习算法训练智能体,得到优化策略,获得优化后的翼型,具体包括:
[0022]利用建立的环境,采用强化学习算法A3C训练智能体,进行n轮次训练后,得到优化策略,获得优化后的翼型。
[0023]一种基于深度强化学习的旋翼翼型优化系统,包括:
[0024]参数化模块,用于对直升机旋翼翼型进行参数化表示,并建立翼型数据库;所述翼型数据库中的每个翼型由一组参数值表示;
[0025]数值模拟模块,用于对翼型数据库中的每个翼型进行数值模拟,获得各个翼型对应的气动力迟滞回线;
[0026]训练数据集构成模块,用于将各个翼型参数和各个翼型对应的气动力迟滞回线构成训练数据集;
[0027]代理模型建立模块,用于利用所述训练数据集训练深度神经网络,获得用于预测气动力迟滞回线的代理模型;
[0028]环境建立模块,用于以抑制旋翼翼型的动态失速为目标,采用代理模型建立强化学习需要的环境;
[0029]翼型优化模块,用于利用建立的环境,采用强化学习算法训练智能体,得到优化策略,获得优化后的翼型。
[0030]一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前述的基于深度强化学习的旋翼翼型优化方法。
[0031]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被执行时实
现如前述的基于深度强化学习的旋翼翼型优化方法。
[0032]根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:
[0033]本专利技术公开一种基于深度强化学习的旋翼翼型优化方法及系统,通过智能体与环境之间进行大量的交互学习,获得优化策略,可以对目标翼型进行动态失速优化获得更好性能的新翼型,优化策略所对应的优化过程具有物理可解释性;采用深度神经网络建立的用于预测旋翼翼型气动力迟滞回线的代理模型,具有更好的非线性预测能力。
附图说明
[0034]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0035]图1为本专利技术实施例提供的基于深度强化学习的旋翼翼型优化方法的流程图;
[0036]图2为本专利技术实施例提供的基于深度强化学习的旋翼翼型优化方法的原理图;
[0037]图3为本专利技术实施例提供的旋翼翼型OA212动态失速的计算模型示意图;
[0038]图4为本专利技术实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习的旋翼翼型优化方法,其特征在于,包括:对直升机旋翼翼型进行参数化表示,并建立翼型数据库;所述翼型数据库中的每个翼型由一组参数值表示;确定翼型数据库中各个翼型对应的气动力迟滞回线;将各个翼型参数和各个翼型对应的气动力迟滞回线构成训练数据集;利用所述训练数据集训练深度神经网络,获得用于预测气动力迟滞回线的代理模型;以抑制旋翼翼型的动态失速为目标,采用代理模型建立强化学习需要的环境;利用建立的环境,采用强化学习算法训练智能体,得到优化策略,获得优化后的翼型。2.根据权利要求1所述的基于深度强化学习的旋翼翼型优化方法,其特征在于,所述对直升机旋翼翼型进行参数化表示,并建立翼型数据库,具体包括:采用形状类别函数变换方法将直升机旋翼翼型的上下表面分别用6个参数表示;在设计域内采用拉丁超立方方法对每个参数的值进行采样,获得多组翼型,构成翼型数据库;所述设计域为翼型几何外形变化的范围。3.根据权利要求1所述的基于深度强化学习的旋翼翼型优化方法,其特征在于,所述确定翼型数据库中各个翼型对应的气动力迟滞回线,具体包括:采用计算流体力学求解器对翼型数据库中的每个翼型进行数值模拟,计算各个翼型对应的气动力迟滞回线;所述气动力迟滞回线包括升力系数迟滞回线、阻力系数迟滞回线和力矩系数迟滞回线。4.根据权利要求2所述的基于深度强化学习的旋翼翼型优化方法,其特征在于,所述强化学习中的状态为翼型的12个参数,动作为对于12个参数的增减操作,回报设置为翼型阻力系数和力矩系数峰值的降低值;建立强化学习需要的环境为:翼型airfoil

i,在动...

【专利技术属性】
技术研发人员:陈荣钱柳家齐楼锦华杨凌云李晨曦张奥林尤延铖
申请(专利权)人:厦门大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1