一种基于数据挖掘技术的气动特性数据处理方法技术

技术编号:14646821 阅读:87 留言:0更新日期:2017-02-16 03:40
一种基于数据挖掘技术的气动特性数据处理方法,属于飞行器气动设计领域。选取飞行器的样本点数据,将其按状态参数变量和气动特性参数变量进行分类,并将状态参数变量为自变量,气动特性参数变量为因变量。根据自变量对因变量的影响,选取影响不可忽略的自变量作为建模自变量,根据样本点数据建立气动力数据模型,根据样本点数据验证所建模型的平均相对误差,并迭代修正,直到获得满足准确度要求的气动力数据模型。本发明专利技术引入数据挖掘技术进行气动特性变化规律分析,并在掌握规律的基础上进行气动建模,有效提高了气动特性分析的效率和使用准确度。

【技术实现步骤摘要】

本专利技术涉及一种基于数据挖掘技术的气动特性数据处理方法,适用于面对称高速再入飞行器,属于飞行器气动设计领域。
技术介绍
在航天工程研制、运行的全过程中,都会产生大量数据。航天数据不仅具有一般大数据的特点,而且要求高可靠、高精度和更高的处理速度。目前气动设计中的气动特性分析大多还是依赖传统的曲线分析,弹道、姿控等专业对气动数据的使用也大多采用数据表和线性插值的方式,一方面需要根据数据格式专门编制程序处理数据,另一方面插值方法也会带来基本数据和高阶导数的误差,对气动特性分析的效率和使用准确度都造成了影响,需要用更高准确度且更易使用的气动数据处理方法加以改进。
技术实现思路
本专利技术解决的技术问题是:克服现有技术的不足,提供了一种基于数据挖掘技术的气动特性数据处理方法,有效提高了气动特性分析的效率和使用准确度。本专利技术的技术解决方案是:一种基于数据挖掘技术的气动特性数据处理方法,包括以下步骤:(1)选取飞行器的样本点数据,将其按状态参数变量和气动特性参数变量进行分类,其中状态参数变量包括马赫数Ma、攻角α、侧滑角β、舵偏角δj、高度H、雷诺数Re、努森数Kn,气动特性参数变量包括气动力六分量,即气动力分量(Cx,Cy,Cz)和气动力矩分量(U,V,W),每个状态参数变量和一个气动特性参数变量构成一个变量对;(2)计算每个变量对的相关系数,记状态参数变量为自变量,气动特性参数变量为因变量,按相关系数从大到小的顺序对自变量排序,选取前2/3的自变量;(3)计算自变量对每个因变量影响的权重系数,按权重系数从大到小的顺序对自变量排序,选取前2/3的自变量;(4)取步骤(2)和步骤(3)选取自变量的并集作为建模自变量;(5)通过离群点分析法剔除气动力六分量明显不合理的数据点,根据剩余数据点通过多元高次交互回归建立气动力数据模型;(6)从样本点数据集合中选取80%为训练集,剩余的20%为测试集,根据训练集中的数据,利用气动力数据模型计算预测值,并与测试集比对,利用如下公式计算平均相对误差MAPE:其中predi为第i个样本的预测值,truei为第i个样本在实际测试集中的值,N为样本总数;(7)如果MAPE小于等于5%,则气动力数据模型达到要求,根据气动力数据模型以及样本点数据获得飞行器设计空间的所有气动特性数据,如果MAPE大于5%,则气动力数据模型不符合要求,返回步骤(2),在步骤(2)中补充选取抛弃自变量中前2/3的自变量,在步骤(3)中补充选取抛弃自变量中前2/3的自变量,直到MAPE小于等于5%。所述步骤(2)中计算每个变量对相关系数的方法如下:(2.1)为每对变量对中所有样本点涉及的自变量编秩,为所有样本点涉及的因变量编秩;(2.2)利用公式计算每个变量对的相关系数ρ,其中dk代表第k组变量对因变量和自变量的排行差,dk=因变量的秩次-自变量的秩次。所述步骤(3)中计算自变量对每个因变量影响的权重系数的方法如下:(3.1)设样本点数据中第j个因变量的数值为n×1的向量y,自变量数值对应n×M的矩阵x,M为自变量个数;(3.2)对矩阵x利用公式x=pΔq'进行分解,其中矩阵p由xx'的特征向量组成,q由x'x的特征向量组成,Δ为对角线矩阵,对角线为矩阵x的特征值;(3.3)利用公式W=qp'y计算自变量对第j个因变量的影响权重W。在步骤(6)中分五次选取不同的数据作为测试集,分别计算MAPE,如果五次的MAPE均小于等于5%,则气动力数据模型合适,否则认为气动力数据模型不合适。当气动力数据模型不合适时,通过步骤(2)和步骤(3)补充选取自变量后,在步骤(5)中采用更高次的回归方法进行建模。本专利技术与现有技术相比的优点在于:(1)采用了数据挖掘中的相关分析法分析状态参数变量和气动特性参数变量之间的关联关系,能够基于大量数据以单幅图显示变量间的影响关系,相对传统的曲线图,可以快速直观的展示出飞行器气动特性随各状态参量的变化规律和气动特性本身的三通道耦合规律,提高了气动特性分析的效率。(2)通过高次交互回归方法,结合状态参数影响权重分析方法,高效准确的给出气动模型,利用该气动力数据模型获得的气动数据精确度更高,避免了传统的气动数据库线性插值以及高阶导数缺失带来的准确度下降问题,有效提高了气动数据的使用准确度。(3)通过气动模型将气动数据转化为简单的公式形式,各专业对气动数据的使用无需再通过读入庞大的数据表实现,明显提升了气动数据的分析和使用效率。(4)通过计算状态参数对气动特性的相关系数和权重系数,可以明确各状态参数在建模中的重要度,方便使用者根据模型精度要求进行建模参数选取;并且,通过五重交叉验证和模型迭代修正,确保了气动力数据模型的高精准度,获得准确度可控的适用于工程设计的气动模型。附图说明图1为本专利技术方法流程图;图2为本专利技术实施例飞行器示意图;图3为气动特性参数变量与状态参数变量之间的相关性示意图;图4为各个自变量对气动力Cx的影响权重示意图;图5为本专利技术方法与传统差值方法得到的预测值与实际值的平均相对误差对比图。具体实施方式下面结合附图和实施例对本专利技术做进一步说明。一般飞行器研制过程中会产生大量的气动数据,对气动特性变化规律和影响因素的快速掌握对飞行器设计有着重要意义,鉴于传统气动数据处理方法对气动特性分析的效率和使用准确度的影响,本专利技术考虑引入数据挖掘技术进行气动特性变化规律方面的研究,并在掌握规律的基础上进行气动建模,提升气动数据使用的精准度和效率。在气动特性参数与飞行状态参数的相关性分析中,基于样本点数据整理了气动专业数据,按照自变量和因变量分为两类,自变量主要指状态参数,因变量主要指气动特性参数。状态参数有马赫数、攻角、侧滑角、舵偏角、高度、Re、Kn、气动布局参数等;气动特性参数主要指气动力六分量、气动不确定度等。根据提供的气动数据,开展状态参数和气动特性参数之间规律的研究。如图1所示,本专利技术的具体步骤如下:(1)选取飞行器的样本点数据,将其按状态参数变量和气动特性参数变量进行分类,其中状态参数变量包括马赫数Ma、攻角α、侧滑角β、舵偏角δj、高度H、雷诺数Re、努森数Kn;气动特性参数变量包括气动力六分量,即气动力分量(Cx,Cy,Cz)和气动力矩分量(U,V,W),每个状态参数变量和一个气动特性参数变量构成一个变量对。(2)计算每个变量对的相关系数,按相关系数从大到小的顺序对自变量排序,选取前2/3的自变量,记状态参数变量为自变量,气动特性参数变量为因变量。计算每个变量对相关系数的方法如下:(2.1)为每对变量对中所有样本点涉及的自变量编秩,为所有样本点涉及的因变量编秩,数值相同的自变量秩次相同,数值相同的因变量秩次相同;例如,某变量对(x1,y)中,x1对应的样本点为(1,1,3,5,7,11),则其对应的秩次为(1,1,2,3,4,5);y对应的样本点为(0.1,0.3,0.3,0.2,0.4,0.6),则其对应的秩次为(1,3,3,2,4,5)。(2.2)利用公式计算每个变量对的相关系数ρ,其中dk代表第k组变量对样本点因变量和自变量的排行差,dk=因变量的秩次-自变量的秩次,N为样本总数。ρ的范围在-1到1之间,当ρ为1,说明该变量对中两个变量正相关。当ρ为-1,说明该变量本文档来自技高网...
一种基于数据挖掘技术的气动特性数据处理方法

【技术保护点】
一种基于数据挖掘技术的气动特性数据处理方法,其特征在于包括以下步骤:(1)选取飞行器的样本点数据,将其按状态参数变量和气动特性参数变量进行分类,其中状态参数变量包括马赫数Ma、攻角α、侧滑角β、舵偏角δj、高度H、雷诺数Re、努森数Kn,气动特性参数变量包括气动力六分量,即气动力分量(Cx,Cy,Cz)和气动力矩分量(U,V,W),每个状态参数变量和一个气动特性参数变量构成一个变量对;(2)计算每个变量对的相关系数,记状态参数变量为自变量,气动特性参数变量为因变量,按相关系数从大到小的顺序对自变量排序,选取前2/3的自变量;(3)计算自变量对每个因变量影响的权重系数,按权重系数从大到小的顺序对自变量排序,选取前2/3的自变量;(4)取步骤(2)和步骤(3)选取自变量的并集作为建模自变量;(5)通过离群点分析法剔除气动力六分量明显不合理的数据点,根据剩余数据点通过多元高次交互回归建立气动力数据模型;(6)从样本点数据集合中选取80%为训练集,剩余的20%为测试集,根据训练集中的数据,利用气动力数据模型计算预测值,并与测试集比对,利用如下公式计算平均相对误差MAPE:MAPE=Σi=1N|predi-trueitruei|/N]]>其中predi为第i个样本的预测值,truei为第i个样本在实际测试集中的值,N为样本总数;(7)如果MAPE小于等于5%,则气动力数据模型达到要求,根据气动力数据模型以及样本点数据获得飞行器设计空间的所有气动特性数据,如果MAPE大于5%,则气动力数据模型不符合要求,返回步骤(2),在步骤(2)中补充选取抛弃自变量中前2/3的自变量,在步骤(3)中补充选取抛弃自变量中前2/3的自变量,直到MAPE小于等于5%。...

【技术特征摘要】
1.一种基于数据挖掘技术的气动特性数据处理方法,其特征在于包括以下步骤:(1)选取飞行器的样本点数据,将其按状态参数变量和气动特性参数变量进行分类,其中状态参数变量包括马赫数Ma、攻角α、侧滑角β、舵偏角δj、高度H、雷诺数Re、努森数Kn,气动特性参数变量包括气动力六分量,即气动力分量(Cx,Cy,Cz)和气动力矩分量(U,V,W),每个状态参数变量和一个气动特性参数变量构成一个变量对;(2)计算每个变量对的相关系数,记状态参数变量为自变量,气动特性参数变量为因变量,按相关系数从大到小的顺序对自变量排序,选取前2/3的自变量;(3)计算自变量对每个因变量影响的权重系数,按权重系数从大到小的顺序对自变量排序,选取前2/3的自变量;(4)取步骤(2)和步骤(3)选取自变量的并集作为建模自变量;(5)通过离群点分析法剔除气动力六分量明显不合理的数据点,根据剩余数据点通过多元高次交互回归建立气动力数据模型;(6)从样本点数据集合中选取80%为训练集,剩余的20%为测试集,根据训练集中的数据,利用气动力数据模型计算预测值,并与测试集比对,利用如下公式计算平均相对误差MAPE:MAPE=Σi=1N|predi-trueitruei|/N]]>其中predi为第i个样本的预测值,truei为第i个样本在实际测试集中的值,N为样本总数;(7)如果MAPE小于等于5%,则气动力数据模型达到要求,根据气动力数据模型以及样本点数据获得飞行器设计空间的所有气动特性数据,如果MAPE大于5%,则气动力数据模型不符合要求,返回步骤(2),在步骤...

【专利技术属性】
技术研发人员:李华光刘峰尹戈玲刘杰平解海鸥李波胡国暾吴炜平吴莉莉张静蔡巧言张旭辉海尔翰赵大海邵秋虎
申请(专利权)人:中国运载火箭技术研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1