一种飞机任务传感器多过程域测试数据融合信息拾取方法技术

技术编号:39046739 阅读:8 留言:0更新日期:2023-10-10 11:59
本申请属于传感器测试数据智能分析领域,具体涉及一种飞机任务传感器多过程域测试数据融合信息拾取方法,其内容包括:先根据数据量对过程域进行划分,分为小样本过程域数据和大样本过程域数据,对于小样本过程域数据,基于交叉熵实现信息拾取;对于大样本过程域数据,采用线性相关系数与非线性相关系数结合的方法进行大样本数据信息拾取;最后,在此基础上得到多个过程域与目标参数具有高相关性的完整特征集,实现多过程域数据的信息拾取。该方法能够提取与目标参数存在线性与非线性相关的特征,时间复杂度较低,适用于体量大的数据。信息拾取的参数相关度较高,可以准确地拾取到多个过程域测试数据与飞行精度的主要相关信息。关信息。关信息。

【技术实现步骤摘要】
一种飞机任务传感器多过程域测试数据融合信息拾取方法


[0001]本申请属于传感器测试数据智能分析领域,具体涉及一种飞机任务传感器多过程域测试数据融合信息拾取方法。

技术介绍

[0002]通过分析飞机生产中各过程的任务传感器测试数据,推断任务传感器飞行时的精度是否达到出厂指标要求,对于提高飞机试飞效率、保障一次性合格率具有重要实际价值和意义。
[0003]然而,由于飞机原始任务传感器测试数据涉及多个过程域,不同过程域测试数据维度和样本量差距较大,导致用于任务传感器精度评估的测试数据质量下降,无法直接将原始测试数据用于精度评估,且冗余测试数据会显著增加精度评估的存储需求和计算复杂度。
[0004]为此,需要对任务传感器多过程域下的测试数据进行信息拾取,以提取有效的测试数据信息。目前,常用的信息拾取方法往往基于某种相关度量变量来衡量原始数据各项特征与目标参数的相关性,从而选出与目标参数存在高相关度的特征,构成新的数据集替代原始数据进行数据挖掘,该类方法可以反映目标与多维数据特征之间的相关关系,且具有效率高、泛化能力好等优点。
[0005]然而,由于目前常见的信息拾取方法只依据某一种相关度量变量对数据进行选择,无法在适应海量数据巨大计算量的同时,使得所选特征集同时具有较好的线性相关性和非线性相关性,具有一定的局限性。
[0006]经分析,飞机多过程域测试数据的各参数项与飞行精度关系比较复杂,同时存在线性相关特征和非线性相关特征,且会有外部环境等噪声影响,并且各过程域的数据维度和样本量大小不一致,为了在保证较低时间复杂度的前提下更全面的探索各特征与目标参数间的相关关系,需要依据不同过程域中数据的特性对各过程域采用不同的相关度量变量进行信息拾取。

技术实现思路

[0007]本专利技术的目的是为了解决上述现有技术存在的问题,即现有的信息拾取方法应用于多过程域测试数据时,无法在保证低时间复杂度的基础上,使结果较为全面的覆盖目标参数相关信息。因此,本专利技术提出一种飞机任务传感器多过程域测试数据融合信息拾取方法.
[0008]为实现上述技术效果,本申请的技术方案如下:
[0009]一种飞机任务传感器多过程域测试数据融合信息拾取方法,包括如下步骤:
[0010]首先根据数据量对过程域进行划分,分为小样本过程域数据和大样本过程域数据,对于小样本过程域数据,基于交叉熵实现信息拾取;对于大样本过程域数据,采用线性相关系数与非线性相关系数结合的方法进行大样本数据信息拾取,得到更全面的信息拾取
结果;最后,在此基础上得到多个过程域与目标参数具有高相关性的完整特征集,实现多过程域数据的信息拾取。
[0011]进一步地,一种飞机任务传感器多过程域测试数据融合信息拾取方法具体步骤如下:
[0012]步骤一,获取多域数据;
[0013]步骤二,将多域数据划分为小样本过程域数据和大样本过程域数据;
[0014]步骤三,针对小样本过程域数据,基于交叉熵的信息拾取方法,交叉熵用来表征两个分布的相似程度,通过计算特征与目标参数的联合分布密度来表征交叉熵,并根据交叉熵判断特征与目标参数的相关性、计算相关系数,设置阈值筛选出相关阈值符合要求的特征,从而进行信息拾取;
[0015]步骤四,针对大样本过程域数据,先计算各特征与目标参数的协方差和标准差,选出与目标变量存在较高线性相关性的特征;再分析各特征与目标参数之间的独立性,并基于此选出非线性相关特征,从而得到更全面的信息拾取结果;
[0016]步骤五,将针对小样本过程域数据信息拾取得到的特征集和针对大样本过程域数据信息拾取得到的特征集汇总,得到多个过程域与目标参数具有高相关性的完整特征集,实现多过程域数据的信息拾取。
[0017]进一步地,步骤二中将多域数据划分为小样本过程域数据和大样本过程域数据的标准为本领域现有方法。
[0018]进一步地,步骤三的具体流程如下:
[0019]1)假设一个任务系统经过多过程域测试得到数据集为D为过程域的数量,对数据集进行预处理后,得到预处理后数据集为则经预处理后的第i个过程域的数据集记为:
[0020][0021]目标参数记为:
[0022][0023]其中,n表示任务系统的样本数量,m表示此过程域的特征数量;
[0024]2)进行数据联合分布密度计算:将特征与目标变量离散在二维空间中,并且使用散点图来表示,将当前二维空间在X轴,Y轴方向分别划分为x格和y格,根据散点在各个方格中落入的情况,计算和的联合分布密度,公式如下:
[0025][0026]其中,n
ij
为落在位于第i行,第j列的格子里的点数,n
iY
为落在位于第i行所有格子里的点数和,n
Xj
为落在位于第j列所有格子里的点数和,m为总点数;
[0027]由联合分布密度计算特征与目标参量间的相关性记为:
[0028][0029]调整画线的位置和数量,使大多数点分布在少量几个格子里,此时可以得到最大交叉熵,计算最大相关系数如下式:
[0030][0031]其中B为可搜寻网格的上界,控制了能够检测的相关关系的复杂度。
[0032]通过相关系数拾取地面测试过程域与飞行精度相关的参数项,假设各过程域拾取的参数项个数统一用m'表示,n表示任务系统的样本数量,最终得到第i过程域信息拾取后的数据,可以表达为:
[0033][0034]再进一步地的,步骤1)中对数据集的预处理包括:剔除重复值和离群点和填补空缺值。
[0035]进一步地,步骤四具体为:
[0036]针对部分过程域中的时间序列存在大量样本的大样本过程域数据,基于线性与非线性相关系数结合的方法实现大样本量的过程域数据信息拾取,首先对大样本过程域数据进行预处理,预处理后的飞行数据与公式(1)的表达式相同;
[0037]假设过程域数据的第k个特征表达式为飞行精度序列与公式(2)的表达式相同;
[0038]首先,计算过程域参数与飞行精度的线性相关系数,相关系数越接近于1,表示两变量线性相关性越强,结合相关系数根据实际工作需要选择符合要求参数项;
[0039]然后,计算过程域参数与飞行精度的非线性相关系数,当距离相关系数为0时,说明两个参数项相互独立,距离相关系数越大,说明两个参数项的距离相关性越强,结合相关系数根据实际工作需要选择符合要求参数项。
[0040]再进一步地,针对大样本过程域数据的数据集的预处理包括:剔除重复值和离群点和填补空缺值。
[0041]再进一步地,计算过程域参数与飞行精度的线性相关系数的具体计算公式如下:
[0042][0043]其中,E(
·
)为数学期望或均值,D(
·
)为方差,开根号为标准差,Cov(x
i
,y
i
)为随机变量x
i
,y
i
的协方差。
...

【技术保护点】

【技术特征摘要】
1.一种飞机任务传感器多过程域测试数据融合信息拾取方法,其特征在于:包括如下步骤:首先根据数据量对过程域进行划分,分为小样本过程域数据和大样本过程域数据,对于小样本过程域数据,基于交叉熵实现信息拾取;对于大样本过程域数据,采用线性相关系数与非线性相关系数结合的方法进行大样本数据信息拾取,得到更全面的信息拾取结果;最后,在此基础上得到多个过程域与目标参数具有高相关性的完整特征集,实现多过程域数据的信息拾取。2.根据权利要求1所述的一种飞机任务传感器多过程域测试数据融合信息拾取方法,其特征在于:具体步骤如下:步骤一,获取多域数据;步骤二,将多域数据划分为小样本过程域数据和大样本过程域数据;步骤三,针对小样本过程域数据,基于交叉熵的信息拾取方法,交叉熵用来表征两个分布的相似程度,通过计算特征与目标参数的联合分布密度来表征交叉熵,并根据交叉熵判断特征与目标参数的相关性、计算相关系数,设置阈值筛选出相关阈值符合要求的特征,从而进行信息拾取;步骤四,针对大样本过程域数据,先计算各特征与目标参数的协方差和标准差,选出与目标变量存在较高线性相关性的特征;再分析各特征与目标参数之间的独立性,并基于此选出非线性相关特征,从而得到更全面的信息拾取结果;步骤五,将针对小样本过程域数据信息拾取得到的特征集和针对大样本过程域数据信息拾取得到的特征集汇总,得到多个过程域与目标参数具有高相关性的完整特征集,实现多过程域数据的信息拾取。3.根据权利要求1所述的一种飞机任务传感器多过程域测试数据融合信息拾取方法,其特征在于:步骤二中将多域数据划分为小样本过程域数据和大样本过程域数据的标准为本领域现有方法。4.根据权利要求1所述的一种飞机任务传感器多过程域测试数据融合信息拾取方法,其特征在于:步骤三的具体流程如下:1)假设一个任务系统经过多过程域测试得到数据集为D为过程域的数量,对数据集进行预处理后,得到预处理后数据集为则经预处理后的第i个过程域的数据集记为:目标参数记为:
其中,n表示任务系统的样本数量,m表示此过程域的特征数量;2)进行数据联合分布密度计算:将特征与目标变量离散在二维空间中,并且使用散点图来表示,将当前二维空间在X轴,Y轴方向分别划分为x格和y格,根据散点在各个方格中落入的情况,计算和的联合分布密度,公式如下:其中,n
ij
为落在位于第i行,第j列的格子里的点数,n
iY
为落在位于第i行所有格子里的点数和,n
Xj
为落在位于第j列所有格子里的点数和,m为总点数;由联合分布密度计算特征与目标参量间的相关...

【专利技术属性】
技术研发人员:耿畅向胜华王媛刘大同曾苏凡迟鹏飞
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1