System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于启发式的航空领域故障模式生成方法技术_技高网

基于启发式的航空领域故障模式生成方法技术

技术编号:39957784 阅读:11 留言:0更新日期:2024-01-08 23:48
本发明专利技术涉及一种基于启发式的航空领域故障模式生成方法,其包括:S1、使用词袋模型及词频‑逆文本频率指数法提取航空领域故障文本数据特征;S2、基于k‑means启发式的航空领域故障文本数据聚类类别分析;S3、航空领域故障文本数据的离群值检测、故障提取和故障拼接,得到故障模式名称;S4、实时处理获得的故障描述文本,生成航空领域故障模式。本发明专利技术通过词袋模型及词频‑逆文本频率指数法和k‑means启发式方法完成文本数据聚类类别分析,进一步通过离群值检测、故障提取和拼接,得到故障模式名称,故障文本数据的实时检测;通过定期重聚类能够通过利用已有的先验知识,发现新的故障模式,提高故障模式检测的准确性和有效性。

【技术实现步骤摘要】

本专利技术属于航空故障分析领域,特别涉及一种基于启发式的航空领域故障模式生成方法


技术介绍

1、故障模式一般描述发生故障的状况及其对设备工作所产生的影响,是对故障现象的标准化、规范化描述形式,并在航空领域的fmea、fta、测试性等工作中广泛使用。

2、在航空产品研制、试验和使用过程中,相关的工程师、用户会记录大量航空产品的故障文本,但由于不同的记录者自然语言表达不同,导致对故障现象的描述有所差异,例如,“左侧刹车压力低于规定值”、“左侧刹车压力为9mpa,低于规定的20mpa”都是表达“左侧机轮刹车压力低”这一故障模式。海量差异化的故障记录对于故障规律发现、总体故障态势分析、故障解决措施制定等带来很大挑战。迫切需要针对海量故障文本记录进行统一的归纳、总结,形成规范的、标准的故障模式,支撑航空领域全生命周期故障分析提升产品质量水平。

3、本方法以航空领域故障文本为研究对象,建立存量故障聚类、故障模式生成、新增故障模式分类的故障文本数据处理流程,本专利技术提出针对故障文本数据的基于启发式的故障类别判定方法,故障文本中离群值检测方法,以及基于双仿射模型的嵌套命名实体识别方法,实现对故障文本数据的聚类、故障模式生成以及新数据的分类。


技术实现思路

1、针对现有技术的不足,本专利技术提供了一种基于启发式的航空领域故障模式生成方法,本专利技术通过词袋模型及词频-逆文本频率指数法和k-means启发式方法完成文本数据聚类类别分析,进一步通过离群值检测、故障提取和拼接,得到故障模式名称,故障文本数据的实时检测;通过定期重聚类能够通过利用已有的先验知识,发现新的故障模式,提高故障模式生成的准确性、有效性。

2、为实现上述目的,本专利技术公开了如下技术方案:一种基于启发式的航空领域故障模式生成方法,其包括:

3、s1:使用词袋模型及词频-逆文本频率指数法提取航空领域故障文本数据特征;

4、获取航空领域的故障描述文本集合u={u1,u2,…,um},则对所有故障描述文本ui∈u,进行分词操作得到其分词序列结合所有故障描述文本的分词结果,得到航空领域故障文本数据词典d,构建航空文本数据集合矩阵v;然后,对构建航空文本数据集合矩阵v进行词频-逆文本频率指数法变换,即对每一个元素进行变换,如下所示:

5、

6、其中,t(vij)为故障描述文本数据的词频-逆文本变换矩阵元素;vij为故障描述文本数据集合矩阵的元素;m为故障描述文本数据总数;g为航空领域故障文本数据词典元素总数;f(wi)为统计wi出现的次数;wi为词典中第i个词;fui(wi)为wi在序列ui中出现的次数;i为故障描述文本编号;j为分词序列编号;

7、然后,对所有航空文本数据的词频-逆文本变换矩阵元素t(vij)进行正则化变换,得到矩阵的每个行向量,作为一个故障描述文本数据的特征向量;最终,组成航空领域故障文本的数据特征样本矩阵x={x1,x2,…,xm};

8、s2:基于k-means启发式的航空领域故障文本数据聚类类别分析;

9、获得步骤s1中的航空领域故障文本的数据特征样本矩阵x={x1,x2,…,xm},将其聚类到k个互不相交的特征簇,对于每一个特征簇cj∈{c1,c2,…,cs},通过计算特征簇中样本的均值,以最小化目标值inertia,来获得最佳的特征簇中心向量μj,,如下所示:

10、

11、其中,inertia为最小化目标值;μj为第j个特征簇cj中心向量;xi为数据特征样本矩阵的元素;s为特征簇总数;

12、s3:航空领域故障文本数据的离群值检测、故障提取和故障拼接,得到故障模式名称;

13、s31:使用箱型图完成航空领域故障文本数据的离群值检测;特征簇集合c中元素cl到特征簇中心向量μj的距离为dl=||cl-μj||2,根据距离{d1,d2,…,ds},计算第一四分位数q1和第三四分位数q3,并获得四分位距为:

14、iqr=q3-q1;

15、其中,iqr为四分位距;q1为第一四分位数;q3为第三四分位数;

16、对于距离dl,若其大于阈值q3+1.5iqr,则认为dl所对应的cl是离群值,应对其做删除处理;

17、s32:采用双仿射模型实现嵌套命名实体识别,提取故障主体与现象;输入的故障描述文本经过基于变换器的双向编码器表示编码器和bilstm层进行特征提取以获得其向量表示,获取故障描述文本的每一个有效命名覆盖j,计算其对每个类别的预测概率,使用归一化指数函数的交叉熵的损失函数进行分类,如下所示:

18、

19、其中,loss为交叉熵的损失函数;l为实体类别序号;l为实体类别总数;j为有效命名覆盖;为全体有效命名覆盖的集合;yjl为有效命名覆盖j对实体类别l的符号函数;pm(jl)为覆盖j对类别l的预测概率;

20、s33:拼接故障描述航空领域故障文本数据的所有故障主题和故障现象;在得到每一个特征簇中每一条故障描述文本中的所有故障主体和故障现象短语后,拼接作为这一特征簇的故障模式名称;

21、s4:实时处理获得的故障描述文本,生成航空领域故障模式;

22、获取实时新增的故障描述文本,首先进行步骤s1获得航空领域故障文本数据特征矩阵;然后,根据步骤s2进行航空领域故障文本数据聚类类别分析;最后,通过步骤s3获得故障模式名称,生成航空领域故障模式。

23、可优选的,所述步骤s1中的结合所有故障描述文本的分词结果,得到航空领域故障文本数据词典d,构建航空文本数据集合矩阵v,具体为:

24、首先,获得所有分词序列ui中出现词的集合,得到航空领域故障文本数据词典d为:

25、d={w1,w2,…,wg};

26、其中,d为航空领域故障文本数据词典;w1为词典中第1个词;w2为词典中第2个词;wg为词典中第g个词;

27、然后,确定分词序列uj的词频向量为:

28、

29、其中,为分词序列ui的词频向量;

30、最后,构建航空文本数据集合矩阵v为:

31、

32、其中,vm×g为m行g列的航空文本数据集合矩阵。

33、可优选的,所述步骤s1中对所有航空文本数据的词频-逆文本变换矩阵元素t(vij)进行正则化变换,具体为:

34、根据t(vij)构建的航空文本数据的词频-逆文本变换矩阵为t(v),如下所示:

35、

36、其中,t(v)为航空文本数据的词频-逆文本变换矩阵;

37、再对所有元素t(vij)进行正则化,如下所示

38、

39、其中,n(t(vij))为航空文本数据的词频-逆文本变换矩阵元素的正则化结果;||t(v)i||2为第i行行向量的2-范数;

40、所述第i行行向量的2-范本文档来自技高网...

【技术保护点】

1.一种基于启发式的航空领域故障模式生成方法,其特征在于:其包括:

2.根据权利要求1所述的基于启发式的航空领域故障模式生成方法,其特征在于:所述步骤S1中的结合所有故障描述文本的分词结果,得到航空领域故障文本数据词典D,构建航空文本数据集合矩阵V,具体为:

3.根据权利要求1所述的基于启发式的航空领域故障模式生成方法,其特征在于:所述步骤S1中对所有航空文本数据的词频-逆文本变换矩阵元素T(Vij)进行正则化变换,具体为:

4.根据权利要求2所述的基于启发式的航空领域故障模式生成方法,其特征在于:所述步骤S2聚类到K个互不相交的特征簇使用的是基于数据的K值估计方法,具体为:

5.根据权利要求1所述的基于启发式的航空领域故障模式生成方法,其特征在于:所述步骤S31中的根据距离{d1,d2,…,ds},计算第一四分位数Q1和第三四分位数Q3,具体为:

6.根据权利要求3所述的基于启发式的航空领域故障模式生成方法,其特征在于:所述步骤S32中的输入的故障现象描述文本经过基于变换器的双向编码器表示编码器和BiLSTM层,具体为

7.根据权利要求1所述的基于启发式的航空领域故障模式生成方法,其特征在于:所述步骤S23中的有效命名覆盖Jl的损失参数pm(Jl),具体为:

8.根据权利要求3所述的基于启发式的航空领域故障模式生成方法,其特征在于:所述步骤S33中的拼接故障描述航空领域故障文本数据的所有故障主题和故障现象,具体为:

9.根据权利要求1所述的基于启发式的航空领域故障模式生成方法,其特征在于:所述步骤S4中生成航空领域故障模式后,航空领域故障文本数据随着获取数据的积累,会出现新的故障数据类型;已有的聚类结果需要进行定期更新,进行新增数据与原有数据的重聚类;所述重聚类仅需要在新增的数据上体现新的故障模式。

...

【技术特征摘要】

1.一种基于启发式的航空领域故障模式生成方法,其特征在于:其包括:

2.根据权利要求1所述的基于启发式的航空领域故障模式生成方法,其特征在于:所述步骤s1中的结合所有故障描述文本的分词结果,得到航空领域故障文本数据词典d,构建航空文本数据集合矩阵v,具体为:

3.根据权利要求1所述的基于启发式的航空领域故障模式生成方法,其特征在于:所述步骤s1中对所有航空文本数据的词频-逆文本变换矩阵元素t(vij)进行正则化变换,具体为:

4.根据权利要求2所述的基于启发式的航空领域故障模式生成方法,其特征在于:所述步骤s2聚类到k个互不相交的特征簇使用的是基于数据的k值估计方法,具体为:

5.根据权利要求1所述的基于启发式的航空领域故障模式生成方法,其特征在于:所述步骤s31中的根据距离{d1,d2,…,ds},计算第一四分位数q1和第三四分位数q3,具体为:

【专利技术属性】
技术研发人员:王孝天高龙陶剑刘俊李润岐
申请(专利权)人:中国航空综合技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1