基于自然语言的适航指令问题特征的提取制造技术

技术编号：26792120 阅读：14 留言：0更新日期：2020-12-22 17:07

本发明专利技术涉及适航审定技术领域，具体的讲是基于自然语言的适航指令问题特征的提取，按如下步骤进行提取：提取适航指令背后的问题描述章节，进行文本数据预处理；检测重叠句簇；选择给定数量的句簇；提取特征描述符。本发明专利技术通过检测重叠句簇来提取特征和直接从文本描述中选择短语来提取特征的方法具有更高的准确性，同时，在时间消耗方面也比现有技术选择的对比方法有更好的表现，在实际针对适航指令的特征提取中也能够发现适航指令文本所表达的航空器产品的关键设计特征。

全部详细技术资料下载

【技术实现步骤摘要】
基于自然语言的适航指令问题特征的提取
本专利技术涉及适航审定
，具体的讲是基于自然语言的适航指令问题特征的提取。
技术介绍
在航空器运行全生命周期过程中提取影响安全的设计特征和安全趋势也是适航审查活动的主要开展方式，即适航审定的“监听模式”。监听模式的典型应用是针对设计、制造和使用过程中记录和上报的各类微小偏离和不安全信息。通常情况下，航空器设计、制造和使用环节中会累积大量关于各种偏离和更改的描述信息。这些信息来源、用途以及描述方式各不相同，其中所包含的航空器不安全设计特征往往也并不明显。在数据规模较大的情况下，审查人员无法人工发现和定位与当前活动真正有价值的适航参考信息，从而造成大量有价值的适航辅助信息无法在审查工作中给予审查人员足够的信息支撑。在这种监听模式下，如果能充分利用现有的自然语言处理技术，将相关信息中的不安全特征进行自动提取和推送将极大的改善信息平台中不同业务单元间信息的共享效率。为此设计一种基于自然语言的适航指令问题特征的提取方法是十分有必要的。
技术实现思路
本专利技术突破了现有技术的难题，设计了一种基于自然语言的适航指令问题特征的提取方法，能有效的发现不同航空器设计特征和风险因素，具有更高的准确性，在时间消耗方面也比现有的对比方法有更好的表现。为了达到上述目的，本专利技术设计了基于自然语言的适航指令问题特征的提取方法，其特征在于：按如下步骤进行提取：S1提取适航指令背后的问题描述章节，进行文本数据预处理；S2检测重叠句簇；S3选择给定数量的...

【技术保护点】
1.基于自然语言的适航指令问题特征的提取方法，其特征在于：按如下步骤进行提取：/nS1提取适航指令背后的问题描述章节，进行文本数据预处理；/nS2检测重叠句簇；/nS3选择给定数量的句簇；/nS4提取特征描述符。/n

【技术特征摘要】
1.基于自然语言的适航指令问题特征的提取方法，其特征在于：按如下步骤进行提取：
S1提取适航指令背后的问题描述章节，进行文本数据预处理；
S2检测重叠句簇；
S3选择给定数量的句簇；
S4提取特征描述符。

2.根据权利要求1所述的基于自然语言的适航指令问题特征的提取方法，其特征在于：S1中所述的文本数据预处理为：过滤文本中的噪声描述与单词，然后使用NLTK进行自然语言处理，并获得一个句子列表，该句子列表由TF-IDF向量形式的所有句子组成。

3.根据权利要求1所述的基于自然语言的适航指令问题特征的提取方法，其特征在于：S2所述的检测重叠句簇的具体步骤为：
S21建立句子相似性网络；
S22选择种子；
S23判断是否找到种子，是，则进入下一步，否，则确定该句子为重叠句簇；
S24发现句簇成员；
S25识别句簇的关键词；
S26更新句子相似性网络，重新进入S21步骤，直到所有的句子都确认为重叠句簇。

4.根据权利要求1所述的基于自然语言的适航指令问题特征的提取方法，其特征在于：S3所述的选择给定数量的句簇的具体方法为：按簇大小和簇关键字的平均权重将所发现的句簇进行重新拍列。

5.根据权利要求2所述的基于自然语言的适航指令问题特征的提取方法，其特征在于：所述使用NLTK进行自然语言处理的具体方法为：
(1)句子提取：将产品描述中的各个句子分离；
(2)词汇切分：将句子分割为单词；
(3)词性标注：识别各个单词的词性；
(4)单词选择：只保留动词、名词和形容词；
(5)删除停用词：删除常用的一些不具有特定含义的单词；
(6)词干化：将单词转化词根形式。

6.根据权利要求2所述的基于自然语言的适航指令问题特征的提取方法，其特征在于：所述由TF-IDF向量形式形成的句子列表的方式为：将一个类别内的所有文本表述的句子集合为一个文档，使用TF-IDF方法计算集合中每个单词的权重，将一个类别内文本描述的所有句子转变为向量，将所有句子向量根据公式进行归一化处理；其中xi表示第i个句子的x向量，n表示数量。

7.根据权利要求3所述的基于自然语言的适航指令问题特征的提取方法，其特征在于：所述建立句子相似性网络的方法为：利用...

【专利技术属性】
技术研发人员：朱玉屏，蔡喁，申岳，刘春，
申请(专利权)人：中国民用航空上海航空器适航审定中心，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人