一种基于飞行器维修的知识推理方法技术

技术编号:30827998 阅读:29 留言:0更新日期:2021-11-18 12:32
本发明专利技术提出了一种基于飞行器维修的知识推理方法,属于知识图谱知识推理领域;该方法包括:首先,对技术跟踪数据进行处理,将其提取为实体

【技术实现步骤摘要】
一种基于飞行器维修的知识推理方法


[0001]本专利技术属于知识推理领域,具体涉及到种基于飞行器维修知识图谱的知识推理方法。

技术介绍

[0002]知识推理技术是知识图谱(Knowledge Graph,KG)的一个重要应用领域,能够在基于已有知识图谱事实的基础上,预测出三元组中缺失的部分,从而补充并丰富知识图谱,传统的知识推理有两种主流方法:基于规则的知识推理和基于本体的知识推理;
[0003]基于规则的推理需要依赖于规则、前提、特定假设等条件,基于规则的知识推理很早就受到了广泛关注,其依赖的位于实体之上的规则和假设易于理解,具有较好的可解释性,产生了一系列的推理方法,早期的NELL知识图谱采用一阶关系学习算法进行知识图谱推理,后来的研究者对基于规则的推理方法进行了进一步的完善与改进;
[0004]上述基于规则的推理是最基础的,严重依赖于规则的严格匹配和离散逻辑操作,无法处理模糊和噪声数据,预先制定的评估标准限制了所学规则的表达能力。之后的研究者用多种方法对传统方法的知识推理进行了改进和完善,Jiang等人利用启发式规则对知识图谱中不确定的知识进行处理,提出了基于MLN的系统去噪抽取的NELL知识图谱;Chen等人则提出了本体路径发现算法OP(ontological pathfinding),用发现的规则丰富知识图谱;
[0005]基于规则的推理依赖的规则和假设易于理解,具有较好的可解释性,但也具有明显的局限性——无法处理模糊和噪声数据,预先制定的评估标准限制了所学规则的表达能力;基于本体推理主要利用较为抽象化的本体约束或路径进行推理,当规则、特征、约束或路径有效时,准确率较高;目前典型高准确率要求的知识图谱,大多都采用该推理方法,但上述无论是基于规则的推理还是基于本体约束的推理方法,都需要进行实例化,可计算性差,并且统计特征十分依赖现有的数据,不易迁移,对稀疏样本的处理情况较差;
[0006]然而,随着深度学习技术的发展,更多的研究者对基于深度学习方法的知识推理进行研究。深度学习的最新进步促进了知识图谱上的神经推理,知识图谱对模糊和噪声数据具有鲁棒性,因而被广泛使用,Bordes等人提出了首个基于翻译的表示模型TransE,掀起了Trans系列的研究热潮;在后来的研究中,Wang等人为了更好地处理多映射关系的问题,在TransE的基础上将实体映射到关系指定的超平面,使得同一个实体在不同关系指定的超平面有不同的表示;
[0007]本文结合非结构化文本的语义信息与基于翻译的知识表示,从而进一步提高了知识推理的准确性。

技术实现思路

[0008]目前的知识推理无论是使用基于规则的方法、基于本体的方法还是深度学习方法,普遍忽略了文本中的附加信息和知识图谱的结构信息,为了解决这个问题,本文把用于
预测的三元组数据形式扩展为四元组,将文本中容易被忽略的语义信息作为实体放入四元组中加以训练,旨进一步提高推理的准确性。我们方法的具体流程如下:
[0009]步骤(A)数据预处理;
[0010]步骤(B)飞行器维修知识图谱的构建;
[0011]步骤(C)基于知识图谱进行知识提取;
[0012]步骤(D)使用构建的四元组进行知识推理;
[0013]步骤(E)对推理结果进行评价;
[0014]本专利技术的有益效果:
[0015]1)准确性:将为结构化文本中的语义信息和关系抽取的三元组共同输入到模型中,在训练过程中,能够更加准确的预测出具有潜在关系的实体,提高整个知识推理的准确性。
[0016]2)算法简洁,高效准确,具有更广泛的实用意义。
附图说明
[0017]图1为飞行器故障知识推理流程图。
[0018]图2为训练过程中随轮次变化的损失值。
具体实施方式
[0019]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例对本专利技术进行进一步详细说明:
[0020]如图1所示,本实施例的飞行器维修知识推理方法,包括以下步骤:
[0021]步骤(A):对原始数据进行预处理,包括数据清洗和自然语言处理:一是整理获取的飞行器技术跟踪数据,针对数据缺失和冗余等数据质量问题,建立属性约束和完整性约束进行数据筛选与重复数据的冗余清除;二是使用分词工具将经过预处理的文本信息进行分词,参照停用词典去除标点符号、停用词等;
[0022]步骤(B):飞行器知识图谱的构建,使用Neo4j对维修信息、故障信息及其关系以实体为中心进行存储,调用python中的py2neo模块,采用自底向上的方法构建飞行器维修知识图谱,每个实体,如“故障”、“下部措施”、“部件信息”等都是一个独立的节点,每个事件与事件具体信息之间存储为“关系”;
[0023]步骤(C):基于知识图谱进行知识提取,使用Cypher语句将构建好的知识图谱导出为CSV格式并解析,然后结合非结构化文本中的附加信息,构建出符合推理形式的四元组;
[0024]步骤(D):使用构建的四元组进行知识推理,根据已经定义好关系的四元组将每个四元组实例(head,relation,tail,information)中的关系relation看作从头实体到尾实体的翻译,通过不断调整h、r、t、n(head,relation,tail,information的向量),使(h+r+n)尽可能与t相等;
[0025]步骤(E):对推理结果进行评价,以已知正确的三元组为例,将其头实体或尾实体依次替换为语料库中的其他实体,得到n个三元组,分别对其计算h+r+n

t的值,并对这n个值进行升序排序,然后记录已知正确三元组的值经过排序后的序号m,如果前m

1个三元组中有x个三元组也是正确的,那么将已知正确三元组的序号改为m

x,最后对所有已知正确
的三元组重复上述过程,用正确三元组的排名情况评估训练效果(尾实体同理),评估的两个度量标准为:Hit@10:前十个的命中率;Mean rank:平均第几个命中;
[0026]实验过程需要一个飞机故障维修的文本数据集并将数据集按照格式分为train.txt,test.txt,entity2id.txt,relation2id.txt,information2id.txt五个文件,输入,进行训练,伪代码算法如下:
[0027][0028]
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.本发明提出了一种基于飞行器维修的知识推理方法,将非结构化文本的附加信息与知识推理三元组相结合,进而实现更高效准确的知识推理,主要包含以下步骤:步骤(A)数据预处理;步骤(B)飞行器维修知识图谱的构建;步骤(C)基于知识图谱进行知识提取;步骤(D)使用构建的四元组进行知识推理;步骤(E)对推理结果进行评价。2.根据权利要求1所述的一种基于飞行器维修的知识推理方法,其特征在于:步骤(A),对原始数据进行预处理,包括数据清洗和自然语言处理:一是整理获取的飞行器技术跟踪数据,针对数据缺失和冗余等数据质量问题,建立属性约束和完整性约束进行数据筛选与重复数据的冗余清除;二是使用分词工具将经过预处理的文本信息进行分词,参照停用词典去除标点符号、停用词等。3.根据权利要求1所述的一种基于飞行器维修的知识推理方法,其特征在于:步骤(B),飞行器知识图谱的构建,使用Neo4j对维修信息、故障信息及其关系以实体为中心进行存储,调用python中的py2neo模块,采用自底向上的方法构建飞行器维修知识图谱,每个实体,如“故障”、“下部措施”、“部件信息”等都是一个独立的节点,每个事件与事件具体信息之间存储为“关系”。4.根据权利要求1所述的一种基于飞行器维修的知识推理方法,其特征在于:步骤(C),基于知识图谱进行知识提取,使用Cypher语句将构建好的知识图谱导出为CSV...

【专利技术属性】
技术研发人员:肖乐岳思雯李清杨卫东段梦诗李家馨
申请(专利权)人:河南工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1