【技术实现步骤摘要】
一种自动构建高端装备制造业故障知识图谱的方法
[0001]本专利技术涉及智能学习
,具体地说是一种自动构建高端装备制造业故障知识图谱的方法
。
技术介绍
[0002]在高端装备领域,故障案例文本的撰写与应用具有重要的实际意义,这些文本通常由业务专家或专业维修人员编写,用以记录设备异常情况及故障排查过程,包括故障现象
、
故障原因
、
解决方法以及排故过程等内容
。
然而,这些故障案例知识的应用与推广受到其数据结构化程度的制约
。
[0003]为了提高故障案例知识的利用率,识别数据中的部件单元
、
性能表征
、
故障状态
、
故障检测工具等核心实体及其组成关系显得尤为重要
。
部件单元作为设备的基本组成单元,其性能表征可以反映设备的工作状态,故障状态则表示设备在运行过程中出现的异常情况,而故障检测工具则是用于诊断故障的设备或方法
。
通过识别这些核心实体及其组成关系,有助于我们更好地理解故障案例,提高故障排查的效率和准确性
。
如果对故障案例文本进行关系抽取任务,很容易发现故障的主体与客体之间存在多对多的关系,也就是说一个主体可能对应多个客体,而其中某一个客体可能对应多个主体
。
[0004]现有技术的故障案例知识是根据上下文进行关系的主体客体的抽取和关系类型的判断,即根据上下文对文本中每个字符进行判断,从而让模型学习到故障案例的知
【技术保护点】
【技术特征摘要】
1.
一种自动构建高端装备制造业故障知识图谱的方法,其特征在于,该方法包括:获得待抽取的故障案例样本,将样本输入到故障案例知识关系抽取模型,并将得到预测关系的类型和关系的主体与客体,对故障案例样本进行训练,自动构建高端装备制造业故障知识图谱,所述故障案例样本的训练包括下述步骤:步骤1:案例样本处理对收集到的故障案例样本按关系主体客体的边界位置和关系的类型对数据进行标注;步骤2:文本表征将样本映射为词表中对应的索引,并送入在大量语料上预训练过的自注意力模型,得到文本表征;步骤3:起始和终止指针的获取在文本表征中加入位置信息,然后对其进行解码,得到三个全局指针器的起始指针和终止指针,并在此添加辅助任务;4:训练模型将得到的三种起始指针和终止指针多次迭代训练故障案例知识关系抽取模型,得到最优模型并保存模型参数,实现自动构建高端装备制造业故障知识图谱
。2.
根据权利要求1所述的自动构建高端装备制造业故障知识图谱的方法,其特征在于,所述步骤3得到三个全局指针器的起始指针和终止指针,一个全局指针器用于抽取实体,它是输入的子序列,全局指针器将输出一个
G
C
×
L
×
L
矩阵,其中
C
为类数,表示关系类型的数量;
L
为序列长度,表示输入序列的最大长度;找到大于阈值的元素,即
g
cij
>threshold
,其中
c∈C
表示一种关系类型;
i∈L
表示实体在序列中的起始位置;
j∈L
表示实体在序列中的结束位置;另一个全局指针器用于抽取相关主体和客体的头位置,全局指针器的输出形状与用于抽取实体的全局指针相同,而每个元素
g
cij
具有不同的含义,
c∈C
表示一种关系类型;
i∈L
表示主体实体的头部;
j∈L
表示客体实体的头部;最后一个全局指针器输出中的每个元素
g
cij
表示输入序列中有关系的主体实体和客体实体的结束位置,在将三个全局指针器输出结合后,就可获得关系三元组
(s,r,o)。3.
根据权利要求1所述的自动构建高端装备制造业故障知识图谱的方法,其特征在于,所述所述步骤3中添加辅助任务具体包括:3‑1:根据位置获得训练过程中每一批次所有样本的主体表征和客体表征;3‑2:根据所有的实体表征向量与客体表征向量进行相似度计算,得到交叉熵...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。