System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种实体关系三元组抽取方法、系统及计算机设备技术方案_技高网

一种实体关系三元组抽取方法、系统及计算机设备技术方案

技术编号:40909376 阅读:2 留言:0更新日期:2024-04-18 14:38
本发明专利技术公开了一种实体关系三元组抽取方法、系统及计算机设备,涉及知识图谱构建技术领域,包括以下步骤:获取无人机非结构化故障知识文本;将无人机非结构化故障知识文本输入至Hor‑Ver‑Casrel模型,对三元组进行抽取,包括:基于头实体的具体位置,对头实体的水平与垂直方向进行信息融合,得到头实体水平与垂直方向的向量表示并级联,得到头实体的信息表示;将每个字符的向量表示与头实体最终的信息表示相结合,构建每个关系的映射函数,根据每个关系的映射函数预测尾实体,完成三元组的抽取。本发明专利技术将级联的水平与垂直方向的向量表示作为头实体的最终信息表示,保留了头实体的语义信息,大大减小了对后续尾实体的抽取的影响。

【技术实现步骤摘要】

本专利技术涉及知识图谱构建,特别是涉及一种实体关系三元组抽取方法、系统及计算机设备


技术介绍

1、传统的无人机系统故障诊断方法就是依赖经验丰富的专家或工程技术人员现场排查,需要大量的人力保障和高昂的维护成本,随着信息科技的发展,为克服现场排查带来的弊端,将大数据、知识图谱、人工智能等方法应用于各类故障的辅助诊断和智能预测过程中,能够有效推动无人机系统快速智能排故。其中以知识图谱为代表的智能化数据处理技术,能够凭借其细粒度知识管理模式、良好智能交互过程以及多渠道接入方式,普遍应用于各行业中的产品咨询、运维服务以及统计分析等工作中。将其应用于无人机系统维修保障过程中,具有以下几种优势:1)可根据用户使用数据,统计各设备故障率实现历史数据的可视化,便于更好地开展维修保障工作;2)可融入大量的专家知识和技术人员经验,构建系统故障知识库,当故障发生时,能从领域知识库中快速提取该故障的故障现象和故障排除方法,第一时间为用户提供指导,平时也可用于一线部队使用管理人员的学习和训练,提升排故能力;3)建立典型故障与飞行任务、飞机构型、维修工作、飞参信息、检测结果等数据间的关联关系,消除信息鸿沟与时空障碍,通过智能问答与语义检索,快速提供各类无人机系统故障信息,有力支撑排除工作;4)当前端系统提供指导但故障仍然不能排除时,可以切入人工服务,专业技术人员将通过后端服务系统进行在线指导,扮演了部分远程专家诊断的角色。

2、实体关系三元组抽取是知识图谱构建过程中不可缺少的步骤,实体关系三元组抽取指从非结构化文本中抽取出实体对,并确定实体之间的关系。实体关系三元组结构为(主语,关系,宾语),例如(故障,故障部位,组成单元)。由于深度神经网络可以很好地编码文本的语义信息,因此基于深度神经网络的三元组提取方法是目前最有竞争力的方法。大部分的三元组抽取方法都是抽取出头实体与尾实体,然后将关系视为实体对上的离散标签进行处理,这种方式对于重叠的三元组情况的提取效果不好。针对这种三元组重叠的问题,使用级联二进制标注的框架(a novel cascade binary tagging framework for relationaltriple extraction,casrel)可以缓解这种问题。该模型的基本流程为:先抽取头实体,然后将关系建模为映射函数,将将主语映射到句子中的宾语,从而自然地处理重叠问题,而不是像以前的工作那样将关系视为离散的标签。

3、在级联二进制框架中,仅仅用头实体的起始向量与结束向量的加和平均作为头实体的信息,这样严重损失了头实体的语义信息,从而直接影响后续尾实体的抽取。


技术实现思路

1、本专利技术提供了一种实体关系三元组抽取方法、系统及计算机设备,具体涉及一种无人机故障知识图谱构建过程中的实体关系三元组抽取方法及系统,解决了现有在级联二进制框架中,仅仅用头实体的起始向量与结束向量的加和平均作为头实体的信息,这样严重损失了头实体的语义信息,从而直接影响后续尾实体的抽取的问题。

2、本专利技术提供一种实体关系三元组抽取方法,包括以下步骤:

3、获取无人机非结构化故障知识文本;

4、对casrel模型进行改进,得到hor-ver-casrel模型;所述hor-ver-casrel模型在对头实体的信息进行表示时,融合了头实体水平与垂直方向的信息;

5、将无人机非结构化故障知识文本输入至hor-ver-casrel模型,对故障知识文本实体关系三元组进行抽取,包括:

6、将无人机非结构化故障知识文本输入至bert模块,获取每个字符的向量表示;

7、基于每个字符的向量表示对头实体的起始位置与结束位置进行预测,得到头实体的具体位置;

8、基于头实体的具体位置,对头实体的水平与垂直方向的信息进行融合,得到头实体水平与垂直方向的向量表示并级联,得到头实体的信息表示;

9、将每个字符的向量表示与头实体最终的信息表示相结合,构建头实体对应的每个关系的映射函数,根据每个关系的映射函数预测尾实体,完成实体关系三元组的抽取。

10、优选的,所述无人机非结构化故障知识文本包括历史故障案例、操作规程以及排故手册。

11、优选的,所述bert模块通过无人机非结构化故障知识文本中字符之间的关联程度调整权重系数矩阵来输出每个字符的词向量表示;

12、通过下式计算每个字符的词向量表示:

13、

14、式中,q,k,v为字向量矩阵,dk为嵌套维度,attention为自注意力机制函数,softmax为激活函数,t为矩阵的转置符号。

15、优选的,通过下式对头实体的起始位置与结束位置进行预测:

16、

17、

18、式中,fi为每个字符的向量表示,为第i个字符预测的头实体的起始位置的标签,为第i个字符预测的头实体的结束位置的标签,wstart为预测头实体起始位置的权重矩阵,bstart为预测头实体起始位置的偏差,wend为预测头实体结束位置的权重矩阵,bend为预测头实体结束位置的偏差,σ为全连接层。

19、优选的,头实体水平与垂直方向的向量表示如下所示:

20、

21、

22、式中,fa为头实体起始位置的词向量,fb为头实体结束位置的词向量,average为向量加和求平均操作,sum为向量求和操作,为头实体水平方向的向量表示,为头实体垂直方向的向量表示,wsub为预测头实体垂直方向向量的权重矩阵,bsub为预测头实体垂直方向向量的偏差;

23、头实体的信息表示如下所示:

24、

25、式中,vsub为头实体的信息表示。

26、优选的,通过下式对尾实体进行预测:

27、

28、

29、式中,为第i个字符预测的尾实体的起始位置标签,为第i个字符预测的尾实体的结束位置标签,为关系映射下预测尾实体起始位置的权重矩阵,为关系映射下预测尾实体起始位置的偏差,为关系映射下预测尾实体结束位置的权重矩阵,为关系映射下预测尾实体结束位置的偏差。

30、优选的,将无人机非结构化故障知识文本输入至hor-ver-casrel模型之前,需通过极大似然估计对hor-ver-casrel模型进行训练;所述极大似然估计的似然函数包括对头实体预测的似然函数以及对关系、尾实体预测的似然函数。

31、优选的,所述对头实体预测的似然函数如下所示:

32、

33、式中,θ={wstart,bstart,wend,bend},start_s表示头实体起始位置标识,end_s表示头实体结束位置标识,表示第i个字符是头实体的起始位置,表示第i个字符是头实体的结束位置,l为句子长度,i为示性函数,p为似然函数,s为头实体标识,为第i个字符是头实体起始位置的概率,为第i个字符是头实体结束位置的概率,;

34、所述本文档来自技高网...

【技术保护点】

1.一种实体关系三元组抽取方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种实体关系三元组抽取方法,其特征在于,所述无人机非结构化故障知识文本包括历史故障案例、操作规程以及排故手册。

3.如权利要求1所述的一种实体关系三元组抽取方法,其特征在于,所述Bert模块通过无人机非结构化故障知识文本中字符之间的关联程度调整权重系数矩阵来输出每个字符的词向量表示;

4.如权利要求3所述的一种实体关系三元组抽取方法,其特征在于,通过下式对头实体的起始位置与结束位置进行预测:

5.如权利要求4所述的一种实体关系三元组抽取方法,其特征在于,头实体水平与垂直方向的向量表示如下所示:

6.如权利要求5所述的一种实体关系三元组抽取方法,其特征在于,通过下式对尾实体进行预测:

7.如权利要求6所述的一种实体关系三元组抽取方法,其特征在于,将无人机非结构化故障知识文本输入至Hor-Ver-Casrel模型之前,需通过极大似然估计对Hor-Ver-Casrel模型进行训练;所述极大似然估计的似然函数包括对头实体预测的似然函数以及对关系、尾实体预测的似然函数。

8.如权利要求7所述的一种实体关系三元组抽取方法,其特征在于,所述对头实体预测的似然函数如下所示:

9.一种实体关系三元组抽取系统,其特征在于,包括:

10.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1-8任一所述的实体关系三元组抽取方法。

...

【技术特征摘要】

1.一种实体关系三元组抽取方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种实体关系三元组抽取方法,其特征在于,所述无人机非结构化故障知识文本包括历史故障案例、操作规程以及排故手册。

3.如权利要求1所述的一种实体关系三元组抽取方法,其特征在于,所述bert模块通过无人机非结构化故障知识文本中字符之间的关联程度调整权重系数矩阵来输出每个字符的词向量表示;

4.如权利要求3所述的一种实体关系三元组抽取方法,其特征在于,通过下式对头实体的起始位置与结束位置进行预测:

5.如权利要求4所述的一种实体关系三元组抽取方法,其特征在于,头实体水平与垂直方向的向量表示如下所示:

6.如权利要求5所述的一种实体关系三元组抽取方法,其特征...

【专利技术属性】
技术研发人员:崔利杰谢小月唐希浪任博李新春胡俊英张海王煜华池果
申请(专利权)人:中国人民解放军空军工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1