System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 本体匹配模型的训练方法、本体匹配方法及相关设备组成比例_技高网

本体匹配模型的训练方法、本体匹配方法及相关设备组成比例

技术编号:41207015 阅读:5 留言:0更新日期:2024-05-07 22:33
本申请公开了一种本体匹配模型的训练方法、本体匹配方法及相关设备,用于提高实体向量的语义表示能力,提高本体匹配精度。所述本体匹配模型的训练方法包括:获取样本本体和参考实体匹配关系,样本本体包括第一样本本体和第二样本本体;针对每个样本本体内的实体,通过本体匹配模型的向量表示网络对实体进行向量表示,得到实体的实体向量,通过本体匹配模型的去噪编码器对实体的实体向量进行重构,得到实体的重构向量;基于第一样本本体内的实体的重构向量和第二样本本体内的实体的重构向量,预测第一样本本体与第二样本本体之间的实体匹配关系,基于预测的实体匹配关系和参考实体匹配关系,对本体匹配模型进行优化训练。

【技术实现步骤摘要】

本申请涉及自然语言处理,尤其涉及一种本体匹配模型的训练方法、本体匹配方法及相关设备


技术介绍

1、本体(ontoloy)是构成语义网络的基础,具体理解为对某一领域团体共同认可的、可共享的知识的一种明确地、形式化地定义。由于不同设计者对同一领域中的概念、属性和关系等相关元素的理解存在偏差,导致同一领域可能出现多个本体,这些本体中的概念可能出现本体异构问题,阻碍本体之间的互相操作,进而最高语义网中知识库的重用、共享等。

2、本体匹配是解决本体异构问题的重要技术手段之一。本体匹配的基本思想是挖掘不同本体之间的相似性,在不同本体内的实体之间建立联系。相关技术中,通常根据各本体内的实体的词向量,将不同本体内的实体进行匹配。然而,这类词向量的语义表示能力较弱,无法契合具体语境下的含义,导致本体匹配精度不高。


技术实现思路

1、本申请实施例的目的提供一种本体匹配模型的训练方法、本体匹配方法及相关设备,用于提高实体向量的语义表示能力,提高本体匹配精度。

2、为了实现上述目的,本申请实施例采用下述技术方案:

3、第一方面,本申请实施例提供一种本体匹配模型的训练方法,包括:

4、获取样本本体和参考实体匹配关系,所述样本本体包括第一样本本体和第二样本本体,所述参考实体匹配关系为所述第一样本本体与所述第二样本本体之间的实体匹配关系,所述第一样本本体和所述第二样本本体用于描述同一对象,每个样本本体包含用于描述所述对象的实体;

5、针对每个样本本体内的实体,通过本体匹配模型的向量表示网络对所述实体进行向量表示,得到实体向量,通过所述本体匹配模型的去噪编码器对所述实体向量进行重构,得到重构向量;

6、基于所述第一样本本体内的实体的重构向量和所述第二样本本体内的实体的重构向量,预测所述第一样本本体与所述第二样本本体之间的实体匹配关系;

7、基于预测的实体匹配关系和所述参考实体匹配关系,对所述本体匹配模型进行优化训练。

8、本申请实施例提供的本体匹配模型的训练方法,通过在向量表示网络的输出端增加去噪编码器,以形成新的本体匹配模型;在训练过程中,针对各个样本本体内的实体,通过向量表示网络对实体进行向量表示得到实体向量,通过去噪编码器对实体向量进行重构,有利于降低实体向量中的噪声,使得得到的重构向量包含更少的噪声,契合实体在具体语境下的含义;基于第一样本本体内的实体的重构向量和第二样本本体内的实体的重构向量,预测得到的第一样本本体与第二样本本体之间的实体匹配关系更准确,基于预测的实体匹配关系和参考实体匹配关系,对本体匹配模型进行优化训练,有利于增强向量表示网络的向量表示能力以及去噪编码器对实体向量的去噪能力,进而通过训练后的本体匹配模型,能够使本体匹配任务达到匹配精度更高的匹配效果。

9、第二方面,本申请实施例提供一种本体匹配方法,包括:

10、获取待匹配的第一本体和第二本体;

11、针对每个本体内的实体,通过训练后的本体匹配模型的向量表示网络对所述实体进行向量表示,得到实体向量,通过所述本体匹配模型的去噪编码器对所述实体向量进行重构,得到重构向量;

12、基于所述第一本体内的实体的重构向量和所述第二本体内的实体的重构向量,预测所述第一本体与所述第二本体之间的实体匹配关系。

13、本申请实施例提供的本体匹配方法,针对每个本体内的实体,利用训练好的本体匹配模型中的向量表示网络,对实体进行向量表示,得到实体向量,通过去噪编码器对实体向量进行重构,使得得到的重构向量包含更少的噪声,契合实体在具体语境下的含义,因而具有更强的语义表示能力;基于第一本体内的实体的重构向量和第二本体内的实体的重构向量,预测第一本体与第二本体之间的实体匹配关系,所得的预测结果更准确,从而使本体匹配任务达到匹配精度更高的匹配效果。

14、第三方面,本申请实施例提供一种本体匹配模型的训练装置,包括:

15、第一获取单元,用于获取样本本体和参考实体匹配关系,所述样本本体包括第一样本本体和第二样本本体,所述参考实体匹配关系为所述第一样本本体与所述第二样本本体之间的实体匹配关系,所述第一样本本体和所述第二样本本体用于描述同一对象,每个样本本体包含用于描述所述对象的实体;

16、第一表示单元,用于针对每个样本本体内的实体,通过本体匹配模型的向量表示网络对所述实体进行向量表示,得到实体向量,通过所述本体匹配模型的去噪编码器对所述实体向量进行重构,得到重构向量;

17、第一预测单元,用于基于所述第一样本本体内的实体的重构向量和所述第二样本本体内的实体的重构向量,预测所述第一样本本体与所述第二样本本体之间的实体匹配关系;

18、训练单元,用于基于预测的实体匹配关系和所述参考实体匹配关系,对所述本体匹配模型进行优化训练。

19、第四方面,本申请实施例提供一种本体匹配装置,包括:

20、第二获取单元,用于获取待匹配的第一本体和第二本体;

21、第二表示单元,用于针对每个本体内的实体,通过训练后的本体匹配模型的向量表示网络对所述实体进行向量表示,得到实体向量,通过所述本体匹配模型的去噪编码器对所述实体向量进行重构,得到重构向量;

22、第二预测单元,用于基于所述第一本体内的实体的重构向量和所述第二本体内的实体的重构向量,预测所述第一本体与所述第二本体之间的实体匹配关系。

23、第五方面,本申请实施例提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的本体匹配模型的训练方法;或者,所述处理器被配置为执行所述指令,以实现如第二方面所述的本体匹配方法。

24、第六方面,本申请实施例提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面所述的本体匹配模型的训练方法;或者,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第二方面所述的本体匹配方法。

本文档来自技高网...

【技术保护点】

1.一种本体匹配模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,针对每个样本本体的实体向量,所述通过所述本体匹配模型的去噪编码器对所述实体向量进行重构,得到重构向量,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于预测的实体匹配关系和所述参考实体匹配关系,对所述本体匹配模型进行优化训练,包括:

4.根据权利要求1所述的方法,其特征在于,所述向量表示网络包括预训练语言模型和全连接层;所述通过本体匹配模型的向量表示网络对所述样本本体内的实体进行向量表示,得到所述样本本体内的实体的实体向量,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述第一样本本体内的实体的重构向量和所述第二样本本体内的实体的重构向量,预测所述第一样本本体与所述第二样本本体之间的实体匹配关系,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所述相似度和稳定匹配问题算法,将所述第一样本本体内的实体与所述第二样本本体内的实体进行匹配,得到预测的实体匹配关系,包括:

7.一种本体匹配方法,其特征在于,包括:

8.一种本体匹配模型的训练装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至6中任一项所述的本体匹配模型的训练方法;或者,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求7所述的本体匹配方法。

...

【技术特征摘要】

1.一种本体匹配模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,针对每个样本本体的实体向量,所述通过所述本体匹配模型的去噪编码器对所述实体向量进行重构,得到重构向量,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于预测的实体匹配关系和所述参考实体匹配关系,对所述本体匹配模型进行优化训练,包括:

4.根据权利要求1所述的方法,其特征在于,所述向量表示网络包括预训练语言模型和全连接层;所述通过本体匹配模型的向量表示网络对所述样本本体内的实体进行向量表示,得到所述样本本体内的实体的实体向量,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述第一样本本体内的实体的重构向量和所述第二样本本体内的实体的重构向量...

【专利技术属性】
技术研发人员:伍佳灵杨森吴至友段旭祥
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1