知识图谱构建方法、装置、存储介质和电子设备制造方法及图纸

技术编号:41496509 阅读:17 留言:0更新日期:2024-05-30 14:40
本申请公开了一种知识图谱构建方法、装置、存储介质和电子设备。该方法包括:获取第一自然语言文本;利用抽取模型对第一自然语言文本进行实体抽取,得到第一实体和第一实体关系,并确定对应的第一实体类型和第一关系类型;利用语义编码器确定第一实体类型和第一关系类型分别对应的第一语义向量和第二语义向量;依据所计算第一语义向量距离多个实体类型聚类中心的第一距离、第二语义向量距离多个关系类型聚类中心的第二距离确定第一实体类型的目标实体类型和第一关系类型的目标关系类型;基于第一实体、第一实体关系、目标实体类型、目标关系类型构建目标知识图谱。本申请解决了相关技术构建的开放域知识图谱的完整性较差、精度较低的技术问题。

【技术实现步骤摘要】

本申请涉及知识图谱,具体而言,涉及一种知识图谱构建方法、装置、存储介质和电子设备


技术介绍

1、知识图谱是人类对客观世界认知所形成知识的一种表现形式,其通过特定的结构和分类方式组织并存储人们解决现实问题时所使用的知识。根据包含知识类型的不同,知识图谱问答可以分为开放域和封闭域两种场景。其中,封闭域知识图谱问答是将知识交互的范围限定在特定领域或者主体,其问题和答案的上下文较为受限;而开放域知识图谱问答中,问题和知识图谱中的知识可涉及任何主体、领域或者话题,因此,开放域知识图谱问答具备较为广阔的使用前景。

2、目前,开放域知识图谱的构建方案主要可分为两类:基于句法分析的技术路线和基于模型的技术路线。其中,基于句法分析的技术路线,其是先使用语法解析器拆分句子,得到句子中的主谓宾等成分,再使用分类器对所拆分的每个部分进行分类;而基于模型的技术路线,其是先使用监督数据进行训练模型,然后使用模型进行要素抽取并进行图谱构建。但上述两个方法仍存在如下弊端:一是构建精度较低。其中基于语法分析的技术路线,要求文本严格遵循语法,在非规范文本下,精度很低,而基于模型本文档来自技高网...

【技术保护点】

1.一种知识图谱构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述抽取模型的训练过程包括:

3.根据权利要求2所述的方法,其特征在于,获取多组样本数据,包括:

4.根据权利要求3所述的方法,其特征在于,所述语义编码器的训练过程包括:

5.根据权利要求4所述的方法,其特征在于,获取多组第二类三元组样本,包括:

6.根据权利要求4所述的方法,其特征在于,获取多组第二类三元组样本,包括:

7.根据权利要求3所述的方法,其特征在于,多个所述实体类型聚类中心的确定过程包括:

8.根据权利要...

【技术特征摘要】

1.一种知识图谱构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述抽取模型的训练过程包括:

3.根据权利要求2所述的方法,其特征在于,获取多组样本数据,包括:

4.根据权利要求3所述的方法,其特征在于,所述语义编码器的训练过程包括:

5.根据权利要求4所述的方法,其特征在于,获取多组第二类三元组样本,包括:

6.根据权利要求4所述的方法,其特征在于,获取多组第二类三元组样本,包括:

7.根据权利要求3所述的方法,其特征在于,多个所述实体类型聚类中心的确定过程包括:

8.根据权利要求3所述的方法,其特征在于,多个所述关系类型聚类中心的...

【专利技术属性】
技术研发人员:张鹏阮宜龙张云龙
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1