当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于文本分析的多知识图谱融合方法技术

技术编号:26504774 阅读:39 留言:0更新日期:2020-11-27 15:32
本发明专利技术公开了一种基于文本分析的多知识图谱融合方法,包括:针对文本数据,构建多个知识图谱;使用Transformer生成每个知识图谱KG的实体向量表示;使用注意力机制对每个知识图谱KG的实体邻居进行采样;使用解耦图神经网络表示学习方法聚合每个知识图谱KG的实体的邻居信息;通过距离衡量任意两个知识图谱KG的实体之间相似度;利用正负样本进行神经网络的训练。与现有技术相比,本发明专利技术可以更好地区分实体之间的相似性和表达文本中一个实体的可能存在多个不同的社会属性,从而提升知识图谱融合的表达能力。

【技术实现步骤摘要】
一种基于文本分析的多知识图谱融合方法
本专利技术涉及计算机领域,特别是一种基于文本分析的多知识图谱融合方法。
技术介绍
近几年,知识图谱的构建和应用呈现快速增长的趋势。随着互联网和人工智能等新技术发展,大量的数据被构建出来,但大数据本身是难以理解的,因此需要越来越多的知识图谱被构建出来用于挖掘大数据本身存在的有用信息,比如语义信息以及结构信息等。然而知识图谱具有知识异质性,每个知识图谱之间都具有不同信息,存储和表示的来源可能也不尽相同,与此同时,不同知识图谱之间以及知识图谱的实体之间也存在非常复杂的关系,因此我们需要提出一种高效的知识图谱融合方法来提升知识图谱的表达能力,目前的知识图谱融合方法普遍面临以下问题:(1)不同知识图谱之间的相似实体的邻居存在异质性,即多个知识图谱中相似实体会存在很多不一致的邻居,目前的知识图谱融合方法基本采用的都是利用不同知识图谱中实体邻居的相似性来进行知识图谱融合,但这种异质性会削弱现有融合方法的表达能力。(2)对于同一个知识图谱实体可能存在多个不同的社会属性,不同的邻居对其不同的属性影响可能不同,本文档来自技高网...

【技术保护点】
1.一种基于文本分析的多知识图谱融合方法,其特征在于,包括以下步骤:/nS1、针对文本数据,构建多个知识图谱KG,其结构为KG=(E,R,T);其中E表示实体集,R表示关系集,T表示一个三元组,其中三元组是由头实体,一个实体是由多个单词构成,尾实体以及关系组成;/nS2、使用Transformer生成每个知识图谱KG的实体向量表示;/nS3、使用注意力机制对每个知识图谱KG的实体邻居进行采样;/nS4、使用解耦图神经网络表示学习方法聚合每个知识图谱KG的实体的邻居信息;/nS5、通过距离衡量任意两个知识图谱KG的实体之间相似度;/nS6、利用正负样本进行神经网络的训练。/n

【技术特征摘要】
1.一种基于文本分析的多知识图谱融合方法,其特征在于,包括以下步骤:
S1、针对文本数据,构建多个知识图谱KG,其结构为KG=(E,R,T);其中E表示实体集,R表示关系集,T表示一个三元组,其中三元组是由头实体,一个实体是由多个单词构成,尾实体以及关系组成;
S2、使用Transformer生成每个知识图谱KG的实体向量表示;
S3、使用注意力机制对每个知识图谱KG的实体邻居进行采样;
S4、使用解耦图神经网络表示学习方法聚合每个知识图谱KG的实体的邻居信息;
S5、通过距离衡量任意两个知识图谱KG的实体之间相似度;
S6、利用正负样本进行神经网络的训练。


2.根据权利要求1所述的基于文本分析的多知识图谱融合方法,其特征在于,所述S2具体包括:
S21、利用Transformer去学习一个序列单词的嵌入表示,其最核心的组件是一种自注意力机制,形式化为:



Q=X·WQ,
K=X·WK,
V=X·WV:
其中WQ,WK,WV分别表示权重矩阵,X表示输入矩阵。


3.根据权利要求2所述的基于文本分析的多知识图谱融合方法,其特征在于,所述S3具体包括:
S31、通过注意力机制来学习每个单词对实体的影响权重,形式化为:
αei=Wff(eWe+XiWi+b),






其中Xi代表组成实体e的单词,αei表示Xi对实体的e的影响程度,he表示初始学到的实体表示,k表示组成实体e的单词个数;
S32、使用注意力机制来选择那些影响实体比较大的邻居作为候选邻居,形式化为:
αij=Wff(eiWi+ejWj+b)



其中:αij用于表示实体ei的邻居实体ej对其的影响程度,基于此指标对邻居节点进行采样,k表示实体ei的邻居个数。


4.根据权利要求3所述的基于文本分析的多知识图谱融合方法,其特征在于,所述S4具体包括:
S41、假设...

【专利技术属性】
技术研发人员:杨博马利争夏日婷张钰雪晴
申请(专利权)人:吉林大学
类型:发明
国别省市:吉林;22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1