The invention discloses an embedding method of knowledge atlas based on attention mechanism, which includes the following steps: (1) input the data set of knowledge atlas to be completed, initialize the data set of knowledge atlas based on attention mechanism; (2) update the embedding representation based on attention mechanism, and obtain the embedding representation result and attention machine. Making parameters; (3) completing the knowledge map data set according to the embedded representation result and the attention mechanism parameter. The method can better deal with complex relationships that previous algorithms can not deal with very well, such as one-to-many, many-to-one and many-to-many relationships, and the obtained entity vectors can well reflect the category information, and can focus on some dimensions related to the relationship when judging the relationship, so as to improve the accuracy of judgment.
【技术实现步骤摘要】
一种基于注意力机制的知识图谱嵌入方法
本专利技术涉及知识图谱嵌入领域,具体涉及一种基于注意力机制的知识图谱嵌入方法。
技术介绍
知识图谱是由实体作为节点和关系作为边构成的有向图。通常,一个知识图谱会编码数百万个实体的结构化信息和数十亿个关系事实。但这样还不够完备,需要对知识图谱进行补全。知识图谱补全的目的就是根据现有的知识图谱中的信息来预测没有边连接的实体之间是否存在关系,即连接预测。一类知识图谱补全的方法是基于嵌入的,这类方法会将知识图谱中的每个对象编码成一个连续空间中的向量。最近这类方法在知识图谱补全上展现出了强大的效果。因此这种方法变得越来越流行。在这类方法中,基于转化的方法因为简单和有效大受青睐。他们有着目前最好的连接预测表现。在2013年的国际机器学习顶级会议Advancesinneuralinformationprocessingsystems中,论文《Translatingembeddingsformodelingmulti-relationaldata》,第2787页到第2795页公开了一种叫TransE的基于转化的方法,它受到最近大获成功的词嵌入方法的启发,将实体和关系分别嵌入到向量空间当中。对于一个三元组(h,r,t),它表示头实体h与尾实体t具有关系r。基于转化的方法的基本思想是这个三元组会诱导一个嵌入的向量空间中的函数关系,例如h+r≈t。由于TransE模型不能很好的解决一对多、多对一和多对多的关系,研究者们陆续提出了一系列工作来弥补它的缺点,比如TransH,TransR和TranSparse。在2014年的国际人工智能顶级会议 ...
【技术保护点】
1.一种基于注意力机制的知识图谱嵌入方法,其特征在于,包括以下步骤:(1)输入需要补全的知识图谱数据集,基于注意力机制对知识图谱数据集进行初始化;(2)基于注意力机制对嵌入表示进行更新,得到嵌入表示结果和注意力机制参数;(3)根据嵌入表示结果和注意力机制参数,补全知识图谱数据集。
【技术特征摘要】
1.一种基于注意力机制的知识图谱嵌入方法,其特征在于,包括以下步骤:(1)输入需要补全的知识图谱数据集,基于注意力机制对知识图谱数据集进行初始化;(2)基于注意力机制对嵌入表示进行更新,得到嵌入表示结果和注意力机制参数;(3)根据嵌入表示结果和注意力机制参数,补全知识图谱数据集。2.根据权利要求1所述的基于注意力机制的知识图谱嵌入方法,其特征在于,步骤(1)中,所述初始化的具体步骤为:(1-1)随机初始化数据集中所有的关系与实体对应的向量,得到初始的关系向量与实体向量;(1-2)对于每个关系向量r,将出现在训练条目头部的实体加入到头实体集合SHr,将出现在训练条目尾部的实体加入到尾实体集合STr;(1-3)将每个关系向量r的头实体集合SHr与尾实体集合STr分别加入到候选头实体集合Hr与候选尾实体集合Tr,将候选头实体集合Hr和候选尾实体集合Tr初始化为整个实体集合E;(1-4)将每个关系r的注意力向量ar初始化为每一维都是1的向量。3.根据权利要求1所述的基于注意力机制的知识图谱嵌入方法,其特征在于,步骤(2)中,所述基于注意力机制对嵌入表示进行更新的具体步骤为:(2-1)从数据集的训练集中采样固定大小的一批数据Δbatch;(2-2)对Δbatch中的每一个三元组(h,r,t)随机生成一个错误的三元组(h',r,t'),用三元组对{(h,r,t),(h′,r,t′)}构成当前迭代所用的训练数据Tbatch;(2-3)计算整个算法的损失函数,并采用随机梯度下降算法更新嵌入表示;(2-4)当迭代次数达到预定值M,则更新注意力机制相关的参变量Hr,Tr,ar;(2-5)重复步骤2-1~步骤2-4,直至整个算法...
【专利技术属性】
技术研发人员:钱炜,蔡登,付聪,祝宇,何晓飞,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。