【技术实现步骤摘要】
基于赋范线性空间拓扑结构的图谱信息补全方法、系统
[0001]本专利技术属于自然语言处理
,尤其涉及基于赋范线性空间拓扑结构的图谱信息补全方法、系统。
技术介绍
[0002]现有的图谱信息补全方法往往是在高维向量空间中的单一距离定义下进行实体、关系之间的链接预测,不具备普适性,无法针对各类数据从根本上进行调整。现有的图谱信息补全方法只关注问题自身的解决,没有将图谱信息补全问题回归到数学本质,仅仅停留在如何应用,而未抽象出模型特点,并还原到理论本身,因此缺少必要的支撑点。
[0003]以基于TransE的知识嵌入技术为例,假设实体和关系满足h+r≈t,其中h,r,t∈R
k
,k表示向量维度,定义打分函数f
r
(h,t)=
‑
||h+r
‑
t||2,进而通过设计损失函数实现对实体和关系的向量化。
[0004]可以看到基于TransE的知识嵌入技术,是在欧式空间下计算正负样本的预测损失,实现对实体、关系的向量化。这导致TransE的知识嵌 ...
【技术保护点】
【技术特征摘要】
1.一种基于赋范线性空间拓扑结构的图谱信息补全方法,其特征在于,所述基于赋范线性空间拓扑结构的图谱信息补全方法包括:针对图谱信息补全进行抽象建模,将构建的模型抽象至赋范线性空间中,将拓扑结构作为模型的超参数,根据数据特点和需求对拓扑结构进行调整,在不同拓扑结构下对数据进行针对性的优化,补全知识图谱信息。2.根据权利要求1所述的基于赋范线性空间拓扑结构的图谱信息补全方法,其特征在于,所述基于赋范线性空间拓扑结构的图谱信息补全方法还包括:通过基于Trans系列信息向量化进行知识图谱信息的向量化处理,得到基于知识图谱的向量空间;对基于知识图谱信息构建的向量空间赋予拓扑结构,采用基于范数的链接预测补全信息,在各种拓扑结构下补全知识图谱的信息。3.根据权利要求1所述的基于赋范线性空间拓扑结构的图谱信息补全方法,其特征在于,所述基于赋范线性空间拓扑结构的图谱信息补全方法包括以下步骤:步骤一,将知识图谱的实体、关系的表示嵌入至低维空间,在保持实体与关系的联系的基础上获取每个实体和关系的向量表示,形成基于知识图谱信息的向量空间;步骤二,对基于知识图谱信息构建的向量空间赋予拓扑结构,在特定的拓扑结构下,为所述基于知识图谱信息的向量空间中的元素定义范数;步骤三,在赋范线性空间的一种拓扑结构下,确定最佳补全信息,进行知识图谱信息的补全。4.根据权利要求3所述的基于赋范线性空间拓扑结构的图谱信息补全方法,其特征在于,所述将知识图谱的实体、关系的表示嵌入至低维空间包括:利用三元组表示知识图谱的一条知识,将关系视为由头实体至尾实体的转换过程,构建从头实体到尾实体转换的实现程度,将知识图谱的实体、关系嵌入至低维空间。5.根据权利要求4所述的基于赋范线性空间拓扑结构的图谱信息补全方法,其特征在于,所述...
【专利技术属性】
技术研发人员:张立灿,石珺,刘汪洋,廖伟,胡乐星,沈宜,
申请(专利权)人:深圳市网联安瑞网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。