基于自适应权重的多源信息融合知识图谱表示学习方法技术

技术编号:19821853 阅读:36 留言:0更新日期:2018-12-19 14:43
本发明专利技术公开一种基于自适应权重的多源信息融合知识图谱表示学习方法,首先考虑了文本信息和结构化信息的融合,采用实体向量和关系向量之间基于翻译的模型,通过调节两者之间的权重来优化得分函数,并通过对前期已经分类好的结构化信息进行类型约束训练,且无需引入更多的参数;然后利用损失函数将实体向量和关系向量关联起来,并优化了该损失函数,当达到优化目标时,就可以学得知识图谱中每个实体的向量和关系的向量。本发明专利技术解决了知识库中文本信息和结构化信息融合没有考虑权重的问题,并利用了知识库中结构化信息已有的层次信息,更精确地表示实体和关系之间的相互联系,并将其应用于大规模知识图谱中。

【技术实现步骤摘要】
基于自适应权重的多源信息融合知识图谱表示学习方法
本专利技术涉及知识图谱和深度学习
,具体涉及一种基于自适应权重的多源信息融合知识图谱表示学习方法。
技术介绍
随着社会的迅猛发展,我们慢慢进入一个信息化的时代。海量新的数据和信息每天都以不同的形式产生。移动互联网如今已经成了当今社会最有效便捷的信息获取平台,用户对真实信息获取的需求也日益增加,如何从海量数据中获取有效信息已成为众多领域面临的主要难题。知识图谱也由此应运而生。人们通常以网络的形式组织知识库中的知识,网络中每个结点表示实体,而每条边表示两个实体之间的关系,三元组的形式为(实体1,关系,实体2)。图1为知识图谱中典型的三元组的示例图。其中椭圆表示的结点“莎士比亚”“罗密欧与朱丽叶”都为实体,连边表示的“作者”为关系。因此,大部分知识都可以用三元组来表示,对应着知识库网络中的一条链以及链接的两个实体,这就是知识库的通用表示方式。最近几年,深度学习在语音识别,图像分析和自然语言处理领域获得广泛关注。表示学习旨在将研究对象的语义信息表示为稠密低维实值向量。在该低维向量空间中,两个对象距离越近就说明语义相似度越高。该方向最近取本文档来自技高网...

【技术保护点】
1.基于自适应权重的多源信息融合知识图谱表示学习方法,其特征是,具体包括步骤如下:步骤1、利用自适应的权重来平衡文本信息和结构化信息的融合,定义文本信息和结构化信息相互关联的总得分函数f(h,r,t):f(h,r,t)=(1‑λ)(||hd+r‑td||+||hd+r‑MrttS||+||MrhhS+r‑td||)+λ(||Mrhh+r+Mrtt||)其中,λ表示权重,h表示头实体,t表示尾实体,r表示头实体h和尾实体t的关系,hd表示头实体基于文本的表示,td表示尾实体基于文本的表示,hS表示头实体基于结构化的表示,tS表示尾实体基于结构化的表示,Mrh是根据头实体定义的投影矩阵,Mrh是根...

【技术特征摘要】
1.基于自适应权重的多源信息融合知识图谱表示学习方法,其特征是,具体包括步骤如下:步骤1、利用自适应的权重来平衡文本信息和结构化信息的融合,定义文本信息和结构化信息相互关联的总得分函数f(h,r,t):f(h,r,t)=(1-λ)(||hd+r-td||+||hd+r-MrttS||+||MrhhS+r-td||)+λ(||Mrhh+r+Mrtt||)其中,λ表示权重,h表示头实体,t表示尾实体,r表示头实体h和尾实体t的关系,hd表示头实体基于文本的表示,td表示尾实体基于文本的表示,hS表示头实体基于结构化的表示,tS表示尾实体基于结构化的表示,Mrh是根据头实体定义的投影矩阵,Mrh是根据尾实体定义的投影矩阵;步骤2、基于步骤1所定义的总得分函数f(h,r,t),建立基于自适应权重的文本信息与结构化信息融合的损失函数,并通过最小化损失函数,学得实体和关系的向量表示,达到优化目标。2.根据权利要求1所述的...

【专利技术属性】
技术研发人员:常亮张舜尧匡海丽王文凯
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:广西,45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1