一种融合实体和关系描述的知识图谱表示学习方法技术

技术编号：18289624 阅读：93 留言：0更新日期：2018-06-24 04:23

本发明专利技术公开一种融合实体和关系描述的知识图谱表示学习方法，考虑了实体与关系的文本描述信息，很好地融合了三元组的结构化信息与文本描述信息两大信息源，通过基于神经网络的端到端模型对实体和关系联合抽取，设置一个平衡因子来平衡结构化信息和文本描述信息，并根据预测对象的不同定义不同的得分函数；然后利用损失函数把实体向量和关系向量关联起来，并优化该损失函数，当达到优化目标时，就可以学得知识图谱及文本描述信息中每个实体的向量和关系的向量。本发明专利技术解决了知识库中实体和关系的稀疏性和不平衡性，更精确有效地表示实体和关系及其之间的相互联系，并将其应用于大规模知识图谱中，具有较好的实用性。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合实体和关系描述的知识图谱表示学习方法
本专利技术涉及知识图谱以及深度学习
，具体涉及一种融合实体和关系描述的知识图谱表示学习方法。
技术介绍
随着科技和时代的进步，当今社会以惊人的速度发展，我们逐渐进入一个智能化、信息化时代。每天都有海量新的数据和多样的信息以不同的形式出现。互联网已成为当今社会最有效便捷的信息获取平台，随着互联网用户对真实信息获取的需求日益迫切，如何从海量数据中获取更加准确有效的信息已成为众多领域关注的焦点，知识图谱也由此产生。Google公司于2012年5月将知识图谱引入搜索引擎，开启了大规模知识图谱的研究和应用的热潮。知识图谱的本质是一个由节点和边组成的有向图，通常人们会用网络的形式来组织知识图谱中的知识，网络中的每个节点代表实体(人名、地名、机构名、概念等)，每条边代表实体间的关系。因此，大部分知识一般都可以用三元组(h，r，t)来表示，h，t分别表示头实体和尾实体，r表示头尾实体间的关系。例如，巴黎是法国的首都这一事实，在知识图谱中即可用三元组关系(巴黎，是……首都，法国)来表示。目前，常用知识图谱均使用这种表示方式，如万维网(W3C)公布的资源描述框架(resourcedescriptionframework，RDF)技术标准。与基于关键词搜索的传统搜索引擎所不同的是，我们可以利用知识图谱更有效地查找复杂的关联信息，从语义层面上体会用户意图，改善查询质量。例如，若在Google的搜索框里输入杜兰特，页面右侧将会出现杜兰特的相关信息，如出生年月、家庭情况等。大规模知识图谱可以被广泛用于许多实际任务，但其正确性和完整性...
一种融合实体和关系描述的知识图谱表示学习方法

【技术保护点】
1.一种融合实体和关系描述的知识图谱表示学习方法，其特征是，具体包括步骤如下：步骤1.通过基于神经网络的端到端模型对网络中实体和关系的文本描述信息进行联合抽取，并利用平衡因子将抽取的实体和关系的文本描述信息与知识图谱中实体和关系的结构化信息结合，通过实体与关系之间基于翻译的模型，根据预测对象的不同来定义衡量关系和实体对之间相互关联的得分函数：当预测的是头实体或尾实体时，则得分函数f(h,r,t)定义为：

【技术特征摘要】
1.一种融合实体和关系描述的知识图谱表示学习方法，其特征是，具体包括步骤如下：步骤1.通过基于神经网络的端到端模型对网络中实体和关系的文本描述信息进行联合抽取，并利用平衡因子将抽取的实体和关系的文本描述信息与知识图谱中实体和关系的结构化信息结合，通过实体与关系之间基于翻译的模型，根据预测对象的不同来定义衡量关系和实体对之间相互关联的得分函数：当预测的是头实体或尾实体时，则得分函数f(h,r,t)定义为：当预测的是关系时，则得分函数f(h,r,t)定义为：其中，μ是平衡因子，h是头实体向量，t是尾实体向量，r是头实体和尾实体之间的关系向量，hs是头实体的结构化向量，ts是尾实体的结构化向量，rs是关系的结构化向量，hd是头实体的文本描述向量，td是尾实体的文本描述向量，rd是关系的文本文本描述向量，L1是范式，L2是L2范式；步骤2.基于得分函数建立实体与关系的损失函数，并通过最小化损失函数来学习结构化信息与文本信息融合之后的实体和关系，以...

【专利技术属性】
技术研发人员：古天龙，栗永芳，常亮，李凤英，祝曼丽，罗义琴，
申请(专利权)人：桂林电子科技大学，
类型：发明
国别省市：广西,45

全部详细技术资料下载我是这个专利的主人