一种知识图谱构建方法、装置及存储介质制造方法及图纸

技术编号:19009190 阅读:27 留言:0更新日期:2018-09-22 09:03
本发明专利技术实施例公开了知识图谱构建方法、装置及存储介质,应用于信息处理技术领域。在本实施例的方法中,在构建知识图谱时,将已发布文本的标签及基础图谱中的实体信息作为待构建知识图谱中图谱节点的信息,然后将两个图谱节点的信息在同一个已发布文本中的出现次数作为节点关系信息,以完成知识图谱的构建。由于已发布文本是不断更新的,因此,可以不断地根据已发布文本更新和完善已经构建的知识图谱中的各个图谱节点,及图谱节点之间的节点关系信息,从而使得知识图谱的应用更广泛。

Knowledge map construction method, device and storage medium

The embodiment of the invention discloses a knowledge map construction method, a device and a storage medium, which are applied to the field of information processing technology. In the method of this embodiment, the label of the published text and the entity information in the base map are used as the information of the graph nodes in the knowledge map to be constructed, and the number of occurrences of the information of the two graph nodes in the same published text is used as the node relationship information to complete the knowledge map. The construction of the spectrum. Since the published text is constantly updated, it is possible to update and improve the information of each node in the knowledge map and the relationship between nodes in the map according to the published text, so that the knowledge map can be used more widely.

【技术实现步骤摘要】
一种知识图谱构建方法、装置及存储介质
本专利技术涉及信息处理
,特别涉及一种知识图谱构建方法、装置及存储介质。
技术介绍
知识图谱可以应用于许多应用场景,比如在信息推荐系统中基于知识图谱进行信息推荐,或是在文本分类过程中基于知识图谱进行分类等。而在知识图谱的构建领域,有很多研究方法都是通过构建各个实体之间的关系数据来构建知识图谱,主要包括基于三元组的封闭域学习方法,及将关系识别问题定义为分类问题的方法。其中:基于三元组的封闭域学习方法中,将图谱关系定义为:<E1,Relation,E2>,其中E1,E2为实体描述词即实体词,Relation用于表示实体之间的关系,且设定优化目标为E1+Relaiton=E2,通过不同的优化算法,可以得到实体与关系向量标示。将关系识别定义为分类问题的方法中,将图谱关系定义为:<E1+E2,Relation>,Relation用于表示分类标记(Label),E1和E2用于表示分类对象,通过分类器,即可得到E1与E2的关系预测。上述现有的知识图谱的构建方法都是设定学习目标,并在给定的一些关系(Relation)封闭域内,只能学习已给定的集中关系;其次,已有方法,都是一种静态图谱的构建方法,只有当有关系(Relation)可关联的情况下的实体才会存在于图谱中,对于潜在未知实体(Entity)是无法包括在图谱结构中的,那么大量潜在关系无法利用。
技术实现思路
本专利技术实施例提供一种知识图谱构建方法、装置及存储介质,实现了根据任意两个图谱节点对应的出现次数确定待构建知识图谱所包括的节点关系信息。本专利技术实施例第一方面提供一种知识图谱构建方法,包括:获取待构建知识图谱中多个图谱节点的信息,所述多个图谱节点的信息包括已发布文本对应的多个标签,及基础图谱中的实体信息;确定每个图谱节点的信息分别与其它任一图谱节点的信息在同一个所述已发布文本中的出现次数;根据所述确定的出现次数确定所述待构建知识图谱所包括的节点关系信息,以完成知识图谱的构建;所述节点关系信息包括多对图谱节点对应的出现次数,所述构建的知识图谱中包括所述多个图谱节点的信息,及所述节点关系信息。本专利技术实施例第二方面提供一种知识图谱构建装置,包括:节点获取单元,用于获取待构建知识图谱中多个图谱节点的信息,所述多个图谱节点的信息包括已发布文本对应的多个标签,及基础图谱中的实体信息;次数确定单元,用于确定每个图谱节点的信息分别与其它任一图谱节点的信息在同一个所述已发布文本中的出现次数;关系确定单元,用于根据所述确定的出现次数确定所述待构建知识图谱所包括的节点关系信息,以完成知识图谱的构建;所述节点关系信息包括多对图谱节点对应的出现次数,所述构建的知识图谱中包括所述多个图谱节点的信息,及所述节点关系信息。本专利技术实施例第三方面提供一种存储介质,所述存储介质储存多条指令,所述指令适于由处理器加载并执行如本专利技术实施例第一方面所述的知识图谱构建方法。本专利技术实施例第四方面提供一种终端设备,包括处理器和存储介质,所述处理器,用于实现各个指令;所述存储介质用于储存多条指令,所述指令用于由处理器加载并执行如本专利技术实施例第一方面所述的知识图谱构建方法。可见,在本实施例的方法中,在构建知识图谱时,将已发布文本的标签及基础图谱中的实体信息作为待构建知识图谱中图谱节点的信息,然后将两个图谱节点的信息在同一个已发布文本中的出现次数作为节点关系信息,以完成知识图谱的构建。由于已发布文本是不断更新的,因此,可以不断地根据已发布文本更新和完善已经构建的知识图谱中的各个图谱节点,及图谱节点之间的节点关系信息,从而使得知识图谱的应用更广泛。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一个实施例提供的一种知识图谱构建方法的流程图;图2是本专利技术一个实施例中确定待构建知识图谱所包括的节点关系信息的示意图;图3是本专利技术一个实施例中确定知识图谱中各个图谱节点的节点向量的方法流程图;图4是本专利技术一个实施例中知识图谱的示意图;图5是本专利技术应用实施例中构建知识图谱的示意图;图6是本专利技术实施例提供的一种知识图谱构建装置的结构示意图;图7是本专利技术实施例提供的另一种知识图谱构建装置的结构示意图;图8是本专利技术实施例提供的一种终端设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排它的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。本专利技术实施例提供一种知识图谱构建方法,在知识图谱构建后,可以应用于基于知识图谱的信息推荐系统中等,本实施例中,知识图谱构建装置可以通过如下方法进行知识图谱的构建:获取待构建知识图谱中多个图谱节点的信息,多个图谱节点的信息包括已发布文本对应的多个标签,及基础图谱中的实体信息;确定每个图谱节点的信息分别与其它任一图谱节点的信息在同一个已发布文本中的出现次数;根据确定的出现次数确定待构建知识图谱所包括的节点关系信息,以完成知识图谱的构建;节点关系信息包括多对图谱节点对应的出现次数,构建的知识图谱中包括多个图谱节点的信息及节点关系信息。这样,由于已发布文本是不断更新的,因此,可以不断地根据已发布文本更新和完善已经构建的知识图谱中的各个图谱节点,及图谱节点之间的节点关系信息,从而使得知识图谱的应用更广泛。本专利技术实施例提供一种知识图谱构建方法,主要是由知识图谱构建装置所执行的方法,流程图如图1所示,包括:步骤101,获取待构建知识图谱中多个图谱节点的信息,其中,多个图谱节点的信息包括已发布文本对应的多个标签,及基础图谱中的实体信息。可以理解,知识图谱构建装置可以按照一定周期发起本实施例的知识图谱构建方法。这里,待构建的知识图谱(knowledgegraph)可以称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,具体可以包括图谱节点与图谱节点关系(简称图谱关系,Relation)。其中,图谱节点可以通过实体描述词(简称实体词,Entity)表示,具体可以为人名、机构名及地名等名称,更广泛的实体词还包括数字、日期、货币、地址等本文档来自技高网...
一种知识图谱构建方法、装置及存储介质

【技术保护点】
1.一种知识图谱构建方法,其特征在于,包括:获取待构建知识图谱中多个图谱节点的信息,所述多个图谱节点的信息包括已发布文本对应的多个标签,及基础图谱中的实体信息;确定每个图谱节点的信息分别与其它任一图谱节点的信息在同一个所述已发布文本中的出现次数;根据所述确定的出现次数确定所述待构建知识图谱所包括的节点关系信息,以完成知识图谱的构建;所述节点关系信息包括多对图谱节点对应的出现次数,所述构建的知识图谱中包括所述多个图谱节点的信息,及所述节点关系信息。

【技术特征摘要】
1.一种知识图谱构建方法,其特征在于,包括:获取待构建知识图谱中多个图谱节点的信息,所述多个图谱节点的信息包括已发布文本对应的多个标签,及基础图谱中的实体信息;确定每个图谱节点的信息分别与其它任一图谱节点的信息在同一个所述已发布文本中的出现次数;根据所述确定的出现次数确定所述待构建知识图谱所包括的节点关系信息,以完成知识图谱的构建;所述节点关系信息包括多对图谱节点对应的出现次数,所述构建的知识图谱中包括所述多个图谱节点的信息,及所述节点关系信息。2.如权利要求1所述的方法,其特征在于,所述已发布文本有多个,获取所述已发布文本对应的多个标签具体包括:分别提取所述多个已发布文本对应的标签;将所述提取的标签中频次较高的多个标签作为所述待构建知识图谱中图谱节点的信息。3.如权利要求1所述的方法,其特征在于,针对所述多个图谱节点中的某两个图谱节点,所述方法还包括:确定所述某两个图谱节点分别对应的初始节点向量;根据所述某两个图谱节点分别对应的初始节点向量确定所述某两个图谱节点之间关联的假设概率;及根据所述节点关系信息确定所述某两个图谱节点之间关联的真实概率;计算所述假设概率与真实概率之间的相似度;根据所述相似度更新所述某两个图谱节点的初始节点向量,以得到所述某两个图谱节点分别对应的节点向量。4.如权利要求3所述的方法,其特征在于,所述某两个图谱节点为直接关联的两个第一图谱节点,则所述确定所述两个第一图谱节点之间关联的假设概率为:1与所述两个第一图谱节点分别对应的初始节点向量的函数计算值的比值;确定所述两个第一图谱节点之间关联的真实概率为:所述两个第一图谱节点之间的节点关系信息,与所述两个第一图谱节点分别和所有相应的第一关联图谱节点之间的节点关系信息之和的比值;所述第一关联图谱节点为与所述第一图谱节点直接关联的图谱节点。5.如权利要求3所述的方法,其特征在于,所述某两个图谱节点为间接关联的第二图谱节点,则:确定所述两个第二图谱节点之间关联的假设概率为:所述两个第二图谱节点分别对应的初始节点向量的函数计算值,与和所述两个第二图谱节点都直接关联的第二关联图谱节点的初始节点向量的函数计算值的比值;确定所述两个第二图谱节点之间关联的真实概率为:所述两个第二图谱节点之间的最短路径,与和某一第二图谱节点相应的所有第二关联图谱节点的个数的比值;所述第二关联图谱节点为与所述两个第二图谱节点直接关联的图谱节点。6.如权利要求3所述的方法,其特征在于,所述某两个图谱节点中的一个图谱节点为孤岛节点,另一图谱节点为所述待构建知识图谱中的任一其它图谱节点,则:确定所述孤岛节...

【专利技术属性】
技术研发人员:张博胡澜涛刘毅陈磊刘书凯林乐宇夏锋冯喆
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1