知识图谱摘要的生成方法及系统技术方案

技术编号:24456249 阅读:28 留言:0更新日期:2020-06-10 15:38
本发明专利技术实施例提供一种知识图谱摘要的生成方法,包括步骤:获取知识图谱、知识图谱的节点属性重要性权值向量、知识图谱摘要的预设节点数量和知识图谱摘要的预设节点结构相似度权重;根据节点属性重要性权值向量和节点结构相似度权重计算知识图谱中每一对节点的相似度,以得到相似度最大的至少两个节点;将所述至少两个节点合并成一个第二类型节点,并将知识图谱进行更新以得到目标知识图谱;统计所述目标知识图谱的节点数量,并将节点数量与预设节点数量进行比较;当节点数量小于预设节点数量时,则确定所述目标知识图谱为所述知识图谱摘要。通过本发明专利技术实施例,能够减少知识图谱中图形的存储空间,提高知识图谱的管理和分析效率。

The generating method and system of knowledge map Abstract

【技术实现步骤摘要】
知识图谱摘要的生成方法及系统
本专利技术实施例涉及计算机
,尤其涉及一种知识图谱摘要的生成方法、系统、计算机设备及存储介质。
技术介绍
规模庞大的知识图谱具有数亿个顶点和数亿个边。对于这样一个大规模的图结构数据网络,内存不能直接加载并处理。现有的大多数算法对于这类庞大的图结构数据网络也不能有效的处理,尤其是涉及到图的流实时分析决策时,无法将决策后的用户需要的信息及时反馈。大规模知识图谱的这些特点使得用户难以直接管理,给数据网络分析和数据挖掘带来了挑战。故,本方案旨在解决无法对大规模的知识图谱实现有效管理、分析和挖掘的问题。
技术实现思路
有鉴于此,本专利技术实施例提供了一种知识图谱摘要的生成方法、系统、计算机设备及计算机可读存储介质,能够在保持知识图谱性质不变的基础上,挖掘出知识图谱中实体间隐藏的复杂关系,并将具有相似性的实体进行合并,以消除它们之间的连接关系,从而减少知识图谱占用的存储空间。存储空间减少后的知识图谱可以更快地加载到内存中,从而提高对知识图谱的管理和分析的效率。本专利技术实施例是通过下述技术方案来解决上述技术问题:一种知识图谱摘要的生成方法,包括:获取知识图谱、所述知识图谱的节点属性重要性权值向量、知识图谱摘要的预设节点数量和所述知识图谱摘要的预设节点结构相似度权重,其中,所述知识图谱包括多个节点、所述多个节点的属性值、所述多个节点在所述知识图谱中的结构和所述多个节点间的连接关系,所述多个节点包括第一类型节点和第二类型节点;根据所述节点属性重要性权值向量和所述节点结构相似度权重计算所述知识图谱中每一对节点的相似度,以得到相似度最大的至少两个节点,其中,所述每一对节点指的是具有所述连接关系的两个节点;将所述至少两个节点合并成一个所述第二类型节点,并将所述知识图谱进行更新以得到目标知识图谱;统计所述目标知识图谱的节点数量,并将所述节点数量与所述预设节点数量进行比较;当所述节点数量小于所述预设节点数量时,则确定所述目标知识图谱为所述知识图谱摘要。进一步地,所述将所述节点数量与所述预设节点数量进行比较之后,还包括:当所述节点数量不小于所述预设节点数量时,则继续根据所述节点属性重要性权值向量和所述节点结构相似度权重计算所述知识图谱中每一对节点的相似度,以得到相似度最大的至少两个节点。进一步地,所述根据所述节点属性重要性权值向量和所述节点结构相似度权重计算所述知识图谱中每一对节点的相似度,包括:判断所述每一对节点中的两个节点的节点类型;当所述两个节点皆为第一类型节点时,则将所述两个节点的结构关系按照公式进行计算,以得到所述两个节点的结构相似度,其中,vi表示第一类型节点i,vj表示第一类型节点j,simst(vi,vj)表示vi和vj的结构相似度值,w表示所述知识图谱的邻接矩阵,ifw[i][j]=0表示所述第一类型节点i与所述第一类型节点j不具有连接关系,ifw[i][j]=1表示所述第一类型节点i与所述第一类型节点j具有连接关系;将所述两个节点的属性值按照公式进行计算,以得到所述两个节点的属性相似度,其中,αh表示所述两个节点的第h个属性,αh为单值或多值,ch表示αh的重要性程度,C表示所述节点属性重要性权值向量,C={c1,c2,…,ch,…ck},simsi(vi,vj,αh)表示所述两个节点基于αh的属性相似度值,0≤ch≤1,且将所述两个节点的结构相似度和所述两个节点的属性相似度按照公式sim(vi,vj)=α×simst(vi,vj)+(1-α)simsi(vi,vj)进行计算,以得到所述两个节点的相似度,其中,sim(vi,vj)表示所述两个节点的相似度值,α表示所述知识图谱摘要的预设节点结构相似度权重。进一步地,所述将所述两个节点的属性值按照公式进行计算,包括:将所述两个节点的属性值按照公式进行计算,以得到所述属性相似度值,其中,val(vi,αh)表示节点vi的第h个属性的值,val(vj,αh)表示节点vj的第h个属性的值,|vals(vi,αh)∩vals(vj,αh)|表示所述节点vi与所述节点vj属性值的交集,|vals(vi,αh)∪vals(vj,αh)|表示所述节点vi与所述节点vj属性值的并集。进一步地,所述判断所述每一对节点中的两个节点的节点类型之后,还包括:当判断所述两个节点分别为第一类型节点和第二类型节点时,则将所述两个节点的结构关系按照公式进行计算,以得到所述结构相似度,其中,Vi表示第二类型节点i,vj表示第一类型节点j,simst(Vi,vj)表示第二类型节点Vi和第一类型节点vj的结构相似度值,u∈Vi表示所述第二类型节点Vi中的第一类型节点u,(u,vj)∈E表示所述第一类型节点u和所述第一类型节点vj具有连接关系,|{u|u∈Viand(u,vj)∈E}|表示所述第二类型节点Vi中与所述第一类型节点vj具有连接关系的第一类型节点的个数,|Vi|表示所述第二类型节点Vi中第一类型节点的个数;将所述两个节点的属性值按照公式进行计算,以得到所述属性相似度,其中,simsi(Vi,vj,αh)表示所述第二类型节点Vi和所述第一类型节点vj基于属性αh的相似度值;将所述结构相似度和所述属性相似度按照公式sim(Vi,vj)=α×simst(Vi,vj)+(1-α)simsi(Vi,vj)进行计算,以得到所述相似度,其中,sim(Vi,vj)表示所述第二类型节点Vi和所述第一类型节点vj的相似度值。进一步地,所述将所述两个节点的属性值按照公式进行计算,包括:将所述第二类型节点Vi和所述第一类型节点vj的属性值按照公式进行计算,以得到所述第二类型节点Vi和所述第一类型节点vj基于属性αh的属性相似度值,其中,val(u,αh)=val(vj,αh)表示所述第一类型节点u的αh属性值和所述第一类型节点vj的αh属性值相同,|{u|u∈Viandval(u,αh)=val(vj,αh)}|表示所述第二类型节点Vi中αh属性值和所述第一类型节点vj的αh属性值相同的第一类型节点个数。进一步地,所述判断所述每一对节点中的两个节点的节点类型之后,还包括:当判断所述两个节点皆为第二类型节点时,则将所述两个节点的结构关系和属性值按照公式进行计算,以得到所述两个节点的相似度,其中,Vp表示第二类型节点p,Vq表示第二类型节点q,sim(Vp,Vq)表示第二类型节点Vp和第二类型节点Vq的相似度值,|Vq|表示所述第二类型节点q中第一类型节点的个数,v∈Vq表示所述第二类型节点q中的第一类型节点v,sim(Vp,v)表示所述第二类型节点Vp和所述第一类型节点v的相似度。进一步地,所述将所述至少两个节点合并成一个第二类型节点,包括:删除所述至少两个节点之间的连接关系,并将所述至少两个节点合并成一个所述第二类型节点。为了实现上述目的,本专利技术实施例还提供一种知识图谱摘要的生成系统,包括:...

【技术保护点】
1.一种知识图谱摘要的生成方法,其特征在于,包括:/n获取知识图谱、所述知识图谱的节点属性重要性权值向量、知识图谱摘要的预设节点数量和所述知识图谱摘要的预设节点结构相似度权重,其中,所述知识图谱包括多个节点、所述多个节点的属性值、所述多个节点在所述知识图谱中的结构和所述多个节点间的连接关系,所述多个节点包括第一类型节点和第二类型节点;/n根据所述节点属性重要性权值向量和所述节点结构相似度权重计算所述知识图谱中每一对节点的相似度,以得到相似度最大的至少两个节点,其中,所述每一对节点指的是具有所述连接关系的两个节点;/n将所述至少两个节点合并成一个所述第二类型节点,并将所述知识图谱进行更新以得到目标知识图谱;/n统计所述目标知识图谱的节点数量,并将所述节点数量与所述预设节点数量进行比较;/n当所述节点数量小于所述预设节点数量时,则确定所述目标知识图谱为所述知识图谱摘要。/n

【技术特征摘要】
1.一种知识图谱摘要的生成方法,其特征在于,包括:
获取知识图谱、所述知识图谱的节点属性重要性权值向量、知识图谱摘要的预设节点数量和所述知识图谱摘要的预设节点结构相似度权重,其中,所述知识图谱包括多个节点、所述多个节点的属性值、所述多个节点在所述知识图谱中的结构和所述多个节点间的连接关系,所述多个节点包括第一类型节点和第二类型节点;
根据所述节点属性重要性权值向量和所述节点结构相似度权重计算所述知识图谱中每一对节点的相似度,以得到相似度最大的至少两个节点,其中,所述每一对节点指的是具有所述连接关系的两个节点;
将所述至少两个节点合并成一个所述第二类型节点,并将所述知识图谱进行更新以得到目标知识图谱;
统计所述目标知识图谱的节点数量,并将所述节点数量与所述预设节点数量进行比较;
当所述节点数量小于所述预设节点数量时,则确定所述目标知识图谱为所述知识图谱摘要。


2.根据权利要求1所述的知识图谱摘要的生成方法,其特征在于,所述将所述节点数量与所述预设节点数量进行比较之后,还包括:
当所述节点数量不小于所述预设节点数量时,则继续根据所述节点属性重要性权值向量和所述节点结构相似度权重计算所述知识图谱中每一对节点的相似度,以得到相似度最大的至少两个节点。


3.根据权利要求1所述的知识图谱摘要的生成方法,其特征在于,所述根据所述节点属性重要性权值向量和所述节点结构相似度权重计算所述知识图谱中每一对节点的相似度,包括:
判断所述每一对节点中的两个节点的节点类型;
当所述两个节点皆为第一类型节点时,则将所述两个节点的结构关系按照公式进行计算,以得到所述两个节点的结构相似度,其中,vi表示第一类型节点i,vj表示第一类型节点j,simst(vi,vj)表示所述第一类型节点i和所述第一类型节点j的结构相似度值,w表示所述知识图谱的邻接矩阵,ifw[i][j]=0表示所述第一类型节点i与所述第一类型节点j不具有连接关系,ifw[i][j]=1表示所述第一类型节点i与所述第一类型节点j具有连接关系;
将所述两个节点的属性值按照公式进行计算,以得到所述两个节点的属性相似度,其中,αh表示所述两个节点的第h个属性,αh为单值或多值,ch表示αh的重要性程度,C表示所述节点属性重要性权值向量,C={c1,c2,…,ch,…ck},simsi(vi,vj,αh)表示所述两个节点基于αh的属性相似度值,0≤ch≤1,且
将所述两个节点的结构相似度和所述两个节点的属性相似度按照公式sim(vi,vj)=α×simst(vi,vj)+(1-α)simsi(vi,vj)进行计算,以得到所述两个节点的相似度,其中,sim(vi,vj)表示所述两个节点的相似度值,α表示所述知识图谱摘要的预设节点结构相似度权重。


4.根据权利要求3所述的知识图谱摘要的生成方法,其特征在于,所述将所述两个节点的属性值按照公式进行计算,包括:
将所述两个节点的属性值按照公式进行计算,以得到所述属性相似度值,其中,val(vi,αh)表示节点vi的第h个属性的值,val(vj,αh)表示节点vj的第h个属性的值,|vals(vi,αh)∩vals(vj,αh)|表示所述节点vi与所述节点vj属性值的交集,|vals(vi,αh)∪vals(vj,αh)|表示所述节点vi与所述节点vj属性值的并集。


5.根据权利要求3所述的知识图谱摘要的生成方法,其特征在于,所述判断所述每一对节点中的两个节点的节点类型之后,还包括:
当判断所述两个节点分别为第一类型节点和第二类型节点时,则将所述两个节点的结构关系按照公式进行计算,以得到所述结构相似度,其中,Vi表示第二类型节点i,vj表示第一类型节点j,simst...

【专利技术属性】
技术研发人员:刘利
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1