【技术实现步骤摘要】
知识图谱摘要的生成方法及系统
本专利技术实施例涉及计算机
,尤其涉及一种知识图谱摘要的生成方法、系统、计算机设备及存储介质。
技术介绍
规模庞大的知识图谱具有数亿个顶点和数亿个边。对于这样一个大规模的图结构数据网络,内存不能直接加载并处理。现有的大多数算法对于这类庞大的图结构数据网络也不能有效的处理,尤其是涉及到图的流实时分析决策时,无法将决策后的用户需要的信息及时反馈。大规模知识图谱的这些特点使得用户难以直接管理,给数据网络分析和数据挖掘带来了挑战。故,本方案旨在解决无法对大规模的知识图谱实现有效管理、分析和挖掘的问题。
技术实现思路
有鉴于此,本专利技术实施例提供了一种知识图谱摘要的生成方法、系统、计算机设备及计算机可读存储介质,能够在保持知识图谱性质不变的基础上,挖掘出知识图谱中实体间隐藏的复杂关系,并将具有相似性的实体进行合并,以消除它们之间的连接关系,从而减少知识图谱占用的存储空间。存储空间减少后的知识图谱可以更快地加载到内存中,从而提高对知识图谱的管理和分析的效率。本专利技术实施例是通过下述技术方案来解决上述技术问题:一种知识图谱摘要的生成方法,包括:获取知识图谱、所述知识图谱的节点属性重要性权值向量、知识图谱摘要的预设节点数量和所述知识图谱摘要的预设节点结构相似度权重,其中,所述知识图谱包括多个节点、所述多个节点的属性值、所述多个节点在所述知识图谱中的结构和所述多个节点间的连接关系,所述多个节点包括第一类型节点和第二类型节点;根据所述节点
【技术保护点】
1.一种知识图谱摘要的生成方法,其特征在于,包括:/n获取知识图谱、所述知识图谱的节点属性重要性权值向量、知识图谱摘要的预设节点数量和所述知识图谱摘要的预设节点结构相似度权重,其中,所述知识图谱包括多个节点、所述多个节点的属性值、所述多个节点在所述知识图谱中的结构和所述多个节点间的连接关系,所述多个节点包括第一类型节点和第二类型节点;/n根据所述节点属性重要性权值向量和所述节点结构相似度权重计算所述知识图谱中每一对节点的相似度,以得到相似度最大的至少两个节点,其中,所述每一对节点指的是具有所述连接关系的两个节点;/n将所述至少两个节点合并成一个所述第二类型节点,并将所述知识图谱进行更新以得到目标知识图谱;/n统计所述目标知识图谱的节点数量,并将所述节点数量与所述预设节点数量进行比较;/n当所述节点数量小于所述预设节点数量时,则确定所述目标知识图谱为所述知识图谱摘要。/n
【技术特征摘要】
1.一种知识图谱摘要的生成方法,其特征在于,包括:
获取知识图谱、所述知识图谱的节点属性重要性权值向量、知识图谱摘要的预设节点数量和所述知识图谱摘要的预设节点结构相似度权重,其中,所述知识图谱包括多个节点、所述多个节点的属性值、所述多个节点在所述知识图谱中的结构和所述多个节点间的连接关系,所述多个节点包括第一类型节点和第二类型节点;
根据所述节点属性重要性权值向量和所述节点结构相似度权重计算所述知识图谱中每一对节点的相似度,以得到相似度最大的至少两个节点,其中,所述每一对节点指的是具有所述连接关系的两个节点;
将所述至少两个节点合并成一个所述第二类型节点,并将所述知识图谱进行更新以得到目标知识图谱;
统计所述目标知识图谱的节点数量,并将所述节点数量与所述预设节点数量进行比较;
当所述节点数量小于所述预设节点数量时,则确定所述目标知识图谱为所述知识图谱摘要。
2.根据权利要求1所述的知识图谱摘要的生成方法,其特征在于,所述将所述节点数量与所述预设节点数量进行比较之后,还包括:
当所述节点数量不小于所述预设节点数量时,则继续根据所述节点属性重要性权值向量和所述节点结构相似度权重计算所述知识图谱中每一对节点的相似度,以得到相似度最大的至少两个节点。
3.根据权利要求1所述的知识图谱摘要的生成方法,其特征在于,所述根据所述节点属性重要性权值向量和所述节点结构相似度权重计算所述知识图谱中每一对节点的相似度,包括:
判断所述每一对节点中的两个节点的节点类型;
当所述两个节点皆为第一类型节点时,则将所述两个节点的结构关系按照公式进行计算,以得到所述两个节点的结构相似度,其中,vi表示第一类型节点i,vj表示第一类型节点j,simst(vi,vj)表示所述第一类型节点i和所述第一类型节点j的结构相似度值,w表示所述知识图谱的邻接矩阵,ifw[i][j]=0表示所述第一类型节点i与所述第一类型节点j不具有连接关系,ifw[i][j]=1表示所述第一类型节点i与所述第一类型节点j具有连接关系;
将所述两个节点的属性值按照公式进行计算,以得到所述两个节点的属性相似度,其中,αh表示所述两个节点的第h个属性,αh为单值或多值,ch表示αh的重要性程度,C表示所述节点属性重要性权值向量,C={c1,c2,…,ch,…ck},simsi(vi,vj,αh)表示所述两个节点基于αh的属性相似度值,0≤ch≤1,且
将所述两个节点的结构相似度和所述两个节点的属性相似度按照公式sim(vi,vj)=α×simst(vi,vj)+(1-α)simsi(vi,vj)进行计算,以得到所述两个节点的相似度,其中,sim(vi,vj)表示所述两个节点的相似度值,α表示所述知识图谱摘要的预设节点结构相似度权重。
4.根据权利要求3所述的知识图谱摘要的生成方法,其特征在于,所述将所述两个节点的属性值按照公式进行计算,包括:
将所述两个节点的属性值按照公式进行计算,以得到所述属性相似度值,其中,val(vi,αh)表示节点vi的第h个属性的值,val(vj,αh)表示节点vj的第h个属性的值,|vals(vi,αh)∩vals(vj,αh)|表示所述节点vi与所述节点vj属性值的交集,|vals(vi,αh)∪vals(vj,αh)|表示所述节点vi与所述节点vj属性值的并集。
5.根据权利要求3所述的知识图谱摘要的生成方法,其特征在于,所述判断所述每一对节点中的两个节点的节点类型之后,还包括:
当判断所述两个节点分别为第一类型节点和第二类型节点时,则将所述两个节点的结构关系按照公式进行计算,以得到所述结构相似度,其中,Vi表示第二类型节点i,vj表示第一类型节点j,simst...
【专利技术属性】
技术研发人员:刘利,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。