【技术实现步骤摘要】
知识图谱划分方法、装置、设备和存储介质
[0001]本公开涉及计算机
,尤其涉及一种知识图谱划分方法、装置、设备和存储介质。
技术介绍
[0002]随着人工智能(Artificial Intelligence,AI)在各个领域的快速发展,各个领域间的信息与问题相互交织,变得日益复杂且数据量庞大,需要有一套完善的数据模型来表示一切资源,知识图谱(Knowledge Graph)应运而生。
[0003]知识图谱是Google于2012年提出,是图G=(V,E)的扩展形式,其中V和E是顶点和边的集合,分别表示实体和实体间的关联关系,目前知识图谱已经达到百万顶点和上亿条边的规模。RDF(Resource Description Framework,资源描述框架)是知识图谱中运用最为广泛的一种数据类型,它采用三元组(s,p,o)的形式描述资源,其中s、p和o分别表示主语、谓语、宾语。以DBpedia(维基百科知识图谱)为例,目前已经包含超过30亿条三元组数据。由于RDF图数据的急剧增长,传统的单机数据处理已经无法满足目前 ...
【技术保护点】
【技术特征摘要】
1.一种知识图谱划分方法,其特征在于,所述方法包括:根据知识图谱中的节点的语义信息与所述节点之间的边的语义信息,确定所述知识图谱中的节点的权重;根据所述知识图谱中的节点的权重和所述知识图谱的结构信息,对所述知识图谱进行分区划分;根据所述知识图谱中的待划分节点与所述知识图谱的各分区之间的语义相似度,将所述待划分节点划分到目标分区中。2.根据权利要求1所述的方法,其特征在于,所述根据知识图谱中的节点的语义信息与所述节点之间的边的语义信息,确定所述知识图谱中的节点的权重,包括:根据所述知识图谱中的边的语义信息,确定各所述边的初始化权重;根据所述知识图谱中的节点的语义信息,确定各所述节点的初始化权重;根据各所述边的初始化权重以及各所述节点的初始化权重,确定各所述节点的权重。3.根据权利要求2所述的方法,其特征在于,所述根据所述知识图谱中的边的语义信息,确定各所述边的初始化权重,包括:根据所述知识图谱中的边的属性信息以及不同所述边之间的关联关系,确定第一语义层次结构;确定各所述边在所述第一语义层次结构中的权重。4.根据权利要求2所述的方法,其特征在于,所述根据所述知识图谱中的节点的语义信息,确定各所述节点的初始化权重,包括:根据所述知识图谱中的节点的属性信息以及所述节点之间的关联关系,确定第二语义层次结构;确定各所述节点在所述第二语义层次结构中的权重。5.根据权利要求2所述的方法,其特征在于,所述根据各所述边的初始化权重以及各所述节点的初始化权重,确定各所述节点的权重,包括:针对每一个所述节点,执行以下操作:当所述节点的出边集合不为空时,根据所述节点的初始化权重、所述节点的出边的初始化权重和所述出边对应的目标节点的权重,确定所述节点的权重;当所述节点的出边集合为空时,将所述节点的初始化权重确定为所述节点的权重。6.根据权利要求1所述的方法,其特征在于,所述根据所述知识图谱中的节点的权重和所述知识图谱的结构信息,对所述知识图谱进行分区划分,包括:根据预设的分区数量以及各所述节点按照权重由高至低的排序,选取多个第一节点;以各所述第一节点分别作为起始节点,结合所述知识图谱的结构信息以及预设的查询模板的结构信息,对所述知识图谱进行初始化分区;针对所述知识图谱的每一个分区,在确定所述分...
【专利技术属性】
技术研发人员:傅强,李路中,杨晓明,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。