群体划分方法及相关装置制造方法及图纸

技术编号:37666020 阅读:23 留言:0更新日期:2023-05-26 04:24
本申请公开了一种群体划分方法及相关装置。所述方法包括:从目标知识图谱中选取针对目标类型节点的知识图谱子图;使用M种边权重生成算法,分别计算知识图谱子图中的多个目标类型节点之间的边权重,以生成与知识图谱子图对应的M个同质图谱;对M个同质图谱中的每个同质图谱应用N种群体划分算法,得到与每个同质图谱对应的N个群体划分结果;对M个同质图谱中的每个同质图谱对应的N个群体划分结果进行评分,并选择与最高评分所对应的目标边权重生成算法和目标群体划分算法;通过目标边权重生成算法生成目标知识图谱的同质图谱,并通过目标群体划分算法对目标知识图谱的同质图谱进行群体划分。本申请能够更加准确的实现群体划分效果。效果。效果。

【技术实现步骤摘要】
群体划分方法及相关装置


[0001]本申请涉及知识图谱领域,尤其涉及一种群体划分方法及相关装置。

技术介绍

[0002]社区、社团等群体能够反映网络中的个体行为的局部性特征以及其相互之间的关联关系,研究网络中的群体对理解整个网络的结构和功能起到至关重要的作用,有助于分析及预测整个网络各元素间的交互关系。群体发现能够用来挖掘网络中隐藏的聚簇结构信息,对复杂网络结构与功能的分析具有重要意义,被应用在社交网络、生物网络、交易网络等领域中。
[0003]知识图谱本质上是一种大型的语义网络,旨在描述客观世界的概念实体事件及其关系,它以实体概念为节点,以关系为边,提供一种从关系的视角来看世界,使得海量多样的数据能进行更高效地表达、组织和利用。
[0004]群体发现作为网络科学的经典问题之一,长期受到研究者的广泛关注。现有的群体发现算法大部分建立在同质图谱的基础上,然而在实际业务中异质图谱在图数据中占有极大的比例。因此,现有方法会将网络(异质图谱)中的目标类型节点之间的非目标节点转化为边,并且简单地设置边权重来构造同质图谱,但是这种粗粒度的方本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种群体划分方法,其特征在于,所述方法包括:从目标知识图谱中选取针对目标类型节点的知识图谱子图;使用M种边权重生成算法,分别计算所述知识图谱子图中的多个所述目标类型节点之间的边权重,以生成与所述知识图谱子图对应的M个同质图谱,M为大于1的整数;对所述M个同质图谱中的每个同质图谱应用N种群体划分算法,得到与所述每个同质图谱对应的N个群体划分结果,N为大于1的整数;对所述M个同质图谱中的每个同质图谱对应的N个群体划分结果进行评分,并从所述M种边权重生成算法和所述N种群体划分算法中选择与最高评分所对应的目标边权重生成算法和目标群体划分算法;通过所述目标边权重生成算法生成所述目标知识图谱的同质图谱,并通过所述目标群体划分算法对所述目标知识图谱的同质图谱进行群体划分。2.根据权利要求1所述方法,其特征在于,所述M种边权重生成算法包括距离惩罚法,其中,计算所述知识图谱子图中的多个所述目标类型节点之间的边权重,包括:利用所述距离惩罚法,计算多个所述目标类型节点中的第一目标类型节点到第二目标类型节点的路径中所有边的第一权重之和;将所述第一权重之和除以所述路径的阶数,得到所述第一目标类型节点与所述第二目标类型节点之间的边权重。3.根据权利要求1所述方法,其特征在于,所述M种边权重生成算法包括步长衰减法,其中,计算所述知识图谱子图中的多个所述目标类型节点之间的边权重,包括:利用所述步长衰减法,对多个所述目标类型节点中的第三目标类型节点到第四目标类型节点之间的路径中所有边的权重应用第一衰减因子;基于应用了所述第一衰减因子的所有边的第二权重之和,确定所述第三目标类型节点与所述第四目标类型节点之间的边权重,其中,所述第一衰减因子基于相应边在所述路径中距所述第三目标类型节点的步长确定。4.根据权利要求3所述方法,其特征在于,所述基于应用了所述第一衰减因子的所有边的第二权重之和,确定所述第三目标类型节点与所述第四目标类型节点之间的边权重,包括:对所述第四目标类型节点到所述第三目标类型节点之间的路径中所有边的权重应用第二衰减因子,以确定应用了所述第二衰减因子的所有边的第三权重之和;将所述第二权重之和与所述第三权重之和的均值作为所述第三目标类型节点与所述第四目标类型节点之间的边权重,其中,所述第二衰减因子基于相应边在所述路径中距所述第四目标类型节点的步长确定。5.根据权利要求1所述方法,其特征在于,所述M种边权重生成算法包括节点度惩罚法,其中,计算所述知识图谱子图中的多个所述目标类型节点之间的边权重,包括:利用所述节点度惩罚法,确定多个所述目标类型节点中的第五目标类型节点到第六目标类型节点之间的路径中所有边的第四权重之和;将所述第四权重之和除以所述路径中存在的其他类型节点的节点度的总和,得到所述第五目标类型节点与所述第六目标类型节点之间的边权重,其中,所述节点度为与对应节点相关联的边的数量。
6.根据权利要求1所述方法,其特征在于,所述M种边权重生成算法包括节点相似度法,其中,计算所述知识图谱子图中的多个所述目标类型节点之间的边权重,包括:利用所述节点相似度法,针对多个所述目标类型节点构造所述知识图谱子图的二部图;计算所述二部图中的节点相似度矩阵,并且将针对所述目标类型节点的节点相似度矩阵中的元素对应的值作为所述目标类型节点之间的边权重。7.根据权利要求1所述方...

【专利技术属性】
技术研发人员:刘振国蒋宁吴海英
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1