【技术实现步骤摘要】
一种图计算数据分割方法、终端设备及存储介质
本专利技术涉及图计算领域,尤其涉及一种图计算数据分割方法、终端设备及存储介质。
技术介绍
Google在2012年提出了“知识图谱(KnowledgeGraph)”的概念后,知识图谱技术迅速发展,图计算又引起了广泛的关注,加上近些年来互联网和大数据时代的到来,对海量数据进行迅速处理和分析需求变得尤为迫切,比如对海量网页数据进行pagerank计算,社交网络中的社交关系分析,网络文献关系分析等等。由于图计算任务有其本身的独特性:图数据之间依赖性强,使分布式处理模式需要频繁地在各个机器之间进行数据交换;且图挖掘算法流程本身由多次迭代处理构成。因此,主流大数据平台公认不适合处理图挖掘任务,而基于图计算的大数据分析平台成为了图挖掘和相关机器学习算法的新方法。主要有基于MapReduce模型的MapReduce系列,基于BSP编程模型的Pregel系列,基于GAS模型的GraphLap,PowerGraph系列等。在分布式环境下,图计算处理框架中的图分割算法直接影响框架的处理效率,现有的分布 ...
【技术保护点】
1.一种图计算数据分割方法,其特征在于,包括以下步骤:/nS1:通过改进标签传播算法将原始图社区划分为带权缩图;/n改进标签传播算法为计算每个节点传导至其每个邻居节点的标签置信权重,将每个节点的标签更新为该节点的邻居节点中标签置信权重最大对应的邻居节点的标签后,将标签值相同的顶点进行聚集;/nS2:将带权缩图分割为多个子图,并根据每个子图中各节点的增益值对不同子图内的节点进行调整,使得每个子图内各节点的增益值均小于等于0或调整次数大于次数阈值;/nS3:将带权缩图的子图还原为原始图对应的数据规模。/n
【技术特征摘要】
1.一种图计算数据分割方法,其特征在于,包括以下步骤:
S1:通过改进标签传播算法将原始图社区划分为带权缩图;
改进标签传播算法为计算每个节点传导至其每个邻居节点的标签置信权重,将每个节点的标签更新为该节点的邻居节点中标签置信权重最大对应的邻居节点的标签后,将标签值相同的顶点进行聚集;
S2:将带权缩图分割为多个子图,并根据每个子图中各节点的增益值对不同子图内的节点进行调整,使得每个子图内各节点的增益值均小于等于0或调整次数大于次数阈值;
S3:将带权缩图的子图还原为原始图对应的数据规模。
2.根据权利要求1所述的图计算数据分割方法,其特征在于:改进标签传播算法中节点的标签置信权重的计算公式为:
其中:wij表示从当前节点i传导到邻居节点j的标签置信权重,WLi表示当前节点i的标签置信权重,WRi->j表示当前节点i和邻居节点j之间的关系影响力,表示当前节点i和其所有邻居节点的标签置信权重和关系影响的累计和,k表示节点序号,l表示当前节点i的所有邻居节点的总...
【专利技术属性】
技术研发人员:洪万福,钱智毅,许泽林,
申请(专利权)人:厦门渊亭信息科技有限公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。