面向海量图数据的超级节点查找方法、装置、介质及设备制造方法及图纸

技术编号:33641125 阅读:26 留言:0更新日期:2022-06-02 20:16
本申请实施例提供了一种面向海量图数据的超级节点查找方法、装置、介质及设备,应用于大数据处理领域。该方法包括:根据原始数据构建图数据;依据图数据的类型,确定图数据中每个节点的度数,得到度数据样本;确定度数据样本的阈值;根据度数据样本的阈值,查找图数据中的超级节点。本申请实施例实现了准确、高效地对超级节点进行查找。地对超级节点进行查找。地对超级节点进行查找。

【技术实现步骤摘要】
面向海量图数据的超级节点查找方法、装置、介质及设备


[0001]本申请涉及大数据处理
,具体而言,本申请涉及一种面向海量图数据的超级节点查找方法、装置、介质及设备。

技术介绍

[0002]随着社交、电商、金融、零售、物联网等行业的快速发展,现实社会织起了一张庞大而复杂的关系网。大数据行业需要处理的数据之间的关系随数据量呈几何级数增长,传统的关系型数据模型在很多场景下已难以使用,而图数据就可以用来表征这种海量复杂的数据关系。图数据由节点和边两个元素组成,每个节点代表一个实体,每个边代表两个节点的关联方式,这种通用结构可以对各种场景中由关系定义的任何事物进行建模。
[0003]在图数据库方面,超级节点极大的降低了数据入库和检索效率;在图计算方面,超级节点和其他节点一般用于解决不同的应用场景:例如在通信领域,基于移动通信数据的社群发现、视频点播推荐等业务,需要过滤超级节点造成的干扰;在骚扰电话识别等场景,又需要提取超级节点进行针对性分析。因此对超级节点的准确查找和识别至关重要。
[0004]传统超级节点查找中,一般仅针对多重图数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向海量图数据的超级节点查找方法,其特征在于,包括:根据原始数据构建图数据;依据所述图数据的类型,确定所述图数据中每个节点的度数,得到度数据样本;确定所述度数据样本的阈值;根据所述度数据样本的阈值,查找所述图数据中的超级节点。2.根据权利要求1所述的方法,其特征在于,所述确定所述度数据样本的阈值,包括:采用箱形图检测法,计算所述度数据样本的上边缘;将所述度数据样本的上边缘确定为所述度数据样本的阈值。3.根据权利要求2所述的方法,其特征在于,所述采用箱形图检测法,计算所述度数据样本的上边缘,包括:根据所述度数据样本的上四分位数和下四分位数,以及所述度数据样本的四分位数乘数值,计算所述度数据样本的上边缘。4.根据权利要求1

3中任一项所述的面向海量图数据的超级节点查找方法,其特征在于,所述依据所述图数据的类型,确定所述图数据中每个节点的度数,包括:当所述图数据的类型为多重图时,确定所述图数据中每个节点的度数为与对应节点连接的边数。5.根据权利要求1

3中任一项所述的面向海量图数据的超级节点查找方法,其特征在于,所述依据所述图数据的类型,确定所述图数据中每个节点的度数,包括:当所述图数据的类型为简单图时,确定所述图数据中每个节点的度数为与对应节点连接的每条边所聚合的原始边数之和。6.根据权...

【专利技术属性】
技术研发人员:徐奇吴鹏王栋姚刚张懿辉
申请(专利权)人:亚信科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1