【技术实现步骤摘要】
一种基于节点分类排序的社交网络图压缩方法及系统
本专利技术属于大数据处理领域,更具体地,涉及一种基于节点分类排序的社交网络图压缩方法及系统。
技术介绍
社交网络通常由个人或组织等社会实体组成,这些社会实体通过某些特定类型的相互依赖性(如亲属关系、朋友关系、财务关系、利益关系等)产生关联。在万维网的推动下,社交网络平台陆续出现,国外的社交平台如Facebook、Twitter、LinkedIn、Instagram、Youtube等,国内的社交平台如QQ、微信、新浪微博、豆瓣、百度贴吧等。社交网络使得人们使用互联网的方式从简单的网页浏览和信息搜索转向更加多样化的结交好友、加入社区、分享内容等等。它丰富了人与人之间沟通交流的方式,也影响着人们的生活,成为维系社会关系的重要工具,如今已经是人们生活中的重要组成部分。随着社交网络的多元化发展和对人们生活的不断深入,社交网络包含了各行各业的数据,创造了大量具有高价值的信息,在社会学、传播学、行为学、心理学等众多领域都引起了广泛关注。但是信息的重要价值隐藏在复杂的分析算法背后,于是 ...
【技术保护点】
1.一种基于节点分类排序的社交网络图压缩方法,其特征在于,包括:/n获得社交网络图中各节点的入度,以获得其中的零入度节点以及入度最高的前top-k节点,将入度最高的前top-k个节点作为高入度节点,并将零入度节点和高入度节点之外的节点作为社区节点;/n根据入邻居节点的相似性将高入度节点划分为不同的领域,并将相同领域内的高入度节点排序到一起;通过社区发现将社区节点划分为不同社区,并将相同社区内的社区节点排序到一起;将所有的零入度节点一起排序到末尾;/n根据排序后的节点建立所述社交网络图的图邻接矩阵,并将所述图邻接矩阵的每一行中连续的b个比特作为一个比特行,从而将所述图邻接矩阵 ...
【技术特征摘要】
1.一种基于节点分类排序的社交网络图压缩方法,其特征在于,包括:
获得社交网络图中各节点的入度,以获得其中的零入度节点以及入度最高的前top-k节点,将入度最高的前top-k个节点作为高入度节点,并将零入度节点和高入度节点之外的节点作为社区节点;
根据入邻居节点的相似性将高入度节点划分为不同的领域,并将相同领域内的高入度节点排序到一起;通过社区发现将社区节点划分为不同社区,并将相同社区内的社区节点排序到一起;将所有的零入度节点一起排序到末尾;
根据排序后的节点建立所述社交网络图的图邻接矩阵,并将所述图邻接矩阵的每一行中连续的b个比特作为一个比特行,从而将所述图邻接矩阵的每一个行划分为一个比特行序列;
对于每一个节点,仅对其出邻居节点所在的比特行进行存储并进行固定长度的编码,从而完成对所述社交网络图的压缩;
其中,top-k为预设的高入度节点数,固定长度编码的编码长度为b。
2.如权利要求1所述的基于节点分类排序的社交网络图压缩方法,其特征在于,获得社交网络图中入度最高的前top-k节点作为高入度节点,其方法包括:
利用Timsort排序算法,按照入度降序的顺序对所述社交网络图中的节点进行排序,将排序后最靠前的top-k个节点确定为社交网络图中的高入度节点。
3.如权利要求1或2所述的基于节点分类排序的社交网络图压缩方法,其特征在于,根据入邻居节点的相似性将高入度节点划分为不同的领域,包括:
为每个高入度节点计算多个MinHash特征值,并将每一个高入度节点的多个MinHash特征值划分为多组特征值;
根据高入度节点的MinHash特征值,通过LSH算法将各高入度节点映射到哈希桶中,在映射的过程中,若任意两个高入度节点之间存在一组完全相同的特征值,则将这两...
【专利技术属性】
技术研发人员:施展,冯丹,王芳,龚慧媛,朱涛,吴雨桐,何雨迪,黄世财,毛艳,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。