图数据压缩方法、装置、服务器及存储介质制造方法及图纸

技术编号:21917203 阅读:20 留言:0更新日期:2019-08-21 13:26
本发明专利技术提供了一种图数据压缩方法、装置、服务器及存储介质,属于互联网技术领域。所述方法包括:确定待压缩的第一网络图中的每个第一节点的重要性;根据每个第一节点的重要性,从第一网络图中选择多个第二节点;将多个第二节点组成第二网络图,将多个第二节点中不同的两个第二节点组成至少一个节点对;确定每个节点对在第一网络图中的第一距离;对于每个节点对,确定节点对在第二网络图中的第二距离,根据节点对的第一距离、节点对的第二距离和图参数,在第二网络图中添加距离信息。由于设置了图参数,通过该图参数能够限制第二网络图中保留的节点数量,从而不会增加过多的节点和边,有效的对图数据进行了压缩,得到的第二网络图较为准确。

Graph Data Compression Method, Device, Server and Storage Media

【技术实现步骤摘要】
图数据压缩方法、装置、服务器及存储介质
本专利技术涉及互联网
,特别涉及一种图数据压缩方法、装置、服务器及存储介质。
技术介绍
随着互联网技术的飞速发展,各种应用都积累了大量数据。图作为一种有效的描述大数据的数据结构,广泛的应用于互联网分析、社交网络分析以及推荐网络分析等领域。在图数据的结构中,一般使用网络图的形式存储数据和数据之间的关系。其中,网络图包括多个节点,节点用于存储数据,节点与节点之间的边用于表示数据之间的关系。由于网络图中包括大规模的数据。因此,在对大规模的图数据进行分析处理及应用的过程中,需要对网络图中包含的大量节点和边进行压缩。针对上述问题,目前采用的一种压缩思路为保留网络图中部分重要的节点以及部分的边,以确保网络图的连通性。例如,一种图压缩算法是在网络图中确定重要节点,以重要节点构建最小生成树,将该最小生成树作为压缩后的网络图。上述方法存在的问题是,仅构建最小生成树会丢失原有图中节点之间的距离信息,导致得到的第二网络图不准确。
技术实现思路
本专利技术实施例提供了一种图数据压缩方法、装置、服务器及存储介质,用于解决目前图压缩算法仅以重要节点构建最小生成树,会丢失原有图中节点之间的距离信息,导致得到的第二网络图不准确的问题。所述技术方案如下:一方面,提供了一种图数据压缩方法,其特征在于,所述方法包括:确定待压缩的第一网络图中的每个第一节点的重要性;根据所述每个第一节点的重要性,从所述第一网络图中选择多个第二节点;将所述多个第二节点组成第二网络图,以及将所述多个第二节点中不同的两个第二节点组成节点对,得到至少一个节点对;确定每个节点对在所述第一网络图中的第一距离;对于每个节点对,确定所述节点对在所述第二网络图中的第二距离,根据所述节点对在所述第一网络图中的第一距离、所述节点对在所述第二网络图中的第二距离和图参数,在所述第二网络图中添加所述节点对在所述第一网络图中的距离信息,所述图参数的大小与所述第二网络图中保留的节点数量负相关。在一种可能的实现方式中,所述根据所述节点对在所述第一网络图中的第一距离、所述节点对在所述第二网络图中的第二距离和图参数,在所述第二网络图中添加所述节点对在所述第一网络图中的距离信息,包括:确定所述节点对在所述第一网络图中的第一距离和所述图参数的乘积,得到第三距离;当所述节点对在所述第一网络图中的第一距离大于所述第三距离时,将所述第一网络图中所述节点对之间的最短路径包括的节点和边添加到所述第二网络图中,所述最短路径为所述第一距离对应的路径。在另一种可能的实现方式中,所述确定每个节点对在所述第一网络图中的第一距离,包括:当所述第一网络图为非权重图时,确定所述节点对在所述第一网络图中的最短距离,将所述最短距离作为所述节点对在所述第一网络图中的第一距离;当所述第一网络图为权重图时,确定所述节点对在所述第一网络图中每个路径的权重和,将所述每个路径的权重和中最小的权重和作为所述节点对在所述第一网络图中的第一距离。在另一种可能的实现方式中,所述确定所述节点对在所述第二网络图中的第二距离,包括:当所述第二网络图中存在所述节点对之间的路径时,确定所述节点对之间的最短路径的第四距离;将所述最短路径的第四距离作为所述节点对在所述第二网络图中的第二距离。在另一种可能的实现方式中,所述确定所述节点对在所述第一网络图中的第一距离和所述图参数的乘积,得到第三距离之前,所述方法还包括:当所述第二网络图中存在节点对之间的路径时,执行所述确定所述节点对在所述第一网络图中的第一距离和所述图参数的乘积,得到第三距离的步骤;当所述第二网络图中不存在节点对之间的路径时,执行所述将所述节点对之间的最短路径中的节点和边添加到所述第二网络图中的步骤。在另一种可能的实现方式中,所述确定待压缩的第一网络图中的每个第一节点的重要性,包括:对于每个第一节点,确定所述第一网络图中所述第一节点的中心性,将所述第一节点的中心性作为所述第一节点的重要性。在另一种可能的实现方式中,所述确定所述第一网络图中每个第一节点的中心性,包括:确定所述第一网络图中包括的节点的总数量以及所述第一网络图中的每个第一节点的度;对于每个第一节点,根据所述第一节点的度和所述总数量,确定所述第一节点的中心性,或者,根据所述第一节点的度、所述第一节点的邻居节点的度和所述总数量,确定所述第一节点的中心性。在另一种可能的实现方式中,所述根据所述节点对在所述第一网络图中的第一距离、所述节点对在所述第二网络图中的第二距离和图参数,在所述第二网络图中添加所述节点对在所述第一网络图中的距离信息之前,所述方法还包括:根据每个节点对在所述第一网络图中的第一距离,确定每个节点对的执行顺序;根据所述执行顺序,执行所述根据所述节点对在所述第一网络图中的第一距离、所述节点对在所述第二网络图中的第二距离和图参数,在所述第二网络图中添加所述节点对在所述第一网络图中的距离信息的步骤。另一方面,提供了一种图数据压缩装置,其特征在于,所述装置包括:第一确定模块,被配置为确定待压缩的第一网络图中的每个第一节点的重要性;选择模块,被配置为根据所述每个第一节点的重要性,从所述第一网络图中选择多个第二节点;组合模块,被配置为将所述多个第二节点组成第二网络图,以及将所述多个第二节点中不同的两个第二节点组成节点对,得到至少一个节点对;第二确定模块,被配置为确定每个节点对在所述第一网络图中的第一距离;第三确定模块,被配置为对于每个节点对,确定所述节点对在所述第二网络图中的第二距离,根据所述节点对在所述第一网络图中的第一距离、所述节点对在所述第二网络图中的第二距离和图参数,在所述第二网络图中添加所述节点对在所述第一网络图中的距离信息,所述图参数的大小与所述第二网络图中保留的节点数量负相关。在一种可能的实现方式中,所述第三确定模块,还被配置为确定所述节点对在所述第一网络图中的第一距离和所述图参数的乘积,得到第三距离;当所述节点对在所述第一网络图中的第一距离大于所述第三距离时,将所述第一网络图中所述节点对之间的最短路径包括的节点和边添加到所述第二网络图中,所述最短路径为所述第一距离对应的路径。在另一种可能的实现方式中,所述第二确定模块,还被配置为当所述第一网络图为非权重图时,确定所述节点对在所述第一网络图中的最短距离,将所述最短距离作为所述节点对在所述第一网络图中的第一距离;当所述第一网络图为权重图时,确定所述节点对在所述第一网络图中每个路径的权重和,将所述每个路径的权重和中最小的权重和作为所述节点对在所述第一网络图中的第一距离。在另一种可能的实现方式中,第三确定模块,还被配置为当所述第二网络图中存在所述节点对之间的路径时,确定所述节点对之间的最短路径的第四距离;将所述最短路径的第四距离作为所述节点对在所述第二网络图中的第二距离。在另一种可能的实现方式中,所述第三确定模块,还被配置为当所述第二网络图中存在节点对之间的路径时,确定所述节点对在所述第一网络图中的第一距离和所述图参数的乘积,得到第三距离;当所述第二网络图中不存在节点对之间的路径时,将所述节点对之间的最短路径中的节点和边添加到所述第二网络图中。在另一种可能的实现方式中,所述第一确定模块,还被配置为对于每个第一节点,确定所述第一网络图中所述第本文档来自技高网...

【技术保护点】
1.一种图数据压缩方法,其特征在于,所述方法包括:确定待压缩的第一网络图中的每个第一节点的重要性;根据所述每个第一节点的重要性,从所述第一网络图中选择多个第二节点;将所述多个第二节点组成第二网络图,以及将所述多个第二节点中不同的两个第二节点组成节点对,得到至少一个节点对;确定每个节点对在所述第一网络图中的第一距离;对于每个节点对,确定所述节点对在所述第二网络图中的第二距离,根据所述节点对在所述第一网络图中的第一距离、所述节点对在所述第二网络图中的第二距离和图参数,在所述第二网络图中添加所述节点对在所述第一网络图中的距离信息,所述图参数的大小与所述第二网络图中保留的节点数量负相关。

【技术特征摘要】
1.一种图数据压缩方法,其特征在于,所述方法包括:确定待压缩的第一网络图中的每个第一节点的重要性;根据所述每个第一节点的重要性,从所述第一网络图中选择多个第二节点;将所述多个第二节点组成第二网络图,以及将所述多个第二节点中不同的两个第二节点组成节点对,得到至少一个节点对;确定每个节点对在所述第一网络图中的第一距离;对于每个节点对,确定所述节点对在所述第二网络图中的第二距离,根据所述节点对在所述第一网络图中的第一距离、所述节点对在所述第二网络图中的第二距离和图参数,在所述第二网络图中添加所述节点对在所述第一网络图中的距离信息,所述图参数的大小与所述第二网络图中保留的节点数量负相关。2.根据权利要求1所述的方法,其特征在于,所述根据所述节点对在所述第一网络图中的第一距离、所述节点对在所述第二网络图中的第二距离和图参数,在所述第二网络图中添加所述节点对在所述第一网络图中的距离信息,包括:确定所述节点对在所述第一网络图中的第一距离和所述图参数的乘积,得到第三距离;当所述节点对在所述第一网络图中的第一距离大于所述第三距离时,将所述第一网络图中所述节点对之间的最短路径包括的节点和边添加到所述第二网络图中,所述最短路径为所述第一距离对应的路径。3.根据权利要求1所述的方法,其特征在于,所述确定每个节点对在所述第一网络图中的第一距离,包括:当所述第一网络图为非权重图时,确定所述节点对在所述第一网络图中的最短距离,将所述最短距离作为所述节点对在所述第一网络图中的第一距离;当所述第一网络图为权重图时,确定所述节点对在所述第一网络图中每个路径的权重和,将所述每个路径的权重和中最小的权重和作为所述节点对在所述第一网络图中的第一距离。4.根据权利要求1所述的方法,其特征在于,所述确定所述节点对在所述第二网络图中的第二距离,包括:当所述第二网络图中存在所述节点对之间的路径时,确定所述节点对之间的最短路径的第四距离;将所述最短路径的第四距离作为所述节点对在所述第二网络图中的第二距离。5.根据权利要求2所述的方法,其特征在于,所述确定所述节点对在所述第一网络图中的第一距离和所述图参数的乘积,得到第三距离之前,所述方法还包括:当所述第二网络图中存在节点对之间的路径时,执行所述确定所述节点对在所述第一网络图中的第一距离和所述图参数的乘积,得到第三距离的步骤;当所述第二网络图中不存在节点对之间的路径时,执行所述将所述节点对之间的...

【专利技术属性】
技术研发人员:荣钰郑胤陈志为黄俊洲
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1