一种基于图流实时负载伸缩服务的层次化图模式估计系统技术方案

技术编号：39648847 阅读：10 留言：0更新日期：2023-12-09 11:17

本发明专利技术公开了一种基于图流实时负载伸缩服务的层次化图模式估计系统，包括主控器

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图流实时负载伸缩服务的层次化图模式估计系统

[0001]本专利技术属于图模式挖掘的模式计数领域，具体涉及一种基于图流实时负载伸缩服务的层次化图模式估计系统
。

技术介绍

[0002]模式计数算法是一种针对某种具体图模式，在一个具有一定规模的图数据集中定位查找的计数方法，基本上可以分为精确计数和近似计数两大类
。
但随着对图模式计数需求的不断变化，以及图数据规模的逐渐增大，精确计数困难，应用面已经逐渐减小，而近似估计成为主流
。
以三角形模式计数为例，主要的近似模式计数算法分为以下几类：
[0003]静态图计数：静态图是一个不会随着时间逐渐变化的确定的图数据
。
通过已知完整图数据可以获得一些显示图数据规律的先验数据，比如顶点的度数，度分布等
。
静态图的估计方法有邻域抽样和楔形抽样
。
邻域抽样从整个图数据集中随机挑选一条边，在其邻接的边流中随机挑选另外一条边，每条边在被挑选时都拥有固定的被挑选概率，根据是否存在第三条边能形成闭合，判定抽样是否成功，成功则以相应概率估计计算
。
与邻域采样思想类似的楔形采样则是在图中，直接采样楔形
(
楔形是指未闭合的三角形，即拥有公共顶点的相邻两条边
)
，如果存在第三条边能形成闭合，计数加一，最后根据计数值除以采样的楔形数量占数据集楔形总数的比值估算结果
。
两种抽样方法都存在的最大问题就是抽样形成的误差波动较大，...

【技术保护点】

【技术特征摘要】
1.
一种基于图流实时负载伸缩服务的层次化图模式估计系统，其特征在于，包括主控器
、
估计器
、
查找器三个层次模块；主控器负责将从数据源接收的边流分发给下层的估计器，并收集聚合估计器返回的估计结果；同时监听整个系统的实时负载，根据需要创建或者回收临时估计器；估计器负责对将主控器分配的边流做估计计数和抽样存储，将计数结果返回给主控器；一个估计器对应一个工作线程，由主控器创建和维护，包括主估计器和临时估计器两种；查找器负责查找边流形成的模式，查找器会根据模式匹配算法做模式匹配，查找实际当前子图的模式数的增量；每个查找器拥有
GPU
的一组线程，在匹配工作量小于设定阈值时，查找器会直接通过
CPU
获取匹配结果，工作量不小于设定阈值时调用
GPU
进行快速并行匹配
。2.
如权利要求1所述的基于图流实时负载伸缩服务的层次化图模式估计系统，其特征在于，所述主控器和估计器都拥有缓冲队列，主控器缓冲队列用于存放还没有分发到估计器的边流，估计器缓冲队列用于存放还没有进行抽样估计工作的等待边流；系统的实时负载是根据主控器缓冲队列的长度确定的，当一段时间内主控器缓冲队列的平均长度不低于预设的上限数值时，判定为系统负载过大，创建临时估计器；当一段时间内主控器缓冲队列的平均长度都不高于预设的下限数值时，判定系统负载低，回收临时估计器
。3.
如权利要求1所述的基于图流实...

【专利技术属性】
技术研发人员：李运翔，薛瑞尼，江昊林，王益龙，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人