【技术实现步骤摘要】
一种图文件的处理方法、装置及存储介质
本专利技术涉及计算机应用技术,尤其涉及一种图文件的处理方法、装置及存储介质。
技术介绍
在社交网络中,社区发现算法常用于检测社交网络中的社区结构,并可以进一步的挖掘感兴趣的社区或行为异常的用户群体。现有的社区发现算法通常是将整个社交网络的数据存入内存,并进行迭代计算,但是,对于大规模的社交网络会产生内存不足无法计算的情况。例如,在QQ好友关系社交网络中,总共有约19亿用户(即社交网络中的节点)和超过550亿条好友关系(即社交网络中节点的连接关系),若将这种大规模的QQ好友关系社交网络的数据存入内存中,则会对内存产生巨量的需求,实际应用中难以部署这样的硬件环境,即是部署也难以保证计算的效率。
技术实现思路
本专利技术实施例期望提供一种图文件的处理方法、装置及存储介质,能够对于社交网络的图文件进行资源集约型的高效计算。为达到上述目的,本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供了一种图文件的处理方法,包括:提取图文件并存储至持久化存储空间中,所述图文件包括社交网络的节点、连接所述节点的连接关系以及所述连接关系的权重值;根据所述图文件包括的节点的连接关系,将所述图文件分割形成子图文件,其中,分割后形成的子图文件所对应的节点区间互不相交;将分割后的子图文件加载至内存空间;初始化所述内存空间所加载子图文件中的节点,并迭代计算所述内存空间所加载子图文件中节点的社区标签;根据迭代计算完成后得到的所述节点的社区标签,更新所述持久化存储空间中存储的图文件。本专利技术实施例还提供了一种图文件的处理装置,包括:提取模块,用于提取 ...
【技术保护点】
1.一种图文件的处理方法,其特征在于,包括:提取图文件并存储至持久化存储空间中,所述图文件包括社交网络的节点、连接所述节点的连接关系以及所述连接关系的权重值;根据所述图文件包括的节点的连接关系,将所述图文件分割形成子图文件,其中,分割后形成的子图文件所对应的节点区间互不相交;将分割后的子图文件加载至内存空间;初始化所述内存空间所加载子图文件中的节点,并迭代计算所述内存空间所加载子图文件中节点的社区标签;根据迭代计算完成后得到的所述节点的社区标签,更新所述持久化存储空间中存储的图文件。
【技术特征摘要】
1.一种图文件的处理方法,其特征在于,包括:提取图文件并存储至持久化存储空间中,所述图文件包括社交网络的节点、连接所述节点的连接关系以及所述连接关系的权重值;根据所述图文件包括的节点的连接关系,将所述图文件分割形成子图文件,其中,分割后形成的子图文件所对应的节点区间互不相交;将分割后的子图文件加载至内存空间;初始化所述内存空间所加载子图文件中的节点,并迭代计算所述内存空间所加载子图文件中节点的社区标签;根据迭代计算完成后得到的所述节点的社区标签,更新所述持久化存储空间中存储的图文件。2.根据权利要求1所述的方法,其特征在于,所述提取图文件并存储至持久化存储空间中,包括:从所述社交网络的数据库中提取用户连接关系;将所述用户映射为所述社交网络中的节点,将所述用户之间的连接关系映射为所述社交网络中连接所述节点的连接关系,将所述用户之间的连接紧密度映射为所述社交网络中所述连接关系的权重值;将所得到的映射结果整合为所述图文件,并将所述图文件存储至所述持久化存储空间中。3.根据权利要求1所述的方法,其特征在于,所述根据所述图文件包括的节点的连接关系,将所述图文件分割形成子图文件,包括:根据所述图文件中的节点的连接关系,将所述图文件中的节点划分到互不相交的节点区间;根据划分得到的所述节点区间,将所述图文件对应所述节点区间进行分割,形成与所述节点区间对应的子图文件。4.根据权利要求1所述的方法,其特征在于,所述将分割后的子图文件加载至内存空间,包括:将所述分割后的子图文件中未迭代计算社区标签的子图文件,加载到所述内存空间中;当所加载的子图文件迭代计算社区标签完成后,在所述内存空间中释放所加载的子图文件,并将未迭代计算社区标签的子图文件,加载到所述内存空间中。5.根据权利要求1所述的方法,其特征在于,所述初始化所述内存空间加载子图文件中的节点,包括:为所述内存空间所加载子图文件中的各个节点分配差异化的社区标签;根据所述节点所分配的社区标签,计算所述节点的初始化的第一权重和以及所述社区标签的初始化的第二权重和;其中,所述第一权重和以及所述第二权重和用于计算所述节点的模块度;其中,所述第一权重和为所述节点的连接关系的权重和,所述第二权重和为所述社区标签对应社区的内部具有点连接的连接关系的权重和。6.根据权利要求5所述的方法,其特征在于,所述迭代计算所述内存空间所加载子图文件中节点的社区标签,包括:遍历所述加载子图文件中的节点,并执行以下迭代处理:计算所遍历节点具有邻接节点的社区标签时对应的模块度;确定使所述模块度最大时所遍历节点所具有的社区标签,并分配给所遍历节点相应的社区标签;当所述内存空间所加载子图文件的模块度在迭代前后的梯度满足收敛条件时停止迭代,将相同社区标签的节点合并为新的节点。7.根据权利要求6所述的方法,其特征在于,所遍历节点具有邻接节点的社区标签时对应的模块度为第一因子与第二因子的差值;其中,所述第一因子为所遍历节点的第一权重和与全部连接关系权重和的比值,所述第二因子为所遍历节点权重和的乘积、...
【专利技术属性】
技术研发人员:齐逸岩,黄俊深,成杰峰,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。