当前位置: 首页 > 专利查询>河南大学专利>正文

一种基于密度峰值优化的标签传播社团检测方法及装置制造方法及图纸

技术编号:29133382 阅读:15 留言:0更新日期:2021-07-02 22:28
本发明专利技术属于复杂网络技术领域,公开一种基于密度峰值优化的标签传播社团检测方法及装置。本发明专利技术首先引入密度峰值来发现聚类中心,先确定社团的雏形,将复杂网络的社团个数和聚类中心固定下来,然后再采用标签传播算法来检测社团,提高了社团发现的准确性和鲁棒性,减少了迭代次数,加速了社团的形成。在基准网络和经典真实网络上的测试结果中发现,本发明专利技术和其它先进算法相比,本发明专利技术可以快速有效求解社团检测问题,在没有先验条件的情况下可以预测社团数量,发现的社团数量总是和实际社团数量保持一致,具有较好的稳定性和准确性。

【技术实现步骤摘要】
一种基于密度峰值优化的标签传播社团检测方法及装置
本专利技术属于复杂网络
,尤其涉及一种基于密度峰值优化的标签传播社团检测方法及装置。
技术介绍
社团结构是复杂网络中极为重要的属性。社团结构在分析社会网络中的交际关系、分析生物网络中组织和器官的作用关系、分析科学家协作网络中的引文关系中都起着至关重要的作用。因此,在过去的十几年里,从复杂网络中发现社团结构得到了广泛的研究。2002年,Girvan和Newman(M.Girvan,M.E.J.Newman.CommunityStructureinSocialandBiologicalNetworks[J].ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,2002,99(12).)取得了开创性的工作,指出复杂网络普遍存在社团结构,并且提出模块度Q来衡量网络中社团的稳定程度。社团结构的定义虽然没有明确的相关研究得到一致确定,但通常认为一个社团就是一组节点,也可以称为一个群落或者一组模块。这些节点有着社团内部连接紧密,社团外部连接稀疏的特点。基于标签传播的社团发现算法作为当前研究的热点之一,在社团检测中得到了广泛的应用。该算法是基于图的半监督学习方法,半监督学习的优势在于能通过少量的已标记样本来确定大量未标记的样本,从而提高学习过程中的有效性。标签传播的基本思路是从已经得到标记的节点的标签信息,利用节点之间的拓扑关系,预测未标记的节点的标签信息,最后完成图的划分,形成聚类结构。虽然该算法有实现简单、逻辑清晰、无需事前知道社团个数、时间复杂度接近线性等优点,但是划分结果不稳定、随机性强是这个算法的缺陷。在标签传播算法每次迭代过程中,节点归属哪个社团取决于其邻居节点累计权重最大的标签,因此当一个节点的最大邻居标签出现不止一个时,就会随机选择一个作为自己的标签。这种随机性会带来雪崩效应,即刚开始出现的一个小小的聚类结果错误会被不断的放大。并且节点标签的更新顺序也会对结果造成不小的影响,越重要的节点越早更新会加速收敛的过程。在标签传播算法中,初始标签的设置越接近核心点越能得到准确的聚类效果。
技术实现思路
本专利技术针对现有的标签传播算法中随机选择标签,社团划分结果不稳定的问题,提出一种基于密度峰值优化的标签传播社团检测方法及装置。为了实现上述目的,本专利技术采用以下技术方案:一种基于密度峰值优化的标签传播社团检测方法,包括:步骤1:从复杂网络G=(V,E)中构建邻接矩阵A;V为G的节点集,包含n个节点;E为G的边集,包含m条边;步骤2:采用余弦相似性计算复杂网络中节点间的相似度矩阵S;步骤3:基于节点间的相似度矩阵S计算复杂网络中节点的距离矩阵d;步骤4:采用高斯核函数计算节点的局部密度并进行标准化,得到标准化后节点的局部密度ρ*;步骤5:基于节点的距离矩阵d和标准化后节点的局部密度ρ*,得出复杂网络中节点与高密度节点间的距离,并进行标准化,得到标准化后节点与高密度节点间的距离δ*;步骤6:基于标准化后节点的局部密度ρ*和标准化后节点与高密度节点间的距离δ*,获取K个核心点;步骤7:采用高斯核函数的方法构建节点间的权重,并基于节点间的权重构建概率转移矩阵P;步骤8:基于获取的K个核心点构建标签矩阵F;步骤9:将标签矩阵F按照概率转移矩阵P中的节点间相似度进行传播,重置标签矩阵F,再将标签矩阵F进行传播、重置,迭代这个过程,直到F中的未标记的标签变化差值到达临界点,完成标签的划分。进一步地,所述步骤3包括:按照如下方式计算复杂网络中节点的距离矩阵d:其中,di,j为距离矩阵d中的元素,表示节点i和节点j的距离;S(i,j)为相似度矩阵S中的元素,表示节点i和节点j的相似度;σ是一个小的正数。进一步地于,所述步骤5包括:按照如下方式计算复杂网络中节点与高密度节点间的距离:其中,ρi表示节点i的局部密度,ρj表示节点j的局部密度。进一步地,所述步骤6包括:计算每个节点处的乘积γ=ρ*×δ*,选择大于γ的平均值与γ的标准差之和的值进入列表,然后顺序排列,最后选择列表中最大的前n*20%的节点作为核心点,即核心点个数K=n*20%。一种基于密度峰值优化的标签传播社团检测装置,包括:第一构建模块,用于从复杂网络G=(V,E)中构建邻接矩阵A;V为G的节点集,包含n个节点;E为G的边集,包含m条边;第一计算模块,用于采用余弦相似性计算复杂网络中节点间的相似度矩阵S;第二计算模块,用于基于节点间的相似度矩阵S计算复杂网络中节点的距离矩阵d;第三计算模块,用于采用高斯核函数计算节点的局部密度并进行标准化,得到标准化后节点的局部密度ρ*;第四计算模块,用于基于节点的距离矩阵d和标准化后节点的局部密度ρ*,得出复杂网络中节点与高密度节点间的距离,并进行标准化,得到标准化后节点与高密度节点间的距离δ*;核心点得出模块,用于基于标准化后节点的局部密度ρ*和标准化后节点与高密度节点间的距离δ*,获取K个核心点;第二构建模块,用于采用高斯核函数的方法构建节点间的权重,并基于节点间的权重构建概率转移矩阵P;第三构建模块,用于基于获取的K个核心点构建标签矩阵F;标签传播模块,用于将标签矩阵F按照概率转移矩阵P中的节点间相似度进行传播,重置标签矩阵F,再将标签矩阵F进行传播、重置,迭代这个过程,直到F中的未标记的标签变化差值到达临界点,完成标签的划分。与现有技术相比,本专利技术具有的有益效果:本专利技术在没有先验条件的情况下可以预测社团数量,避免了随机标签算法的划分不稳定、随机性强的缺陷,有效地提高了社团挖掘的准确性和算法的稳定性。此外因为构建了概率转移矩阵,减少了标签传播的迭代次数,使得本专利技术具有高效的运算效率,最后能够快速找到网络的社团结构。在基准网络和经典真实网络上的测试结果中发现,本专利技术和其它先进算法相比,本专利技术可以快速有效求解社团检测问题,在没有先验条件的情况下可以预测社团数量,发现的社团数量总是和实际社团数量保持一致,具有较好的稳定性和准确性。附图说明图1为本专利技术实施例一种基于密度峰值优化的标签传播社团检测方法的基本流程图;图2为不同方法在LFR基准数据集上的NMI实验结果比较图;图3为采用本专利技术方法对Football网络进行划分的可视化结果图;图4为采用本专利技术方法对Karate网络进行划分的可视化结果图;图5为采用本专利技术方法对Dolphins网络进行划分的可视化结果图。具体实施方式下面结合附图和具体的实施例对本专利技术做进一步的解释说明:实施例1如图1所示,一种基于密度峰值优化的标签传播社团检测方法,为表述方便,简称为DPLPA,包括:步骤S101:从复杂网络G=(V,E)中构本文档来自技高网
...

【技术保护点】
1.一种基于密度峰值优化的标签传播社团检测方法,其特征在于,包括:/n步骤1:从复杂网络G=(V,E)中构建邻接矩阵A;V为G的节点集,包含n个节点;E为G的边集,包含m条边;/n步骤2:采用余弦相似性计算复杂网络中节点间的相似度矩阵S;/n步骤3:基于节点间的相似度矩阵S计算复杂网络中节点的距离矩阵d;/n步骤4:采用高斯核函数计算节点的局部密度并进行标准化,得到标准化后节点的局部密度ρ

【技术特征摘要】
1.一种基于密度峰值优化的标签传播社团检测方法,其特征在于,包括:
步骤1:从复杂网络G=(V,E)中构建邻接矩阵A;V为G的节点集,包含n个节点;E为G的边集,包含m条边;
步骤2:采用余弦相似性计算复杂网络中节点间的相似度矩阵S;
步骤3:基于节点间的相似度矩阵S计算复杂网络中节点的距离矩阵d;
步骤4:采用高斯核函数计算节点的局部密度并进行标准化,得到标准化后节点的局部密度ρ*;
步骤5:基于节点的距离矩阵d和标准化后节点的局部密度ρ*,得出复杂网络中节点与高密度节点间的距离,并进行标准化,得到标准化后节点与高密度节点间的距离δ*;
步骤6:基于标准化后节点的局部密度ρ*和标准化后节点与高密度节点间的距离δ*,获取K个核心点;
步骤7:采用高斯核函数的方法构建节点间的权重,并基于节点间的权重构建概率转移矩阵P;
步骤8:基于获取的K个核心点构建标签矩阵F;
步骤9:将标签矩阵F按照概率转移矩阵P中的节点间相似度进行传播,重置标签矩阵F,再将标签矩阵F进行传播、重置,迭代这个过程,直到F中的未标记的标签变化差值到达临界点,完成标签的划分。


2.根据权利要求1所述的一种基于密度峰值优化的标签传播社团检测方法,其特征在于,所述步骤3包括:
按照如下方式计算复杂网络中节点的距离矩阵d:



其中,di,j为距离矩阵d中的元素,表示节点i和节点j的距离;S(i,j)为相似度矩阵S中的元素,表示节点i和节点j的相似度;σ是一个小的正数。


3.根据权利要求2所述的一种基于密度峰值优化的标签传播社团检测方法,其特征在于,所述步骤5包括:
按照如下方式计算复杂网络中节点与高密度节点...

【专利技术属性】
技术研发人员:陈国强马岩赵艳丽周宏基
申请(专利权)人:河南大学
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1