基于符号网络模型的社区挖掘方法及装置制造方法及图纸

技术编号:14146915 阅读:138 留言:0更新日期:2016-12-11 03:49
本发明专利技术适用于网络技术领域,提供了一种基于符号网络的社区挖掘方法及装置,所述方法包括:读取符号网络N的邻接矩阵A,设置社区数K的变化范围为[Kmin,Kmax],并初始化社区数K=Kmin,其中,所述符号网络N的节点总数为n,Kmin和Kmax为n范围内的整数;针对每一个社区数K,初始化对应的符号网络模型SNMK,并将所述符号网络模型SNMK与所述符号网络N拟合,计算所述符号网络模型SNMK的成本函数值HK;比较所有符号网络模型SNMK的成本函数值HK,选取成本函数值HK最小的符号网络模型SNMK作为最优模型SNMoptim;根据所述最优模型SNMoptim确定所述符号网络N中每个节点i所属的社区,0<i≤n。本发明专利技术实现了对符号网络的社区挖掘,且有效地提高了对符号网络进行社区挖掘的准确度。

【技术实现步骤摘要】

本专利技术属于网络
,尤其涉及一种基于符号网络模型的社区挖掘方法及装置
技术介绍
与仅能表示个体间是否存在关系的的无符号网络相比,符号网络能够将单一的存在关系扩展为正、负关系。比如,社交网络中的正链接表示友好、喜欢、信任等关系,负链接表示敌对、不喜欢、不信任等关系;政治网络中的正链接表示政治同盟关系、负链接表示政治敌对关系等。这些增加的符号信息有助于更深入地了解网络背后隐含的规律。社区作为复杂网络中普遍存在的一类重要结构模式,对于理解网络/系统的功能及发展演化具有重要的意义。对于社区发现问题,现有技术基于不同的原理提出了大量的社区发现算法。比如基于介数的算法、基于信息论的算法、基于模块度的算法、基于模型的算法等。然而,这些社区发现算法都是基于无符号网络提出的,更多地关注链接的密度而忽视了链接的符号,难以直接应用于带有正、负链接的符号网络。此外,现有技术还提出了专门用于符号网络的社区发现算法。比如:基于frustration的算法,通过最小化符号网络社区内负链接与社区间正链接的数量之和进行社区划分;基于改进模块度(modularity)的算法,对适用于无符号网络的模块度函数进行改进使之可以处理网络链接的符号;基于多目标优化的算法,通过同时优化多个目标函数实现对符号网络的社区发现,等等。然而,上述符号网络社区发现算法都归属于优化算法或启发算法,其检测精度依赖于所设计的优化目标函数或启发策略的质量,未从符号网络的社区结构的生成机制考虑,社区挖掘的准确度不高。
技术实现思路
鉴于此,本专利技术实施例提供了一种基于符号网络模型的社区挖掘方法及装置,以提高对符号网络进行社区挖掘的准确度。第一方面,提供了一种基于符号网络模型的社区挖掘方法,所述方法包括:读取符号网络N的邻接矩阵A,设置社区数K的变化范围为[Kmin,Kmax],并初始化社区数K=Kmin,其中,所述符号网络N的节点总数为n,Kmin和Kmax为n范围内的整数;针对每一个社区数K,初始化对应的符号网络模型SNMK,并将所述符号网络模型SNMK与所述符号网络N拟合,计算所述符号网络模型SNMK的成本函数值HK;比较所有符号网络模型SNMK的成本函数值HK,选取成本函数值HK最小的符号网络模型SNMK作为最优模型SNMoptim;根据所述最优模型SNMoptim确定所述符号网络N中每个节点i所属的社区,0<i≤n。第二方面,提供了一种基于符号网络模型的社区挖掘装置,所述装置包括:初始化模块,用于读取符号网络N的邻接矩阵A,设置社区数K的变化范围为[Kmin,Kmax],并初始化社区数K=Kmin,其中,所述符号网络N的节点总数为n,Kmin和Kmax为n范围内的整数;拟合模块,用于针对每一个社区数K,初始化对应的符号网络模型SNMK,并将所述符号网络模型SNMK与所述符号网络N拟合,计算所述符号网络模型SNMK的成本函数值HK;选取模块,用于比较所有符号网络模型SNMK的成本函数值HK,选取成本函数值HK最小的符号网络模型SNMK作为最优模型SNMoptim;社区确定模块,用于根据所述最优模型SNMoptim确定所述符号网络N中每个节点i所属的社区,0<i≤n。与现有技术相比,本专利技术实施例通过构建社区数K对应的符号网络模型SNMK,所述SNMK=(n,K,Z,π,θ),并将所述符号网络模型SNMK与所读取的符号网络N拟合,计算所述符号网络模型SNMK的成本函数值HK,以学习出符号网络N的社区结构;然后比较所有符号网络模型SNMK的成本函数值HK,选取成本函数值HK最小的符号网络模型SNMK作为最优模型SNMoptim,以确定社区的数目;最后根据所述最优模型SNMoptim确定所述符号网络N中每个节点i所属的社区,从而实现了对符号网络的社区挖掘,且有效地提高了对符号网络进行社区挖掘的准确度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。图1是本专利技术实施例提供的基于符号网络模型的社区挖掘方法的实现流程图;图2是本专利技术实施例提供的基于符号网络模型的社区挖掘方法中步骤S102的具体实现流程;图3是本专利技术实施例提供的将符号网络模型SNMK与所述符号网络N拟合的实现流程图;图4是本专利技术实施例提供的计算符号网络模型SNMK的成本函数值HK的实现流程图;图5是本专利技术实施例提供的基于符号网络模型的社区挖掘装置的组成结构图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术实施例通过构建社区数K对应的符号网络模型SNMK,所述SNMK=(n,K,Z,π,θ),并将所述符号网络模型SNMK与所读取的符号网络N拟合,计算所述符号网络模型SNMK的成本函数值HK,以学习出符号网络N的社区结构;然后比较所有符号网络模型SNMK的成本函数值HK,选取成本函数值HK最小的符号网络模型SNMK作为最优模型SNMoptim,以确定社区的数目;最后根据所述最优模型SNMoptim确定所述符号网络N中每个节点i所属的社区,从而实现了对符号网络的社区挖掘,且有效地提高了对符号网络进行社区挖掘的准确度。本专利技术实施例还提供了相应的装置,以下分别进行详细的说明。图1示出了本专利技术实施例提供的基于符号网络模型的社区挖掘方法的实现流程。在本专利技术实施例中,所述基于符号网络模型的社区挖掘方法应用于计算机、服务器等设备。参阅图1,所述基于符号网络模型的社区挖掘方法包括:在步骤S101中,读取符号网络N的邻接矩阵A,设置社区数K的变化范围为[Kmin,Kmax],并初始化社区数K=Kmin。在这里,本专利技术实施例通过读取符号网络N的邻接矩阵A来表示所述符号网络N中的节点以及节点之间的连接关系,有利于方便对复杂的符号网络N进行处理。其中,所述符号网络N的节点总数为n,所述邻接矩阵A中的元素aij表示节点i到节点j之间的边。所述1≤i≤n,1≤j≤n。当aij=1时,表示节点i到节点j之间存在一条正边;当aij=-1时,表示节点i到节点j之间存在一条负边;当aij=0时,表示节点i到节点j之间不存在边。所述社区数K表示符号网络N所划分的社区数量,本专利技术实施例预先设置了社区数K的取值范围为[Kmin,Kmax],并且初始化社区数K为Kmin,以从[Kmin,Kmax]中选取最优的社区数量。在这里,所述Kmin和Kmax为n范围内的整数,K取[Kmin,Kmax]范围内的整数。在步骤S102中,针对每一个社区数K,初始化对应的符号网络模型SNMK,并将所述符号网络模型SNMK与所述符号网络N拟合,计算所述符号网络模型SNMK的成本函数值HK。本专利技术实施例根据给定的社区数K初始化对应的符号网络模型SNMK,所述符号网络模型SNMK采用多项式分布表示符号网络中的边分布,有效地解决了现有模型无法建模符号网络的问题。然后将初始化后的所述符号网络模型SNMK与符本文档来自技高网...
基于符号网络模型的社区挖掘方法及装置

【技术保护点】
一种基于符号网络模型的社区挖掘方法,其特征在于,所述方法包括:读取符号网络N的邻接矩阵A,设置社区数K的变化范围为[Kmin,Kmax],并初始化社区数K=Kmin,其中,所述符号网络N的节点总数为n,Kmin和Kmax为n范围内的整数;针对每一个社区数K,初始化对应的符号网络模型SNMK,并将所述符号网络模型SNMK与所述符号网络N拟合,计算所述符号网络模型SNMK的成本函数值HK;比较所有符号网络模型SNMK的成本函数值HK,选取成本函数值HK最小的符号网络模型SNMK作为最优模型SNMoptim;根据所述最优模型SNMoptim确定所述符号网络N中每个节点i所属的社区,0<i≤n。

【技术特征摘要】
1.一种基于符号网络模型的社区挖掘方法,其特征在于,所述方法包括:读取符号网络N的邻接矩阵A,设置社区数K的变化范围为[Kmin,Kmax],并初始化社区数K=Kmin,其中,所述符号网络N的节点总数为n,Kmin和Kmax为n范围内的整数;针对每一个社区数K,初始化对应的符号网络模型SNMK,并将所述符号网络模型SNMK与所述符号网络N拟合,计算所述符号网络模型SNMK的成本函数值HK;比较所有符号网络模型SNMK的成本函数值HK,选取成本函数值HK最小的符号网络模型SNMK作为最优模型SNMoptim;根据所述最优模型SNMoptim确定所述符号网络N中每个节点i所属的社区,0<i≤n。2.如权利要求1所述的基于符号网络模型的社区挖掘方法,其特征在于,所述针对每一个社区数K,初始化对应的符号网络模型SNMK,并将所述符号网络模型SNMK与所述符号网络N拟合,计算所述符号网络模型SNMK的成本函数值HK包括:对于变化范围[Kmin,Kmax]内的每一个社区数K,采用随机方式初始化指示变量Z、参数π和参数θ,得到对应的符号网络模型SNMK=(n,K,Z,π,θ);将所述符号网络模型SNMK与所述符号网络N拟合,计算所述符号网络模型SNMK的参数π、参数θ以及指示变量Z的后验分布q;根据计算得到的所述参数π和参数θ,计算所述符号网络模型SNMK的成本函数值HK;其中,所述指示变量Z为n×K维向量,用于指示每个节点i所属的社区,每一行向量有且只有一个元素zik为1,其余元素zik为0;所述指示变量Z的后验分布q为n×K维向量,每一行向量中所有元素qik满足:所述参数π为K维向量,表示节点属于社区的先验概率,所述参数π中的元素πk满足:所述参数θ为K×n维向量,表示社区与节点的连接概率,所述参数θ中的每一个元素θki包括三个分量θ+ki、θ-ki、θ0ki,且所述θ+ki表示社区k与节点i之间存在一条正边的概率、所述θ-ki表示社区k与节点i之间存在一条负边的概率、所述θ0ki表示社区k与节点i之间不存在边的概率,0<k≤K。3.如权利要求2所述的基于符号网络模型的社区挖掘方法,其特征在于,所述将所述符号网络模型SNMK与所述符号网络N拟合,计算所述符号网络模型SNMK的参数π、参数θ以及指示变量Z的后验分布q包括:A:根据参数π和参数θ,计算指示变量Z的后验分布q中的每一个元素qik;B:根据所述元素qik更新参数π中的每一个元素πk和参数θ中的每一个元素θki的三个分量θ+ki、θ-ki、θ0ki;C:根据所述后验分布q以及更新后的参数π、参数θ计算对应的似然值L,并计算所述似然值L与上一次计算得到的似然值L之间的差值;D:比较所述差值与预设阈值,若所述差值小于所述预设阈值,则以本次更新的参数π、参数θ以及后验分布q作为最优参数;否则,返回步骤A进行下一次计算。4.如权利要求3所述的基于符号网络模型的社区挖掘方法,其特征在于,所述根据计算得到的所述参数π和参数θ,计算所述符号网络模型SNMK的成本函数值HK包括:根据所述最优参数中的参数π、参数θ以及所述最优参数对应的似然值L,按照预设公式计算所述符号网络模型SNMK的成本函数值HK;其中,所述预设公式为: H K = - L + Σ k = 1 K ln ( π k 1 / 3 n ) δ ( π k ≥ 1 / 3 n ) + Σ k = 1 K Σ i = 1 n ( ln ( θ k i + 1 / 3 n ) δ ( θ k i + ≥ 1 / 3 n ) + ln ( θ k i 0 1 / 3 n ) δ ( θ k i 0 ≥ 1 / 3 n ) + ln ( θ k i - 1 / 3 n ) δ ( θ k i - ≥ 1 / 3 n ) ) ]]>所述函数δ(πk≥1/3n)表示若πk大于或等于1/3n则函数值为1,否则函数值为0;所述函数表示若θ+ki大于或等于1/3n则函数值为1,否则函数值为0;所述函数表示若θ0ki大于或等于1/3n则函数值为1,否则函数值为0;所述函数表示若θ-ki大于或等于1/3n则函数值为1,否则函数值为0。5.如权利要求1至4任一项所述的基于符号网络模型的社区挖掘方法,其特征在于,所述根据所述最优模型SNMoptim确定所述符号网络N中每个节点i所属的社区,0<i≤n包括:根据所述最优模型SNMoptim的指示变量Z的后验分布q...

【专利技术属性】
技术研发人员:赵学华陈慧灵杨博刘学艳
申请(专利权)人:深圳信息职业技术学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1