The invention is applicable to the field of complex networks, and provides a method and a system of overlapping communities found connections based on the preference, the method comprises the following steps: according to the objective function constructed connection node to node preference; community strength matrix machine learning; node on the strength of community matrix were obtained including overlapping communities all nodes overlap within the community set. According to the objective function constructed connection preference nodes, and set on the basis of the objective function of the community to overlap, the overlapping community eventually discovered the results more precise, and has more practical value. The method of overlapping communities can be widely applied to large complex networks in that universality is high, the overlapping community in complex network data that is more simple, reducing the difficulty of data processing.
【技术实现步骤摘要】
一种基于节点连接偏好的重叠社区发现方法及系统
本专利技术属于复杂网络领域,尤其涉及一种基于节点连接偏好的重叠社区发现方法及系统。
技术介绍
在复杂网络领域,通常会通过基于图聚类算法的网络社区发现模型来发现网络社区。然而,图聚类算法由于算法本身限制每个节点属于且仅能属于一个社区,并不能检测到可重叠的网络社区。近几年提出的新方法虽然突破了图聚类的框架,但是,它们仅仅关注连接本身而忽略了连接中所隐藏的偏好信息,并且它们采用简单的值逼近作为目标函数,在物理意义上得不到很好的解释。
技术实现思路
本专利技术实施例的目的在于提供一种基于节点连接偏好的重叠社区发现方法及系统,旨在解决现有的网络社区发现模型,仅仅关注连接本身而忽略了连接中所隐藏的偏好信息,并且采用简单的值逼近作为目标函数,在物理意义上得不到很好的解释的问题。本专利技术是这样实现的,一种基于节点连接偏好的重叠社区发现方法,所述方法包括:根据节点的连接偏好构建目标函数;对节点-社区强度矩阵进行机器学习;对所述节点-社区强度矩阵进行筛选,得到包含每个社区内所有节点的重叠社区集合。优选的,所述根据节点的连接偏好构建目标函数,具体包括:定义N+(i)为目标节点i的相邻节点的集合、N-(i)=V-N+(i)-{i}为目标节点i的非相邻节点的集合,其中,{i}为目标节点i的集合;定义训练集S={(i,j,k)|j∈N+(i),k∈N-(i)};定义给定节点-社区强度矩阵下,目标节点i生成特定的对于所有其他节点的偏好顺序的概率为p(>i|F);假设目标节点i对其相邻节点j的偏好大于对其非相邻节点k的偏好;根据上述假设, ...
【技术保护点】
一种基于节点连接偏好的重叠社区发现方法,其特征在于,所述方法包括:根据节点的连接偏好构建目标函数;对节点‑社区强度矩阵进行机器学习;对所述节点‑社区强度矩阵进行筛选,得到包含重叠社区内所有节点的重叠社区集合。
【技术特征摘要】
1.一种基于节点连接偏好的重叠社区发现方法,其特征在于,所述方法包括:根据节点的连接偏好构建目标函数;对节点-社区强度矩阵进行机器学习;对所述节点-社区强度矩阵进行筛选,得到包含重叠社区内所有节点的重叠社区集合。2.如权利要求1所述的基于节点连接偏好的重叠社区发现方法,其特征在于,所述根据节点的连接偏好构建目标函数,具体包括:定义N+(i)为目标节点i的相邻节点的集合、N-(i)=v-N+(i)-{i}为目标节点i的非相邻节点的集合,其中,{i}为目标节点i的集合;定义训练集s={(i,j,k)|j∈N+(i),k∈N-(i)};定义给定节点-社区强度矩阵下,目标节点i生成特定的对于所有其他节点的偏好顺序的概率为p(>i|F);假设目标节点i对其相邻节点j的偏好大于对其非相邻节点k的偏好;根据上述假设,得到所述目标函数的表达式为:3.如权利要求2所述的基于节点连接偏好的重叠社区发现方法,其特征在于,所述根据节点的连接偏好构建目标函数,具体还包括:定义目标节点i对其相邻节点j的偏好大于对其非相邻节点k的偏好的概率为:其中,函数为Logistics函数,Fi为节点-社区强度矩阵的第i行;定义用于避免所述目标函数过适的正则化项的表达式为:||F||F其中,||·||F为弗罗贝尼乌斯范数(Frobeniusnorm);根据所述目标函数的表达式和所述正则化项的表达式,得到避免过适的所述目标函数的表达式为:其中,λ为正则项系数。4.如权利要求3所述的基于节点连接偏好的重叠社区发现方法,其特征在于,所述根据节点的连接偏好构建目标函数,具体还包括:将所述简化表达为将所述简化表达为得到简化后的所述目标函数表达式为:
【专利技术属性】
技术研发人员:张弘毅,金国庆,吕荣聪,
申请(专利权)人:香港中文大学深圳研究院,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。