一种基于PageRank算法的社区划分方法技术

技术编号:11270993 阅读:114 留言:0更新日期:2015-04-08 17:44
本发明专利技术提供了一种基于PageRank算法的社区划分方法,属于复杂网络社区划分技术领域,该发明专利技术将PageRank算法的随机游走性质,量化为顶点间关系程度矩阵,将PR值迭代向量升维至能量分布矩阵,进而由顶点间关系程度来划分社区。具有记录内容详细、运算简便等优点,在网络结构分析、邮件鉴别、文档聚类、谣言传播、信值传播等方面有着广泛的应用前景。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了,属于复杂网络社区划分
,该专利技术将PageRank算法的随机游走性质,量化为顶点间关系程度矩阵,将PR值迭代向量升维至能量分布矩阵,进而由顶点间关系程度来划分社区。具有记录内容详细、运算简便等优点,在网络结构分析、邮件鉴别、文档聚类、谣言传播、信值传播等方面有着广泛的应用前景。【专利说明】-种基于PageRank算法的社区划分方法
本专利技术设及复杂网络社区划分
,具体设及一种基于化geRank算法的社 区划分方法。
技术介绍
所谓社区划分,是人们对网络性质的物理意义和数学含义的深入研究,也就是指 网络中的社团结构。对网络进行社区划分,即是将具有相同结构、特征的网络结点归结为一 个小团体,使每个团体有着相同的性质。该个划分团体结构的过程,被称为社区的划分。社 区划分的目的和意义重大,由于网络中顶点个数繁多,当顶点个数增加到一定量级之后,利 用每个顶点的性质来体现整体网络的性质是不可取的,也是不可能的。网络具有与人类社 会相同的关系结构,根据不同的分类方式,可将人类群体分为不同种类,通过对每个种类的 研究,推演求得整体的性质;同理想要把握网络整体的结构性质,需要将网络划分为一些顶 点集,通过对顶点集的研究,来把握整体网络。 [000引化geRank算法是由拉里?佩奇(Larry Page)和谢尔盖?布林(Sergey Brin)为 排序网页而提出的算法。算法核屯、在于提供给网页W分值,利用分值排序网页,为捜索用户 甄选出好的网页,W提高使用捜索引擎寻找网页的体验舒适度。化geRank算法基于一种经 典的数学统计模型;"随机游走",它W其优良的数学理论基础和计算速度,成为计算机网络 研究人员一直追捧至今的优秀算法之一。 化geRank算法具有里程碑式的成功,对它的后续研究和应用大部分是对 化geRank算法在各种条件下的改进和改进后的应用。化geRank算法的应用很广泛,除了作 为Google捜索引擎网页排名的主要基础算法,还被应用于同样物理模型的各种网络中,例 如谣言网络、病毒传播网络、论文引用网络、引文索引、信任网络、影响力分析、推荐系统、社 交网络指标分析、偏好与声望查找、僵尸网络跟踪与分析、信息传播检测等。化geRank也被 反向应用于提高企业的网页排名,即是化geRank在SE0方面的相关应用研究。
技术实现思路
本申请通过提供一种基于化geRank算法的社区划分方法,不仅解决经典的 化geRank算法中的迭代向量仅能表示顶点得分情况,无从知晓得分的来源和去处技术问 题,还能够丰富目前的社区划分方法。 为解决上述技术问题,本申请采用W下技术方案予W实现: 一种基于化geRank算法的社区划分方法,包括步骤如下: [000引步骤S1 ;根据N维原始网络图G的顶点和边的关系,求得原始网络图G的邻接矩 阵D,如果从顶点i到顶点j存在边,则Dy= 1,否则D。= 0 ; 步骤S2 ;根据邻接矩阵D,求得原始网络图G的转移概率矩阵P,其中 【权利要求】1. ,包括步骤如下:步骤Sl:根据N维原始网络图G的顶点和边的关系,求得原始网络图G的邻接矩阵D, 如果从顶点i到顶点j存在边,则Dij= 1,否则DU=O; 步骤S2 :根据邻接矩阵D,求得原始网络图G的转移概率矩阵P,其中 步骤S3 :初始化能量矩阵A,所述能量矩阵A的第i行是当前时刻顶点i沿出度流出的 能量值,第j列是当前时刻从其他点流入顶点j的能量值,初始时刻的能量矩阵为Atl; 步骤S4 :根据迭代公式An=An_iP,求得第n时刻的能量矩阵An; 步骤S5 :将能量矩阵An的对角线元素4?置零; 步骤S6 :利用"出度占比最大法",在能量矩阵An中找出应当合并的顶点对(i,j),并将 顶点对(i,j)按照求解顺序存入序列List中; 步骤S7 :利用"行max列avg合并法",将步骤S6中顶点对(i,j)对应的能量矩阵An 中i行j行合并,i列j列合并,使得An降低1个维度; 步骤S8 :判断能量矩阵的维度是否为0,如果不为0,则继续执行步骤S6,如果为0,则 执行步骤S9 ; 步骤S9 :根据顶点对序列List,建立顶点合并树,并计算每次合并的模块度Q值,其中n。是划分的社区个数,m是原始图中的边总数,1。是某个社区C中顶 点间相互连接的边数,d。是C中顶点度数之和; 步骤SlO:比较每次合并的Q值,选择Q值最大的合并方案,得到社区划分结果。2. 根据权利要求1所述的基于PageRank算法的社区划分方法,其特征在于,步骤S6中 出度占比最大法,即若顶点i流出的最大能量流向顶点j,则将i与j合并为顶点对(i,j)。3. 根据权利要求1所述的基于PageRank算法的社区划分方法,其特征在于,步骤S7中 所述的行max列avg合并法,即针对步骤S6中得到的顶点对(i,j),在行方向上,保留i行 与j行的最大值存于i行对应元素中后删掉j行,在列方向上,求得i列与j列的平均值存 于i列对应元素中后删除j列,BP【文档编号】G06F19/00GK104504251SQ201410754171【公开日】2015年4月8日 申请日期:2014年12月10日 优先权日:2014年12月10日 【专利技术者】范纯龙, 张翼飞, 丁国辉, 杨硕, 张弛, 刘畅, 吴恒超 申请人:沈阳航空航天大学本文档来自技高网
...
一种基于PageRank算法的社区划分方法

【技术保护点】
一种基于PageRank算法的社区划分方法,包括步骤如下:步骤S1:根据N维原始网络图G的顶点和边的关系,求得原始网络图G的邻接矩阵D,如果从顶点i到顶点j存在边,则Dij=1,否则Dij=0;步骤S2:根据邻接矩阵D,求得原始网络图G的转移概率矩阵P,其中Pij=DijΣk=0N-1Dik;]]>步骤S3:初始化能量矩阵A,所述能量矩阵A的第i行是当前时刻顶点i沿出度流出的能量值,第j列是当前时刻从其他点流入顶点j的能量值,初始时刻的能量矩阵为A0;步骤S4:根据迭代公式An=An‑1P,求得第n时刻的能量矩阵An;步骤S5:将能量矩阵An的对角线元素置零;步骤S6:利用“出度占比最大法”,在能量矩阵An中找出应当合并的顶点对(i,j),并将顶点对(i,j)按照求解顺序存入序列List中;步骤S7:利用“行max列avg合并法”,将步骤S6中顶点对(i,j)对应的能量矩阵An中i行j行合并,i列j列合并,使得An降低1个维度;步骤S8:判断能量矩阵的维度是否为0,如果不为0,则继续执行步骤S6,如果为0,则执行步骤S9;步骤S9:根据顶点对序列List,建立顶点合并树,并计算每次合并的模块度Q值,其中nc是划分的社区个数,m是原始图中的边总数,lc是某个社区C中顶点间相互连接的边数,dc是C中顶点度数之和;步骤S10:比较每次合并的Q值,选择Q值最大的合并方案,得到社区划分结果。...

【技术特征摘要】

【专利技术属性】
技术研发人员:范纯龙张翼飞丁国辉杨硕张弛刘畅吴恒超
申请(专利权)人:沈阳航空航天大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1