一种基于多目标优化的Web社区发现方法技术

技术编号:8271497 阅读:283 留言:0更新日期:2013-01-31 03:44
本发明专利技术提出一种基于多目标优化的Web社区发现方法,应用于Web2.0下的社交网络,可以提升信息主动服务质量、增强网络文化安全等;其包括:设置粒子群规模、粒子位置和速度的范围与维度、粒子群惯性因子、邻域半径及外部存档最大容量等相关参数;建立Web信息网络各节点的邻居节点编号表;采用基于节点邻居有序表的编码方法初始化粒子群;重复如下操作直到停止条件满足:计算粒子适应度向量,比较粒子的Pareto支配关系,更新Pareto最优社区结构集,选择粒子飞行的leader,更新粒子的位置和速度;输出全部Pareto最优解集元素所对应的网络社区结构。与基于单目标优化策略的经典算法相比较,本发明专利技术提出的方法能发现更有效的Pareto最优网络社区结构。

【技术实现步骤摘要】
本专利技术涉及一种Web2. O下信息交互平台中的社区挖掘,特别是一种运用多目标优化理论的社区发现方法,属于社会网络

技术介绍
以自由开放共享为核心精神的Web 2. O使得广大网民成为互联网的主角,以博客网络、社交网络、wiki网络等为代表的信息网络已经深入到人们的工作、学习等各种活动中。如何从这些复杂的关系网络挖掘出有价值的结构模式已成为互联网的研究热点,Web社区发现研究就是其中热门话题之一。虽然Web社区的严格定义还不存在,但是我们可以松散地将其定义为具有某种共 同特征的相互连接的Web信息载体集合,例如,隶属于某个特定主题的Web页面集合,由具有某种共同兴趣爱好的微博者组成的微群,等等。从网络拓扑结构来看,一个网络社区就是一个网络图的稠密连通子图,在这个子图内的节点之间连接密度高于子图内部节点与外部节点的连接密度。网络社区发现研究正吸引着来自物理学、生物学、社会学与计算机科学等不同领域学者的关注,近年来涌现出大量的方法。网络社区发现本质上就是基于网络链接的聚类学习,该聚类问题是一个与图最优划分等价的NP难问题,非凸最优化问题的一种有效解法是基于生物启发式优化的近似策略。Tasgin等人通过利用GA算法优化社区模块度Q函数来实现网络最优划分的近似.Pizzutiz首先给出用于评判网络划分质量的社区分数(community score)的定义,然后运用GA-Net进行优化网络划分。考虑到社会网络的海量性,Lipczak等人提出一个基于社区足够小且社区数有限假设的ACGA算法将一个社区编码为一个个体,根据社区质量潜在提高量来选择个体进行遗传操作。段晓东等人引入粒子群算法对网络进行迭代二分实现Web社区的发现。黄发良等人提出的CDPSO算法采用基于节点邻居有序表的粒子编码方式,通过PSO全局搜索来挖掘社区。Gog等人提出一种基于个体信息共享机制的协同进化算法对网络社区结构进行寻优。这些算法主要是根据社区发现具体问题对进化算法从编码模,遗传算子与适应度函数等方面进行改造,其中的一个共同点是优化的目标函数只有一个而不是多个。而社区质量评判指标的多样性、耦合关联性与数据依赖性使得现有的基于单一评判指标优化的社区发现算法很难在实际工程问题中得到应用。
技术实现思路
本专利技术的目的是为了克服现有技术中的社区发现方法在Web网络挖掘过程中没有对各种相互依赖的社区质量评判指标进行综合考量的缺陷,提供一种基于多目标粒子群优化的网络社区发现方法。为了实现上述目的,本专利技术提供了一种基于多目标优化的Web社区发现方法,其特征在于应用于Web2. O下的社交网络,包括以下步骤步骤I)、设置专利技术方法的算法相关参数粒子群规模,粒子位置和速度的范围与维度,粒子群惯性因子,邻域半径及外部存档最大容量,MOPSO算法的最大迭代次数; 步骤2)、对于给定Web信息网络中的所有节点进行编号,通过对每个节点的邻居根据其编号进行排序来构造邻居有序表; 步骤3)、采用基于节点邻居有序表的编码方法初始化粒子群,粒子群中的个体粒子产生方法如下初始化一个长度为网络节点数的向量,该向量中的第i位分量取值为区间[1,NLL]中的一个随机整数,NLL为邻居有序表中的中心节点i对应的邻居列表长度; 步骤4)、通过MOPSO算法实现寻优Pareto最优解集元素所对应的网络社区结构。本专利技术的有益效果是比起传统的社区发现方法,本专利技术提出的方法能将各种网络社区质量评判指标进行综合考量,可以发现与网络社区真实结构更相符合的社区结构。 本专利技术应用于以微博网络、邮件网络、BBS论坛网络等各种社交平台,可以优化信息网络结构、提升信息主动服务质量、增强网络文化安全等。附图说明图I为本专利技术的基于多目标优化的Web社区发现方法的总流程 图2为本专利技术方法中的基于节点邻居有序表的粒子编码方法; 图3为本专利技术方法中的基于核密度估计的leader选择机制;具体实施例方式 下面结合附图和具体实施方式对本专利技术予以说明。为了方便详细阐述本专利技术,首先统一说明相关基本概念。定义I (Pareto支配关系)对于由社区划分函数—& ^:酽~ 1>发现的蕴含于网络6=(¥,E)中的两种不同社区结构i^P3e P,社区结构Pareto支配社区结构/ 当且仅当下式成立并记为if : Cl) 定义2 (Pareto相等关系)类似Pareto支配关系,社区结构与社区结构Pareto相等当且仅当下式成立并记为i|=J| (2) 定义3 (Pareto不可明辨关系)类似Pareto支配关系,社区结构巧与社区结构P3满足Pareto不可明辨关系当且仅当下式成立并记为 狀 >-F2)Λ-.(P3 > ^)(3) 定义4 (Pareto最优社区结构)若网络社区划分方案集合P中的某一划分方案P*被称为Pareto最优社区结构,当仅当如下条件成立-BR ^ P. R ^ P*(4) 定义5 (Pareto最优社区结构集)所有Pareto最优社区结构组成的集合 二 {P>P }称为Pareto最优社区结构集。定义6 (Pareto前沿)Pareto最优社区结构集的社区所对应的质量评判指标向量组成的集合称为Pareto前沿。定义7(Web社区发现)给定网络,V为Web信息载体(节点)的非空集合,E网络节点之间的连接关系,F为用户指定的目标函数集合,V所对应的k划分的网络社区划分方案巧,其中c』、须满足4个条件,UCf=F与值可由算法决定或用户给出.Web社区发现的过程就是 寻找使F函数达到最优化的划分夂. 结合上述定义,Web社区结构划分的多目标优化问题可用如下数学模型加以描述 ^C/d J)(5) \{X) = Q{k=XX ,q) 其中X为给定网络的某种社区划分方案,X的具体表示形式由进化算法的个体编码方式而定,为目标向量,目标函数巧(JTKi = Ilm)为第i种社区质量评判指标,gjiJO与 为约束函数,借此约束函数可以指定算法发现满足某些特定条件的网络社区结构。如图I所示,图I是本专利技术的基于多目标优化的Web社区发现方法的总流程示意图,该基于多目标优化的Web社区发现方法一共有以下几个步骤 步骤I :设置专利技术方法的算法相关参数粒子群规模,粒子位置和速度的范围与维度,粒子群惯性因子,邻域半径及外部存档最大容量,MOPSO算法的最大迭代次数; 步骤2 :对于给定Web信息网络,建立网络节点的邻居有序表,其实现方法为首先对网络中所有节点进行编号,然后对每个节点的邻居根据其编号进行排序形成邻居有序表;步骤3 :根据步骤2建立的邻居有序表进行粒子群的初始化,其实现方法为初始化一个长度为网络节点数的向量,该向量中的第i位分量取值为区间[1,NLL]中的一个随机整数,NLL为邻居有序表中中心节点i对应的邻居列表长度; 步骤4:借助多目标粒子群优化算法实现多个目标函数的Pareto最优解的寻优,对Pareto最优解对应粒子进行解码,并将解码结果作为网络社区结构输出。其实现方法如下重复如下操作直到最大迭代次数的停止条件满足计算粒子适应度向量,比较粒子的Pareto支配关系,调用UpdatePS方法更新Pareto最优社区结构集,调用IeaderSelect本文档来自技高网
...

【技术保护点】
一种基于多目标优化的Web社区发现方法,其特征在于:应用于Web2.0下的社交网络,包括以下步骤:步骤1)、设置专利技术方法的算法相关参数:粒子群规模,粒子位置和速度的范围与维度,粒子群惯性因子,邻域半径及外部存档最大容量,MOPSO算法的最大迭代次数;步骤2)、对于给定Web信息网络中的所有节点进行编号,通过对每个节点的邻居根据其编号进行排序来构造邻居有序表;?步骤3)、采用基于节点邻居有序表的编码方法初始化粒子群,粒子群中的个体粒子产生方法如下:初始化一个长度为网络节点数的向量,该向量中的第i位分量取值为区间[1,?NLL]中的一个随机整数,NLL为邻居有序表中的中心节点i对应的邻居列表长度;步骤4)、通过MOPSO算法实现寻优Pareto最优解集元素所对应的网络社区结构。

【技术特征摘要】
1.一种基于多目标优化的Web社区发现方法,其特征在于应用于Web2. O下的社交网络,包括以下步骤 步骤I)、设置发明方法的算法相关参数粒子群规模,粒子位置和速度的范围与维度,粒子群惯性因子,邻域半径及外部存档最大容量,MOPSO算法的最大迭代次数; 步骤2)、对于给定Web信息网络中的所有节点进行编号,通过对每个节点的邻居根据其编号进行排序来构造邻居有序表; 步骤3)、采用基于节点邻居有序表的编码方法初始化粒子群,粒子群中的个体粒子产生方法如下初始化一个长度为网络节点数的向量,该向量中的第i位分量取值为区间[1,NLL]中的一个随机整数,NLL为邻居有序表中的中心节点i对应的邻居列表长度; 步骤4)、通过MOPSO算法实现寻优Pareto最优解集元素所对应的网络社区结构。2.根据权利要求I所述的基于多目标优化的Web社区发现方法,其特征在于,所述的步骤4)包括 步骤 4-1)、 计算 粒子 适应 度向 量 ,3.根据权利要求2所述的基于多目标优化的Web社区发现方法,其特征在于,所述的步骤4-3)包括 步骤4-3-1)、将当前迭代过程产生的网络社区划分方案集合CurBestP中的每个网络社区划分方案6与存储Pareto历史最优解的队列中的每个粒子对应的社区结构进行Pareto关系比较,若社区结构# Pareto支配社区结构则在执行#入队与A删除操作; 步骤4-3-2)、将当前迭代过程产生的网络社区划分方案集合CurBestP中的每个网络社区划分方案#与队列jfts中的每个粒子对应的社区结构Pi进行Pareto关系比...

【专利技术属性】
技术研发人员:黄发良
申请(专利权)人:福建师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1