当前位置: 首页 > 专利查询>湖南大学专利>正文

一种web社会网络行为轨迹分析与控制子集获取方法技术

技术编号:6135774 阅读:277 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种web社会网络行为轨迹分析与控制子集获取方法:定义n个时间段的大小,分析行为轨迹,得到行为轨迹二部图;对输出的行为轨迹二部图分别进行分析,求解行为控制子集,得到最小行为控制子集;合并输出的一系列最小行为控制子集合并,得到社会网络整体的行为控制子集。本方法解决了行为轨迹的时间和空间维度上的分析问题,以较低的时间复杂度求解出最小行为控制子集,从而有效地缩小了web社会网络的监控范围,较方便地对web社会网络整体行为进行控制,有效地防止了传染性或恶性行为在网络中扩散。

【技术实现步骤摘要】

本专利技术涉及网络技术,具体是一种web社会网络中的行为数据分析与行为轨迹控制子集获取方法。
技术介绍
在线的web社会网络(0SN,0nline Social Networks)的快速崛起,已经聚集了海量用户和行为数据,据2010年统计我国社交网络用户近2亿,用户近5亿的!^ceBook已成为世界第三大“国家”,人人网、MySpace、Ning等也均已拥有庞大的用户群。在线web社会网络为用户提供了丰富的应用服务,包括协同社区、网络广告分发、网络交友等,用户在社圈中可以进行各种活动,所形成的和具体活动有关的数据叫做行为数据,如邮件行为数据、 微博行为数据、照片发布行为数据等。由于这些活动参与者能随时随地与世界各地成千上万的联系人迅速建立联系,并可在设定的范围内实时发布/共享数据和资源,如个人行踪、 观点和敏感数据等,从而在短时间内迅速地积累了海量的行为数据,随着其内部活动日趋紧密和频繁,对各种复杂的社会网络行为数据进行分析,及时掌控web社会网络的行为特点,已成为目前新形势下刻不容缓的任务。这些行为(活动)数据集通常包含行为类型、行为地点、时间、人名、主题等。如图 1显示了一个web交友社会网络的数据集的一部分;然后,根据图1,可以分析出图2中的 Bob的部分社会网络(一些好友未画出),同理,也可以分析其它人的社会网络。但由于web 社会网络中的个体行为在时间和空间上都有延伸分布,图2的分析图只能是静态体现某一时刻的社会网络,不能充分展示Bob或其它个体的动态行为轨迹(指对行为数据中的时间和空间等相关信息),更重要的是对于社会网络的整体行为特点缺乏掌控。二部图(Bipartite Graph)是指顶点可以分成两个不相交的集合A和B,A和B 之间存在关联(有共同边),但是在同一个集合A或B内的顶点不关联(没有共同边)的图。二部图的最小控制子集(Minimum Dominating Set)是指顶点数量最小的一个集合 C,C^ A或C^B,能将B或者A的全部顶点关联进来。这类控制子集问题通常为NP完全问题,求解的时间复杂度很高,研究人员通常通过一些时间复杂度相对低的近似算法来求解。
技术实现思路
本专利技术所要解决的技术问题是,提供一种web社会网络行为轨迹分析与控制方法,解决行为轨迹的时间和空间维度上的分析问题,以较低的时间复杂度求解出最小行为控制子集,从而有效地缩小web社会网络的监控范围,较方便地对web社会网络整体行为进行控制,防止传染性或恶性行为在网络中扩散。为解决上述技术问题,本专利技术所采用的技术方案是:web社会网络行为轨迹分析与控制子集获取方法为1)定义η个时间段的大小,分析行为轨迹,得到行为轨迹二部图;2)对输出的行为轨迹二部图分别进行分析,求解行为控制子集,得到最小行为控制子集;3)合并输出的一系列最小行为控制子集集合,得到社会网络整体的行为控制子集。分析行为轨迹的步骤如下1)为每个时间段定义包含行为主体与行为地点或类型的两个顶点集合1和E ;2)对tk时间段的数据记录逐行扫描,如果行为主体ik不在集合Ik中,则将行为主体ik添加到Ik中,如果行为地点或类型ek不在&中,则将ek添加到Ek =Ek - Ek U {ej,其中 k e{1,2,· · ·,η},;幻在ik与q之间建立关联;4)当tk时间段的数据记录扫描完毕时,输出一个包含Ik和&的二部图;6)重复步骤2),3),4),直到分析完所有的时间段。求解行为控制子集的步骤如下1)定义行为重叠因子函数:σ(。=购,其中Jk gEk,其中k e {I,2,· · ·,n}, N (Jk)表示与行为地点或类型集合Jk关联的不同个体的数量,deg(l)表示关联顶点1的顶点的数量;2)求解求解重叠因子的最大值31^^),得到二部图的最小行为控制子集Jk,其中,argmax表示求解能使函数取最大值的变量值;3)重复步骤1)和幻,直到分析完所有的行为轨迹二部图。本专利技术适用于包含行为数据的数据集合。本专利技术的基本思想是对某时间段t内的行为地点(或者类型)与行为主体(这里指网络用户)数据分别进行抽取,利用二部图原理,将它们分配到一个包含两个不同集合(即行为集合与个体集合)的二部图,这样可将个体与时间/空间上的行为轨迹直接关联起来。在此基础上,定义一种行为重叠因子函数1),通过求解重叠因子的最大值来获取该二部图的最小行为控制子集。由于web社会网络的规模往往很大,获取控制子集后能及早地对少量行为或个体进行跟踪和控制,防止传染性事件的扩散。由于随着时间的推移,行为数据集在不断增长,本专利技术首先对于各个时间段{t1; t2,. . .,tn}内的数据集进行分段,进而可以分析行为轨迹并获取控制子集,具体的方法与步骤为(1)第一步,根据具体应用需要,定义η个时间段{t1; t2,...,tj的大小,分析行为轨迹的步骤如下(1. 1)为每个时间段定义包含行为主体与行为地点(或类型)的两个顶点集合1 和E ;默认为空;(1. 2) For k = 1 to η(1. 3)对tk时间段的数据记录进行逐行扫描;(1. 4) if 行为主体 i not in Ik(1. 5)将行为主体 i 添加到 Ik Ik — Ik U {i};(1.6) if 行为地点(或类型)e not in Ek(1. 7)将 e 添加到 & =Ek - Ek U {e};(1.8)并且在i与e之间建立关联;(1. 9)直到tk时间段的数据记录扫描完毕;(1. 10)输出一个包含Ik和Ek的二部图Gk ;(Lll)End(2)第二步,对输出的行为轨迹二部图{&,&,.. . ,GJ分别进行分析,求解行为控制子集,步骤如下(2. l)For k = 1 to η(2. 2)定义行为重叠因子函数OA^Vgdeg(…其中,知(2.幻求解arg;naxfjK);(2. 4)输出的Jk即为二部图的最小行为控制子集;(2. 4) End(3)第三步,合并输出的一系列IJ1, J2,. . .,Jj集合,得到社会网络整体的行为控制子集J=U々·_其中,N(Jk)表示与行为地点(或类型)集合Jk关联的不同个体的数量,deg(l)表示关联顶点1的顶点i的数量。(2. 3)中的公式argmax表示求解能使函数取最大值的变量值;(2. 3)中求解的变量为Jk,函数σ (Jk)彡1。(2.3)要求N(Jk)尽可能大,这样受Jk覆盖 /关联的顶点就越多;而deg(l)之和尽可能小,即覆盖的重叠顶点要少,从而获取最小控制子集。由于社会网络的规模非常庞大,实际应用时,本专利技术通过逐步寻找deg(l)值最大的那些顶点来求解(2.幻,可以较快地获取控制子集。本专利技术解决了行为轨迹的时间和空间维度上的分析问题,以较低的时间复杂度求解出最小行为控制子集,从而有效地缩小了 web社会网络的监控范围,较方便地对web社会网络整体行为进行控制,有效地防止了传染性或恶性行为在网络中扩散。附图说明图1为行为主体图;图2为行为轨迹二部图G1 ;图3为行为轨迹二部图&。具体实施例方式本专利技术具体实施方式如下第一步,对数据集进行分析,得到行为时空和空间轨迹信息。(1)对表1中的数据集的两个时间段(n 本文档来自技高网
...

【技术保护点】
1.一种web社会网络行为轨迹分析与控制子集获取方法,其特征在于,该方法为:1)定义n个时间段的大小,分析行为轨迹,得到行为轨迹二部图;2)对输出的行为轨迹二部图分别进行分析,求解行为控制子集,得到最小行为控制子集;3)合并输出的一系列最小行为控制子集合并,得到社会网络整体的行为控制子集。

【技术特征摘要】

【专利技术属性】
技术研发人员:胡玉鹏罗昊石懋德梁磊刘嘉祁
申请(专利权)人:湖南大学
类型:发明
国别省市:43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1