社团融合事件的预测方法技术

技术编号:12019110 阅读:211 留言:0更新日期:2015-09-09 16:10
本发明专利技术公开了一种社团融合事件的预测方法,包括:步骤一、将网络原始数据按照设定的时间片进行分割,并从中选取多个时间片数据作为训练数据;步骤二、对训练数据进行静态社团和动态社团的划分;步骤三、基于训练数据提取任意两个社团之间的关键因素指标;步骤四、对所述关键因素指标进行监督训练,并根据监督训练的学习结果判断任意两个社团是否会发生融合。该方法实现了对任意两个社团或多个社团是否会发生融合事件的预测,预测可靠性高,可普适于绝大多数有权或无权的复杂网络的分析。

【技术实现步骤摘要】

本专利技术涉及数据挖掘领域,尤其涉及一种。
技术介绍
在我们的生活中,复杂网络已经无处不在,其共同特点是规模巨大、结构复杂。例 如社交网络就是由实际生活中人与人之间关系构成的一种典型的复杂网络,其节点代表网 络用户或真实社会中的人,节点间的连接代表网络用户间的好友关系或真实的人际关系。 社交网络中这种由节点,和节点之间的连接形成的结构称为网络拓扑结构,该结构在不同 类型、不同阶段的社交网络中呈现出不同的特征。 社团是代表复杂网络重要特征的一种子网络。社团同样具有网络拓扑结构,并且 社团结构会随着社团演化及其关键事件的发生呈现出不同的特征。复杂网络中关键事件的 发生代表着某种群体的行为导向。例如社交网络中的社团代表着各种社交圈,可以是朋友 圈、亲情圈、同事圈等等。这些社团可能意味着某些兴趣因素或社会因素的形成。对关键事 件进行预测有助于提前挖掘这些因素并加以利用,进一步指导网络行为。因此,对社团演化 关键事件的预测无论在研宄方面还是应用方面都有非常重要的意义。 社团演化关键事件包括社团的消亡,新生,收缩,扩张,分裂和融合。目前,对社团 演化关键事件的预测方法已有一些研宄,但仅限于预测单个社团的演化倾向。社团融合事 件的发生涉及到多个社团,以往的研宄工作仅实现了对单个社团是否有融合倾向的预测, 并没有明确的方法来预测哪几个社团在未来的一段时间内会发生融合。 综上,亟需一种方法来对将发生融合的社团进行更加详细的预测。
技术实现思路
本专利技术所要解决的技术问题之一是提供一种方法来对将发生融合的社团进行更 加详细的预测。 为了解决上述技术问题,本申请的实施例提供了一种, 包括:步骤一、将网络原始数据按照设定的时间片进行分割,并从中选取多个时间片数据作 为训练数据;步骤二、对训练数据进行静态社团和动态社团的划分;步骤三、基于训练数据 提取任意两个社团之间的关键因素指标;步骤四、对所述关键因素指标进行监督训练,并根 据监督训练的学习结果判断任意两个社团是否会发生融合。 优选地,关键因素指标包括两个社团之间的内部结构指标、所述内部结构指标的 一阶变化指标、二阶变化指标以及两个社团的外部结构相似度指标。 优选地,利用如下表达式提取所述两个社团之间的内部结构指标: 式中,Bd(i,j)为社团i与社团j之间的内部结构指标,Eu为社团i与社团j之 间的连接数,EjPL分别为社团i和社团j内部的连接数,N ^分别为社团i和社团j 内部的节点数。 优选地,利用如下表达式提取所述两个社团的外部结构相似度指标: 式中,Sim(i,j)为社团i与社团j的外部结构相似度指标;wi;k和w11;分别表示社 团i和社团k之间以及社团j和社团k之间的权,其中,,Ei,k 和Eu分别为社团i与社团k之间以及社团j与社团k之间的连接数,N 和Nk分别为社 团i、社团j与社团k内部的节点数;m为社团序号数。 优选地,步骤四中包括以下步骤:利用基于训练数据得到的关键因素指标构建预 测模型,并确定社团发生融合的分界线值;将基于距待预测的时间点最近的时间片的数据 得到的关键因素指标代入所述预测模型,并将得到的预测结果与所述分界线值进行比较以 判断社团是否会发生融合。 优选地,利用如下表达式构建所述预测模型: 式中,W,。为社团i与社团j之间发生融合事件的倾向度,为概率拟合函数,和分别为社团i与社团j之间的内部结构指标的一阶变化指标、二阶变化指标 以及外部结构相似度指标;tjPtt分别表示不同的时间点,△t为时间间隔。 优选地,在确定社团发生融合的分界线值的步骤中包括:将根据所述预测模型预 测得到的倾向度值进行归一化处理;利用处理后的倾向度值与基于训练数据提取得到的社 团融合情况建立基准函数;将基准函数取得最大值时的倾向度值作为社团发生融合的分界 线值。 优选地,基准函数根据如下表达式建立: 式中,F为基准函数,a和0为参数,T%为基于训练数据提取得到的发生融合的 社团对所对应的倾向度值。 优选地,步骤四包括以下步骤:将基于训练数据得到的关键因素指标组成的向量 代入SVM预测模型进行训练以确定社团发生融合的分类器;将基于距待预测的时间点最近 的时间片的数据得到的关键因素指标组成的向量代入所述SVM预测模型,并根据得到的分 类预测结果判断社团是否会发生融合。 优选地,在步骤三之前还包括:基于所述静态社团和所述动态社团对每一个社团 分别进行预测,得到将会参与融合的社团集合;在步骤三中,基于训练数据提取所述社团集 合中任意两个社团之间的关键因素指标。 与现有技术相比,上述方案中的一个或多个实施例可以具有如下优点或有益效 果: 通过提取两个社团之间的关键因素指标,实现了对任意两个社团或多个社团是否 会发生融合事件的预测,该方法预测可靠性高,可普适于绝大多数有权或无权的复杂网络 的分析。 本专利技术的其他优点、目标,和特征在某种程度上将在随后的说明书中进行阐述,并 且在某种程度上,基于对下文的考察研宄对本领域技术人员而言将是显而易见的,或者可 以从本专利技术的实践中得到教导。本专利技术的目标和其他优点可以通过下面的说明书,权利要 求书,以及附图中所特别指出的结构来实现和获得。【附图说明】 附图用来提供对本申请的技术方案或现有技术的进一步理解,并且构成说明书的 一部分。其中,表达本申请实施例的附图与本申请的实施例一起用于解释本申请的技术方 案,但并不构成对本申请技术方案的限制。 图1为本申请实施例的的流程示意图; 图2为内部结构指标累积分布曲线图; 图3为外部结构相似度指标累积分布曲线图; 图4为本申请实施例的利用关键因素指标进行监督训练的流程示意图; 图5为本申请实施例的的流程示意图。【具体实施方式】 以下将结合附图及实施例来详细说明本专利技术的实施方式,借此对本专利技术如何应用 技术手段来解决技术问题,并达成相应技术效果的实现过程能充分理解并据以实施。本申 请实施例以及实施例中的各个特征,在不相冲突前提下可以相互结合,所形成的技术方案 均在本专利技术的保护范围之内。 另外,附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统 中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的 顺序执行所示出或描述的步骤。 对于出现在本申请中的一些领域内常用语进行如下解释: 网络拓扑结构:网络中由节点和节点间的连接组成的结构称为网络拓扑结构。 网络社团:借助数学中的图论等工具研宄复杂网络。给定图G,网络社团是一个各 点紧密相连的子图G'。社团结构最直观的量化方法是网络社团内部密度大于外部密度。 时间片:即在固定某一个时间点时对网络进行快照,如同对不断变化发展的网络 在某个时间点进行切片,称为时间片。 静态社团:在某个时间片划分出来的社团。 动态社团:将在一系列时间片划分出来的静态社团按照时间先后顺序连接起来形 成的社团演化轨迹。 社团融合事件:两个及以上数目的社团中的节点在未来的某个时间被检测到连通 于一个社团中。 监督训练:即根据训练集输入输出数据进行迭代计算得到分类、预测等模型。 训练数据:用来得到训练模型的历史数据。 图1为本申请实施例的的流程示意图。该方法包括:步 骤S110、将网络原始数据按照设定的当前第1页1 2&nb本文档来自技高网...

【技术保护点】
一种社团融合事件的预测方法,包括:步骤一、将网络原始数据按照设定的时间片进行分割,并从中选取多个时间片数据作为训练数据;步骤二、对训练数据进行静态社团和动态社团的划分;步骤三、基于训练数据提取任意两个社团之间的关键因素指标;步骤四、对所述关键因素指标进行监督训练,并根据监督训练的学习结果判断任意两个社团是否会发生融合。

【技术特征摘要】

【专利技术属性】
技术研发人员:唐晓晟李巍胡铮张诗悦
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1