一种电信网络用户的交往圈挖掘方法及系统技术方案

技术编号:13332561 阅读:38 留言:0更新日期:2016-07-12 01:38
本发明专利技术公开了一种电信网络用户的交往圈挖掘方法及系统,方法包括:从当前网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈;查找构建交往圈内每个用户节点的邻居用户节点集合,计算集合内每个邻居用户节点对于交往圈的归属度,选取归属度最大且大于预定值的邻居用户节点u,将该邻居用户节点u加入到交往圈中,扩张交往圈,当归属度不大于预定值时,停止扩张;将交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图重复上述步骤处理直至网络拓扑图中剩余边为零得到N个交往圈。本发明专利技术挖掘确定出的用户交往圈的准确度较高且应用范围广。

【技术实现步骤摘要】

本专利技术涉及社交网络的用户交往圈挖掘领域,特别是一种应用于电信运营商的用户通话网络的电信网络用户的交往圈挖掘方法及系统
技术介绍
进入21世纪,随着网络和通信技术的发展,用户之间的社交关系已从现实物理空间延伸到了虚拟的网络空间。通信网络作为人们日常接触最多同时也是最重要的网络,其中包含着海量的用户交互信息。如何使用这些信息从而在用户社交关系领域建立从信息空间中到物理空间的联系已经受到电信运营商的广泛关注。通过挖掘用户交往圈信息,电信运营商可以使用交往圈信息实施定向营销,广告推荐,开辟用户群等。社交网络作为一种通用的概念广泛存在于各种学科研究之中,例如生物学、管理学等。而用户交往圈作为社交网络中的一部分相似用户的集合或社区,隶属于同一个交往圈的用户往往拥有相似的特征。用户交往圈代表社交网络中的一类拥有较强内部联系以及较弱对外联系的用户集合或社区。针对一个用户进行的研究和分析结果往往适用于交往圈中的其他用户。针对用户交往圈的科学研究是近年来最受关注的研究课题之一。在社交网络中,研究人员根据社交网络特性将具体的社交网络抽象成图模型。社交网络中的用户对应于图模型中的节点,社交网络中用户之间的社交关系对应于图模型中的边。进一步地,根据图模型中边的有向性,研究人员又进一步地将图模型分为有向图模型和有向图模型。在基于有向图模型的社交网络中,用户之间交互信息具有方向性。因此,在组成一条交互信息的两个用户之间的关系是不对称的。有向图模型常被研究人员用于模拟社交网络中的信息流传播。研究人员可根据有向社交图模型挖掘用户交往圈。与此相对地,在基于无向图模型的社交网络中,用户之间的交互信息不具有方向性。即在无向图模型中,组成一条边的两个点无起点和终点之分。因此,在无向图模型中,隶属于同一条交互记录的两个用户的社交关系是对等的。研究人员也可基于无向图模型挖掘用户交往圈。目前挖掘用户交往圈的现有研究成果主要如下:现有技术一提出一种基于模块化Modularity增益的社区划分方法。该方法首先将每个节点初始化为单一节点的社团,每个节点根据Modularity增益决定该节点是否与邻居节点所属的社团合并以及与哪个邻居节点所属的节点合并;然后重新构建网络,将上一步的每一个社团合并为一个节点,重复进行以上步骤直到网络结构不再发生变化。该方法对于每个节点,仅能将其划分到唯一的一个社区中,不能划分重叠的社区,导致挖掘出的交往圈的准确度较低。且该方法使用的Modularity增益的计算复杂度较高。现有技术二提出了一种以节点为中心的交往圈挖掘方法。在该文献中,依据交往圈内部成员之间关系以及交往圈结构,将交往圈分为:Cohesive和2-mode两种类别。针对这两种类别的交往圈,设计出了一种能够同时适用于这两种类别交往圈的交往圈划分方法。在该方法的每次迭代中,方法总是从权重最高的节点出发,依据Modularity增益逐渐扩展交往圈。直至社交圈中所有的节点都隶属于某个交往圈。该方法以节点作为方法设计的出发点,每次方法迭代均从用户节点出发,依据Modularity增益变化动态构建交往圈。该方法的主要缺点在于:方法着重考虑交往圈节点信息,而忽略了同样含有社交信息的边。因此,使用该方法划分出的交往圈与实际情况有较大的出入,也导致挖掘出的交往圈的准确度较低。现有技术三提出了一种同时使用社交网络中用户节点信息和边信息的方法。文献中所提出的方法从社交网络的网络结构和社交网络的节点信息两个层面设计方法。该文献中,方法使用传统交往圈挖掘方法利用网络结构进行交往圈挖掘,同时结合数据挖掘方法利用社交网络的节点信息对传统交往圈挖掘方法的结果进行修正。该方法只针对无向网络拓扑图进行设计,因此,该方法无法应用于基于有向社交网络的应用中。此外,在结合传统的基于边的交往圈挖掘方法与基于节点信息的数据挖掘方法时,该方法并没有考虑交往圈重叠用户信息。因此,该方法无法应用于挖掘可重叠的交往圈,应用范围有限。现有技术四提出了BigClam方法,该方法由斯坦福大学研究并提出,利用非负矩阵分解方法,用户能在网络拓扑图、用户交往圈之间自由切换。该方法非常适用于无向带权重拓扑图及可重叠圈子的划分。但是BigClam方法实现复杂,而且需要预先给定交往圈数量K,或者通过预处理去计算近似的K,这大大限制了方法的应用场景,在很多场景下,用户很难提前知道交往圈的数量,且通过实验分析,该方法在节点数量达到十万级别时存在性能瓶颈,限制了该方法在大规模以及超大规模社交网络中的应用。
技术实现思路
本专利技术的目的是提供一种电信网络用户的交往圈挖掘方法及系统,相比现有技术,其挖掘确定出的用户交往圈的准确度高。本专利技术进一步的目的是提供一种电信网络用户的交往圈挖掘方法及系统,相比现有技术,其能够应用于大规模或超大规模社交网络中,应用范围广。为了实现上述目的,本专利技术采用如下技术方案:本专利技术实施例提供一种电信网络用户的交往圈挖掘方法,包括如下步骤:S1、获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;S2、从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈;S3、查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算邻居用户节点集合内每个邻居用户节点对于所述交往圈的归属度;S4,判断归属度最大的邻居用户节点u的归属度是否大于预设值,如果是,则将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,返回S3;否则停止交往圈的扩张,执行S5;S5、将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若所述网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图重复上述步骤S2-S4的处理,直至网络拓扑图中剩余边为零,得到N个交往圈;其中N为自然数。本专利技术的有益效果是:本专利技术通过获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;然后从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈,之后查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算集合内每个邻居用户节点对于交往圈的归属度,选取归属度最大且大于预定值的邻居用户节点u,将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,当归属度最大的邻居用户节点的归属度不大于所述预定值时,停止交往圈的扩张;将停止扩张后的交往圈中...

【技术保护点】
一种电信网络用户的交往圈挖掘方法,其特征在于,包括以下步骤:S1、获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;S2、从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交往圈;S3、查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算邻居用户节点集合内每个邻居用户节点对于所述交往圈的归属度;S4,判断归属度最大的邻居用户节点u的归属度是否大于预设值,如果是,则将该邻居用户节点u加入到所述交往圈中,扩张所述交往圈,返回S3;否则停止交往圈的扩张,执行S5;S5、将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若所述网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图重复上述步骤S2-S4的处理,直至网络拓扑图中剩余边为零,得到N个交往圈;其中N为自然数。

【技术特征摘要】
1.一种电信网络用户的交往圈挖掘方法,其特征在于,包括以下步骤:
S1、获取用户在电信通话网络中的交互行为数据,根据所述交互行为数据生成用户联
系的网络拓扑图,所述网络拓扑图包含多个用户节点和相互连接的若干条边;
S2、从当前所述网络拓扑图中选取权重最高的边,将该边的两个用户节点归为一个交
往圈;
S3、查找构建所述交往圈内每个用户节点的邻居用户节点集合,计算邻居用户节点集
合内每个邻居用户节点对于所述交往圈的归属度;
S4,判断归属度最大的邻居用户节点u的归属度是否大于预设值,如果是,则将该邻居
用户节点u加入到所述交往圈中,扩张所述交往圈,返回S3;否则停止交往圈的扩张,执行
S5;
S5、将停止扩张后的交往圈中的用户节点之间的所有边从所述网络拓扑图中去除,若
所述网络拓扑图中剩余边的数量大于零,则对去除边后的新的网络拓扑图重复上述步骤
S2-S4的处理,直至网络拓扑图中剩余边为零,得到N个交往圈;其中N为自然数。
2.根据权利要求1所述电信网络用户的交往圈挖掘方法,其特征在于,所述步骤S1之后
还包括以下步骤:
S101、使用metis切割方法将所述网络拓扑图切割成若干个子图,然后并行地对每个子
图进行步骤S2-S5的处理。
3.根据权利要求1所述电信网络用户的交往圈挖掘方法,其特征在于,用户节点u对于
交往圈C的归属度B(u,C)定义为:
B ( u , C ) = Σ v ∈ C w u v k u ; ]]>其中,Nu为邻居用户节点集合,wuv表示用户节点u和v之间的边的
权重;
所述预定值为表示交往圈C内的所有割边权重之和与
交往圈C内用户节点间的所有的边的权重之和wc的比值;其中,cut(C,G\\C)表示交往圈C中
的所有割边的权重之和。
4.根据权利要求3所述电信网络用户的交往圈挖掘方法,其特征在于,步骤S5之后还包
括:
对所述N个交往圈中的每个交往圈分别获取每个交往圈内部每个用户节点对应的用户
的个人信息,根据每个用户的个人信息判断该交往圈内部成员之间的关系进而得到该交往
圈的类别,向用户推荐其所属的不同类别的交往圈。

【专利技术属性】
技术研发人员:李红吴迪王飞燕青林泓旭刘卉芳刘文杰王子锋柯毅豪柯东晓郑元欢万源沅邓火平
申请(专利权)人:中国联合网络通信有限公司广东省分公司中山大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1