一种基于动态标签传播在移动通讯网络中挖掘用户群体的方法技术

技术编号:22296364 阅读:31 留言:0更新日期:2019-10-15 05:21
本发明专利技术提出了一种基于动态标签传播在移动通讯网络中挖掘用户群体的方法,包括如下步骤:S1,利用了移动通讯网络的结构信息,整合边标签传播和点标签传播;S2,结合连边之间的权值系数,进行加权传播策略,设计加权的标签传播方案;S3,获取适应性标签最大化结构信息,进行移动通讯网络中用户群体的挖掘;S4,建立在边传播的基础上,使得实现边聚类的同时,获得相应节点的聚类信息,并隐含重叠属性;S5,初始化点社团,删除边社团种跨不同点社团的边,从而进行降噪处理,最终输出用户群体挖掘结构。

A Method of Mining User Groups in Mobile Communication Network Based on Dynamic Label Propagation

【技术实现步骤摘要】
一种基于动态标签传播在移动通讯网络中挖掘用户群体的方法
本专利技术涉及计算机数据挖掘领域,尤其涉及一种基于动态标签传播在移动通讯网络中挖掘用户群体的方法。
技术介绍
现实世界的很多系统都可以用复杂网络来描述,如在社交网络,通讯网络,电力网络,交通网络等等。移动通讯网络是一种以手机用户为节点,用户之间通话关系为连边构成的庞大社会网络。群体发现是社会网络研究的重要内容,有助于分析群体用户的行为模式和规律。对移动通讯网络拓扑结构的研究,可以发现人与人之间的社交关系,发现特定的客户群体,这对了解移动通讯网络的结构特征,针对不同的用户群体制定不同的服务方案,以及相关部门实现对舆情控制和异常群体的监控等,提供了可靠的技术支持。因此使用复杂网络方法研究移动通讯网络对提高服务水平,促进经济发展和社会安全与稳定具有重要的实用价值。标签传播算法(LPA)是复杂网络社团发现的一种著名的方法,近年来针对它的缺陷,已经出现了很多改进算法,但至今还没有可靠的改进能够得到广泛的认可。例如,李志等人(李志,单洪,马涛,黄郡,基于反向标签传播的移动终端用户群体发现[J],浙江大学学报,2018.)根据移动终端用户的位置信息推断社会关系拓扑图,在标签拓扑图上进行反向标签传播,实现基于位置属性的群体划分。刘美兰等人(MeilianLu,ZhenlinZhang,ZhiheQuetal.,LPANNI:OverlappingCommunityDetectionUsingLabelPropagationinLarge-ScaleComplexNetworks[J],IEEETransactionsonKnowledgeandDataEngineering,2018.)结合基于节点重要性升序的固定标签传播序列,相邻节点影响以及历史标签优先策略的标签更新策略检测到了重叠的社团结构。孔汉章等人(HanzhangKong,QinmaKang,ChaoLiuetal.,Animprovedlabelpropagationalgorithmbasedonnodeintimacyforcommunitydetectioninnetworks[J],InternationalJournalofModernPhysicsB,2018.)构建了节点之间的亲密度矩阵,进而计算节点重要性确定节点更新次序的方法实现了社团识别。QiongGui等人(QiongGuietal.,Acommunitydiscoveryalgorithmbasedonboundarynodesandlabelpropagation[J],PatternRecognitionLetters,2018.)首先鉴定复杂网络中的核节点,当然利用标签传播来寻找边界节点,最终实现社团的有效划分。Mohammad等人(MohammadSattari,KamranZamanifar,Aspreadingactivation-basedlabelpropagationalgorithmforoverlappingcommunitydetectionindynamicsocialnetworks,Data&KnowledgeEngineering,2018.)提出一种LPA算法的改进算法,此方法将每一个标签分配一个激活值,通过对激活值和标签同步传播实现社团挖掘的实现。近年来,随着机器学习研究与复杂网络研究的融合逐渐深入,涌现出一些基于半监督学习的标签传播方法。例如,BoWang等人(BoWang,ZhuowenTu,JohnK.Tsotsos,DynamicLabelPropagationforSemi-supervisedMulti-classMulti-labelClassification,TheIEEEInternationalConferenceonComputerVision,2013)提出一种半监督分类方案,它们在标签传播过程中进行转导学习,在算法中强调了动态度量与标签信息的融合,进而实现了分类操作。KuangZhou等人(KuangZhou,ArnaudMartin,QuanPan,ZhungaLiu,SELP:Semi-supervisedevidentiallabelpropagationalgorithmforgraphdataclustering,InternationalJournalofApproximateReasoning,2017.)提出一种基于凭证的标签策略的半监督聚类方法,能够有效利用有限的监控信息来指导检测过程,网络中的节点标签的先验信息包括标记和为标记的节点,在此基础上设计标签传播规则,实现网络聚类。DongLiu等人(DongLiu,Hong-YuBai,Hui-JiaLiandWen-JunWang,Semi-supervisedcommunitydetectionusinglabelpropagation,InternationalJournalofModernPhysicsB,2014.)基于标签传播算法提出一种半监督的社团检测方法,主要是利用先验信息来指导社团结构的发现过程。在上述基于标签的传播算法,不管是基于LPA的改进算法,还是半监督的传播算法,都存在着不同程度的缺陷。例如,会产生“巨型”社团,结果的不稳定性,随机性以及精确性不高等等,而在半监督方法一个重要的缺陷是需要具有一定的先验知识,上述问题导致了标签传播算法很难在实际的社会网络中得到应用。本专利技术重点解决了以上几个问题,提出了一种适用于大规模移动通讯网络的动态标签传播方法,可以准确识别大规模网络中的特定客户群体。在庞大、复杂的移动通讯网络中准确的识别有用的潜在用户群体,甚至一些异常行为群体,对社会的经济发展以及安全稳定都具有非常重要的意义。但现有的研究方法大都停留在理论探索阶段,能够应用到大规模社会网络中的有效算法不多。标签传播算法是一种近似线性的快速聚类方法,虽然目前已经发展了很多标签传播相关的方法,但仍有一些本质的缺陷没有解决,导致至今都难以应用到真实的社会网络中去。这些缺点主要包括以下几个方面:首先,标签的传播算法通常会产生“巨型社团”,现有的算法绝大部分都无法避免产生较大规模社团的问题,这是因为对于一些相对连接比较紧密的社团,还缺乏足够有效的手段将大型社团小型化。但是出现超过人们预期的超大规模“巨型社团”是难以被接受的一个事实。其次,多数标签传播算法鲁棒性很差,具有较强的随机性,这就导致预测结果的可信度不高。通常标签的传播始于一个随机选择的节点,并且当它的邻居有多个相同标签,则随机选择一个标签进行传播,这些因素都导致了这些算法的稳定性不高,无法形成鲁棒的、稳定可靠的社团划分,这是标签传播算法的一个致命弱点。另外,现有社会网络的标签传播算法,大多停留在理论层面,仅适用于一些小规模的、特殊构型的网络,然而如果将其推广到大规模,复杂构型的社会网络,特别是高度复杂的移动通讯网络,就很难发挥作用。特别是在真实的社会网络中,群体之间的重叠非常普遍,但主流的标签传播算法无法识别这种重叠。最后,目前的标签传播算法主要集中在节点标签的传播,包括结合一些节点的先验信息等,然而从网络结构拓扑的本文档来自技高网...

【技术保护点】
1.一种基于动态标签传播在移动通讯网络中挖掘用户群体的方法,其特征在于,包括如下步骤:S1,利用了移动通讯网络的结构信息,整合边标签传播和点标签传播;S2,结合连边之间的权值系数,进行加权传播策略,设计加权的标签传播方案;S3,获取适应性标签最大化结构信息,进行移动通讯网络中用户群体的挖掘;S4,建立在边传播的基础上,使得实现边聚类的同时,获得相应节点的聚类信息,并隐含重叠属性;S5,初始化点社团,删除边社团种跨不同点社团的边,从而进行降噪处理,最终输出用户群体挖掘结构。

【技术特征摘要】
1.一种基于动态标签传播在移动通讯网络中挖掘用户群体的方法,其特征在于,包括如下步骤:S1,利用了移动通讯网络的结构信息,整合边标签传播和点标签传播;S2,结合连边之间的权值系数,进行加权传播策略,设计加权的标签传播方案;S3,获取适应性标签最大化结构信息,进行移动通讯网络中用户群体的挖掘;S4,建立在边传播的基础上,使得实现边聚类的同时,获得相应节点的聚类信息,并隐含重叠属性;S5,初始化点社团,删除边社团种跨不同点社团的边,从而进行降噪处理,最终输出用户群体挖掘结构。2.根据权利要求1所述的基于动态标签传播在移动通讯网络中挖掘用户群体的方法,其特征在于,所述S1包括:S1-1,对网络数据进行标准化,构造一种无向,加权的移动通讯网络结构,包含连边信息和边的权值,存储为标准的文本格式;S1-2,为了消除标签的随机性,这里根据边的隶属关系进行初始化标签,具体方法是,在t=0时刻,根据网络节点的所在边的隶属关系进行标记。3.根据权利要求1所述的基于动态标签传播在移动通讯网络中挖掘用户群体的方法,其特征在于,所述S2包括:S2-1,针对每一个节点所对应的多个边,统一按照特定的规则进行标准化处理;S2-2,假设在任意t时刻我们已经更新了所有的边和节点的标签,那么在t+1时刻,根据加权传播策略更新所有边和节点的标签,执行标签的传播算法,直到没有任何标签发生变化为止。4.根据权利要求1所述的基于动态标签传播在移动通讯网...

【专利技术属性】
技术研发人员:叶鹏罗皓
申请(专利权)人:上海诚数信息科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1