A relationship between relatives and friends call based on recognition method includes: extracting billing data, calculation of index calls between every two users, and to judge whether there is relationship between the frequent call every two users; there will be frequent calls between K users to form an K user set between them, and then the number of K items based on user sets, and generate a number of k+1 users set by clustering algorithm: judging every two K users on the presence of k the same 1 users, and the only difference exists between users frequently call, if it is, then all will not repeat the user of the two item K users constitute a k+1 user set between all users the k+1 user is focused on the relationship between relatives and friends. The invention belongs to the technical field of network communication, communication between users based on the index, dig out from among the frequent communication users composed of relatives and friends from the mass of users, so as to achieve the personalized marketing.
【技术实现步骤摘要】
一种基于通话的亲友圈关系识别方法
本专利技术涉及一种基于通话的亲友圈关系识别方法,属于网络通信
技术介绍
亲友圈是一个相互之间保持着频繁联系的用户集团,亲友圈内用户之间的联系具有以下特点:较多的通话次数、较长的通话时长等等,通过挖掘相互之间频繁通信的亲友圈,可以有助于挖掘潜在的用户集团,从而实现个性化营销。目前,各网络运营商也相继推出了“亲友圈”相关业务,例如通过用户主动签约“亲情号码”业务来发现亲友圈,这种亲友圈是易于理解和易于发现的,但现网中更多用户并未签约有相关业务,因此识别出这些隐藏于现网海量数据下的、难以直观识别的亲友圈,是一件极其复杂的工作。如何利用用户之间的通话次数、通话时间等通信指标,从海量用户之间挖掘出由相互之间频繁联系的用户所组成的亲友圈,从而实现个性化营销,是当前技术人员急需解决的技术问题,目前还未发现有效的技术解决方案。
技术实现思路
有鉴于此,本专利技术的目的是提供一种基于通话的亲友圈关系识别方法,能基于用户之间的通信指标,从海量用户之间挖掘出由相互之间频繁通信的用户所组成的亲友圈,从而实现个性化营销。为了达到上述目的,本专利技术提供了一种基于通话的亲友圈关系识别方法,包括有:步骤一、提取话单数据,计算每两个用户之间的通话指标,并据此判断每两个用户之间是否存在频繁通话关系;步骤二、将相互之间存在频繁通话关系的k个用户构成一个k项用户集,然后基于多个k项用户集,并采用聚类算法生成若干个k+1项用户集:判断每两个k项用户集中是否存在k‐1个相同用户、且唯一不同的用户之间存在频繁通话关系,如果是,则将所述两个k项用户集中的所有不重 ...
【技术保护点】
一种基于通话的亲友圈关系识别方法,其特征在于,包括有:步骤一、提取话单数据,计算每两个用户之间的通话指标,并据此判断每两个用户之间是否存在频繁通话关系;步骤二、将相互之间存在频繁通话关系的k个用户构成一个k项用户集,然后基于多个k项用户集,并采用聚类算法生成若干个k+1项用户集:判断每两个k项用户集中是否存在k‑1个相同用户、且唯一不同的用户之间存在频繁通话关系,如果是,则将所述两个k项用户集中的所有不重复的用户构成一个k+1项用户集,所述k+1项用户集中的所有用户之间是亲友圈关系。
【技术特征摘要】
1.一种基于通话的亲友圈关系识别方法,其特征在于,包括有:步骤一、提取话单数据,计算每两个用户之间的通话指标,并据此判断每两个用户之间是否存在频繁通话关系;步骤二、将相互之间存在频繁通话关系的k个用户构成一个k项用户集,然后基于多个k项用户集,并采用聚类算法生成若干个k+1项用户集:判断每两个k项用户集中是否存在k-1个相同用户、且唯一不同的用户之间存在频繁通话关系,如果是,则将所述两个k项用户集中的所有不重复的用户构成一个k+1项用户集,所述k+1项用户集中的所有用户之间是亲友圈关系。2.根据权利要求1所述的方法,其特征在于,步骤一中,两个用户之间的通话指标包括但不限于:通话次数、通话时长、闲时通话次数占比、闲时通话时长占比,其中,闲时通话次数占比是闲时通话次数和通话次数的比值,闲时通话时长占比是闲时通话时长和通话时长的比值。3.根据权利要求1所述的方法,其特征在于,步骤一中,判断每两个用户之间是否存在频繁通话关系,进一步包括有:步骤A1、判断两个用户之间的通话指标值是否都大于通话指标阈值,如果是,则两个用户之间存在频繁通话关系;如果否,则两个用户之间不存在频繁通话关系。4.根据权利要求3所述的方法,其特征在于,步骤A1之前还包括有:从话单数据中提取所有签约有亲情号码业务的用户的通话记录,并统计所有签约有亲情号码业务的用户相互之间的通话指标的平均值,然后计算每种通话指标所对应的通话指标阈值:其中,Qi是第i种通话指标阈值,是所有签约有亲情号码业务的用户相互之间的第i种通话指标的平均值,ai是第i种通话指标的阈值设定比值,其值根据实际业务需要而设定。5.根据权利要求1所述的方法,其特征在于,步骤一中,判断每两个用户之间是否存在频繁通话关系,进一步包括有:步骤B1、从话单数据中提取一定数量的签约有亲情号码业务的用户的通话记录、以及相同数量已确认的非亲情用户的通话记录,然后统计签约有亲情号码业务的用户相互之间的通话指标、以及已确认的非亲情用户相互之间的通话指标;步骤B2、以所提取的签约有亲情号码业务的用户、以...
【专利技术属性】
技术研发人员:廖建新,刘同存,郑瑶琳,王玉龙,王晶,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。