一种基于最大似然的通信网用户呼叫行为预测方法及装置制造方法及图纸

技术编号:21843151 阅读:153 留言:0更新日期:2019-08-13 22:28
本发明专利技术涉及网络用户行为分析领域,尤其涉及一种基于最大似然的通信网用户呼叫行为预测方法及装置。一种基于最大似然的通信网用户呼叫行为预测方法,包括:分时段统计主叫号码的CDR数据,所述CDR数据包括通话频次和通话时长,并记录每个时段最大通话频次和最大通话时长;根据各时段主叫号码的通话频次及通话时长,构建该时段的通话频次‑概率密度分布曲线及通话时长‑概率密度分布曲线;根据通话频次‑概率密度分布曲线及通话时长‑概率密度分布曲线,预测主叫号码各时段的通话频次及通话时长。一种基于最大似然的通信网用户呼叫行为预测装置,包括:统计模块;构建模块;预测模块。本发明专利技术可以对用户呼叫行为进行预测。

A Maximum Likelihood Based Call Behavior Prediction Method and Device for Communication Network Users

【技术实现步骤摘要】
一种基于最大似然的通信网用户呼叫行为预测方法及装置
本专利技术涉及网络用户行为分析领域,尤其涉及一种基于最大似然的通信网用户呼叫行为预测方法及装置。
技术介绍
随着移动互联网时代的到来以及移动智能设备的普及,传统的电信业务模式与用户能够获得的服务内容发生了显著变化。一方面,通信运营商可以给用户提供更为丰富的服务内容,各种新业务不断涌现;另一方面,用户可以根据自己的个人需求和喜好选择不同的服务内容与模式。电信运营商多元化的服务与用户数据的迅速增长产生了海量的用户数据。这些海量数据中包含着丰富的用户行为信息,蕴含有巨大的价值。针对电信网用户呼叫行为的预测方法,对于通信管理部门准确把握用户行为动态以及运营商的个性化业务推荐具有重要的实用价值。
技术实现思路
本专利技术的目的在于提供一种基于最大似然的通信网用户呼叫行为预测方法及装置,预测用户的呼叫行为。为了实现上述目的,本专利技术采用以下技术方案:一种基于最大似然的通信网用户呼叫行为预测方法,包括以下步骤:步骤1:分时段统计主叫号码的CDR数据,所述CDR数据包括通话频次和通话时长,并记录每个时段最大通话频次和最大通话时长;步骤2:根据各时段主叫号码的通话频次及通话时长,构建该时段的通话频次-概率密度分布曲线及通话时长-概率密度分布曲线;步骤3:根据通话频次-概率密度分布曲线及通话时长-概率密度分布曲线,预测主叫号码各时段的通话频次及通话时长。优选地,在所述步骤1之前还包括:设定预测时间间隔为T,将一天划分为24/T个时段。优选地,所述步骤2包括:步骤2.1:计算各时段的平均通话频次;步骤2.2:构建通话频次-概率密度分布曲线:其中,i为时段,且i=1,2,...,24/T,x为时段i的通话频次,λ为时段i的平均通话频次;步骤2.3:计算各时段的平均通话时长;步骤2.4:构建通话时长-概率密度分布曲线:其中,i为时段,且i=1,2,...,24/T,x为时段i的通话时长,λ为时段i的平均通话时长,x和λ的单位为分钟。优选地,所述步骤2.2中的λ,对于λ>8,平均通话频次过大,平均通话频次趋于稳定值λ;所述步骤2.4中的λ,对于λ>120,平均通话时长过大,平均通话时长趋于稳定值λ。优选地,所述步骤3包括:步骤3.1:分别把各时段的通话频次-概率密度分布曲线进行离散化处理;步骤3.2:使用累积法将各时段各个通话频次的概率逐项累积,生成该通话频次范围内的(0,1)上的均匀分布随机浮点数,根据浮点数所属的区间范围确定通话频次的预测值;步骤3.3:按照步骤3.1及步骤3.2的方法对通话时长进行预测。优选地,在所述步骤3之后还包括:排序输出未来24小时各时段的通话频次和通话时长预测值及其对应的发生概率。一种基于最大似然的通信网用户呼叫行为预测装置,包括:统计模块,用于分时段统计主叫号码的CDR数据,所述CDR数据包括通话频次和通话时长,并记录每个时段最大通话频次和最大通话时长;构建模块,用于根据各时段主叫号码的通话频次及通话时长,构建该时段的通话频次-概率密度分布曲线及通话时长-概率密度分布曲线;预测模块,用于根据通话频次-概率密度分布曲线及通话时长-概率密度分布曲线,预测主叫号码各时段的通话频次及通话时长。优选地,还包括:设定模块,用于设定预测时间间隔为T,将一天划分为24/T个时段。优选地,还包括:输出模块,用于排序输出未来24小时各时段的通话频次和通话时长预测值及其对应的发生概率。优选地,所述构建模块包括:第一计算模块,用于计算各时段的平均通话频次;第一构建模块,用于构建通话频次-概率密度分布曲线:其中,i为时段,且i=1,2,...,24/T,x为时段i的通话频次,λ为时段i的平均通话频次;第二计算模块,用于计算各时段的平均通话时长;第二构建模块,用于构建通话时长-概率密度分布曲线:其中,i为时段,且i=1,2,...,24/T,x为时段i的通话时长,λ为时段i的平均通话时长,x和λ的单位为分钟。优选地,所述预测模块包括:离散化处理模块,用于分别把各时段的通话频次-概率密度分布曲线进行离散化处理;第一预测子模块,用于使用累积法将各时段各个通话频次的概率逐项累积,生成该通话频次范围内的(0,1)上的均匀分布随机浮点数,根据浮点数所属的区间范围确定通话频次的预测值;第二预测子模块,用于按照步骤3.1及步骤3.2的方法对通话时长进行预测。与现有技术相比,本专利技术具有的有益效果:本专利技术基于用户历史呼叫行为所产生的海量CDR数据展开分析,结合网络用户呼叫行为的长期稳定性与短期随机性的特点。提出一种基于最大似然的通信网用户呼叫行为预测方法及装置。本专利技术基于海量用户的呼叫数据,可以对行为预测的时间尺度进行灵活设置,统计得到用户行为,包括呼叫频次、呼叫时长的数据分布,从而据此实现对用户呼叫行为的预测,具有过程简单易于实现、预测尺度灵活、可自定义的优点。附图说明图1为本专利技术一种基于最大似然的通信网用户呼叫行为预测方法的基本流程示意图之一。图2为本专利技术一种基于最大似然的通信网用户呼叫行为预测方法的基本流程示意图之二。图3为本专利技术一种基于最大似然的通信网用户呼叫行为预测方法的使用累积法产生预测值流程示意图。图4为本专利技术一种基于最大似然的通信网用户呼叫行为预测装置的结构示意图之一。图5为本专利技术一种基于最大似然的通信网用户呼叫行为预测装置的结构示意图之二。具体实施方式下面结合附图和具体的实施例对本专利技术做进一步的解释说明:实施例一:如图1所示,本专利技术的一种基于最大似然的通信网用户呼叫行为预测方法,包括以下步骤:步骤S11:分时段统计主叫号码的CDR数据,所述CDR数据包括通话频次和通话时长,并记录每个时段最大通话频次和最大通话时长。步骤S12:根据各时段主叫号码的通话频次及通话时长,构建该时段的通话频次-概率密度分布曲线及通话时长-概率密度分布曲线。步骤S13:根据通话频次-概率密度分布曲线及通话时长-概率密度分布曲线,预测主叫号码各时段的通话频次及通话时长。实施例二:如图2所示,本专利技术的另一种基于最大似然的通信网用户呼叫行为预测方法,包括以下步骤:步骤S21:设定预测时间间隔为T,将一天划分为24/T个时段;作为一种可实施方式,T取值为1小时。步骤S22:分时段统计主叫号码的CDR数据,CDR数据如表1所示,所述CDR数据包括通话频次和通话时长,并记录每个时段最大通话频次和最大通话时长。表1CDR数据表字段名称类型说明实例Ncallernmstring主叫号码1593905XXXXVcallernmstring被叫号码1383846XXXXCallstarttimetimestamp呼叫开始时间2016-07-0108:03:00Callendtimetimestamp呼叫结束时间2016-07-0108:08:57Talkstarttimetimestamp通话开始时间2016-07-0108:03:06Talkendtimetimestamp通话结束时间2016-07-0108:08:55TalklengthInt通话时长349failreasonint通话失败原因0(通话成功)表1为一路会话的话单,在一天里一个主叫号码会产生多个上述话单。其中,1593905XXXX为主叫本文档来自技高网...

【技术保护点】
1.一种基于最大似然的通信网用户呼叫行为预测方法,其特征在于,包括以下步骤:步骤1:分时段统计主叫号码的CDR数据,所述CDR数据包括通话频次和通话时长,并记录每个时段最大通话频次和最大通话时长;步骤2:根据各时段主叫号码的通话频次及通话时长,构建该时段的通话频次‑概率密度分布曲线及通话时长‑概率密度分布曲线;步骤3:根据通话频次‑概率密度分布曲线及通话时长‑概率密度分布曲线,预测主叫号码各时段的通话频次及通话时长。

【技术特征摘要】
1.一种基于最大似然的通信网用户呼叫行为预测方法,其特征在于,包括以下步骤:步骤1:分时段统计主叫号码的CDR数据,所述CDR数据包括通话频次和通话时长,并记录每个时段最大通话频次和最大通话时长;步骤2:根据各时段主叫号码的通话频次及通话时长,构建该时段的通话频次-概率密度分布曲线及通话时长-概率密度分布曲线;步骤3:根据通话频次-概率密度分布曲线及通话时长-概率密度分布曲线,预测主叫号码各时段的通话频次及通话时长。2.根据权利要求1所述的一种基于最大似然的通信网用户呼叫行为预测方法,其特征在于,在所述步骤1之前还包括:设定预测时间间隔为T,将一天划分为24/T个时段。3.根据权利要求1所述的一种基于最大似然的通信网用户呼叫行为预测方法,其特征在于,所述步骤2包括:步骤2.1:计算各时段的平均通话频次;步骤2.2:构建通话频次-概率密度分布曲线:其中,i为时段,且i=1,2,...,24/T,x为时段i的通话频次,λ为时段i的平均通话频次;步骤2.3:计算各时段的平均通话时长;步骤2.4:构建通话时长-概率密度分布曲线:其中,i为时段,且i=1,2,...,24/T,x为时段i的通话时长,λ为时段i的平均通话时长,x和λ的单位为分钟。4.根据权利要求3所述的一种基于最大似然的通信网用户呼叫行为预测方法,其特征在于,所述步骤2.2中的λ,对于λ>8,平均通话频次过大,平均通话频次趋于稳定值λ;所述步骤2.4中的λ,对于λ>120,平均通话时长过大,平均通话时长趋于稳定值λ。5.根据权利要求1所述的一种基于最大似然的通信网用户呼叫行为预测方法,其特征在于,所述步骤3包括:步骤3.1:分别把各时段的通话频次-概率密度分布曲线进行离散化处理;步骤3.2:使用累积法将各时段各个通话频次的概率逐项累积,生成该通话频次范围内的(0,1)上的均匀分布随机浮点数,根据浮点数所属的区间范围确定通话频次的预测值;步骤3.3:按照步骤3.1及步骤3.2的方法对通话时长进行预测。6.根据权利要求1所述的一种基于最大似然的通信网用户呼叫行为预测方法,其特征在于,...

【专利技术属性】
技术研发人员:李英乐程晓涛黄瑞阳于洪涛刘树新张建国李锦玲
申请(专利权)人:中国人民解放军信息工程大学
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1