当前位置: 首页 > 专利查询>中南大学专利>正文

基于用户画像的互联网卡用户流失预测方法及系统技术方案

技术编号:32022540 阅读:39 留言:0更新日期:2022-01-22 18:44
本发明专利技术公开了基于用户画像的互联网卡用户流失预测方法及系统,通过分析互联网卡用户与流失相关的身份特性以及行为特性,确定互联网卡用户的关键画像数据维度以及关键时序行为数据维度;关键画像数据维度包括表征互联网卡用户行为的不确定性和活跃度的活跃熵,关键时序行为数据维度包括表征互联网卡用户的异常行为的行为异常天数;从历史数据中获取不同用户对应维度的关键画像数据以及不同时期的关键时序行为数据构建训练数据集,并使用训练数据集训练构建的深度学习模型,再使用训练好的深度学习模型预测用户流失。本发明专利技术在选取训练数据的特征维度时,新增用户的活跃熵和行为异常天数来反映不同用户的流失行为规律,使得训练得到深度学习模型预测精度更高。训练得到深度学习模型预测精度更高。训练得到深度学习模型预测精度更高。

【技术实现步骤摘要】
基于用户画像的互联网卡用户流失预测方法及系统


[0001]本专利技术涉及用户流失预测
,尤其涉及基于用户画像的互联网卡用户流失预测方法及系统。

技术介绍

[0002]随着现代信息技术和通信技术的快速发展,移动通信领域用户以较低的价格就可以享受到优质的服务。市场竞争日趋激烈,需求逐步饱和,原有用户的流失也日益严重。其中,用户流失是指用户终止与企业的服务合同或转向使用其他公司提供的服务。Garter公司的调查数据显示,开发一个新用户的费用是维持一个老用户成本的4~5倍。另有研究表明,一个公司如果将用户流失率降低5%,就能增加25%~ 85%的利润。目前,我国移动通信行业已经进入用户饱和阶段,发展一个新用户的成本越来越高,因此控制用户流失是关系各大通信运营商未来生存和发展的一个关键问题。而通过用户流失预测来保留现有用户成为很多移动通信公司发展的首要目标。用户流失预测作为客户关系管理(CRM)方法的一部分,能够有效帮助公司减少客户的流失,对公司增加营收和提高竞争力有重要意义。
[0003]由于近些年来深度学习的快速发展,基于深度学习模型的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于用户画像的互联网卡用户流失预测方法,其特征在于,包括以下步骤:分析互联网卡用户与流失相关的身份特性以及行为特性,确定互联网卡用户的关键画像数据维度以及关键时序行为数据维度;其中,所述关键画像数据维度包括表征互联网卡用户行为的不确定性和活跃度的活跃熵,所述关键时序行为数据维度包括表征互联网卡用户的异常行为的行为异常天数;从历史数据中获取不同用户对应维度的关键画像数据以及不同时期的关键时序行为数据构建训练数据集,并对所述训练数据集中的训练数据对应的用户流失类别进行标注;构建深度学习模型,并使用训练数据集中标注好的训练数据训练所述深度学习模型,得到训练好的深度学习模型;获取待预测用户对应维度的关键画像数据以及关键时序行为数据,将待预测用户对应维度的关键画像数据以及关键时序行为数据输入至训练好的深度学习模型中,得到待预测用户的流失类别。2.根据权利要求1所述的基于用户画像的互联网卡用户流失预测方法,其特征在于,所述关键画像数据维度包括:性别、年龄、移动终端机型、移动终端价格、移动终端使用时长、余额、套餐ID、套餐档次、第二卡槽归属运营商、在网月份、近3个月单停次数、近3个月双停次数、基于月上行流量的活跃熵、基于月下行流量的活跃熵、基于月上网时间的活跃熵以及基于月上网记录条数的活跃熵;所述关键时序行为数据维度包括:日下行流量和、日上行流量和、日上网时间和、日上网记录条数和、每日是否流量异常、日主叫通话次数、日主叫通话时长、日主叫号码个数、日被叫通话次数、日被叫通话时长、日被叫号码个数以及日通话所连基站数。3.根据权利要求2所述的基于用户画像的互联网卡用户流失预测方法,其特征在于,所述基于月上行流量的活跃熵、基于月下行流量的活跃熵、基于月上网时间的活跃熵以及基于月上网记录条数的活跃熵的获取,通过以下步骤实现:对于月上行流量、月下行流量、月上网时间以及月上网记录条数中任一维度的数据,均执行以下步骤:将所述维度的数据转换成时序行为序列=[,,

,,

,],其中,d表示当月的天数,表示第i天用户关于所述维度数据的统计值;将所述维度数据的时序行为序列分成k个等宽的桶,并根据以下公式计算出所述维度数据的活跃熵:其中,表示所述维度数据的时序行为序列的取值落在第i个桶的比例, k表示桶的个数,表示所述维度数据的时序行为序列的长度,为指示函数,当时=1,否则=0。4.根据权利要求2所述的基于用户画像的互联网卡用户流失预测方法,其特征在于,每日是否流量异常的判断,通过以下步骤实现:
对于月上行流量、月下行流量、月上网时间以及月上网记录条数中任一维度的数据,均执行以下步骤:将所述维度的数据转换成时序行为序列=[,,

,,

,],其中,n表示当月的天数,表示第i天用户关于所述维度数据的统计值;计算所述时序行为序列的一阶前向差分序列=[,,

,,

,],其中,,表示所述一阶前向差分序列第i个差分值;对于所述一阶前向差分序列中的任意个差分值,判断所述是否大于+1.5IQR或小于

1.5IQR,若所述大于+1.5IQR或小于

1.5IQR,则判断对应的天数存在流量异常,其中,为所述一阶前向差分序列的上四分位数,为所述一阶前向差分序列下四分位数,IQR是四分位间距,为与之差。5.根据权利要求2所述的基于用户画像的互联网卡用户流失预测方法,其特征在于,所述深度学习模型为基于多头自注意力机制的深度学习模型,包括特征提取层、嵌入层、注意力层、预分类层以及分类器,所述嵌入层、注意力层、预分类层以及分类器依次连接,所述分类器还与特征提取层连接;所述特征提取层用于从输入的关键画像数据中提取降维的用户画像关键特征矩阵,并将所述关键特征矩阵输出给分类器;所述嵌入层用于将输入的关键时序行为数据及其对应的类别标记转化包含块嵌入向量、类别嵌入向量以及位置嵌入向量的嵌入特征块,并将所述嵌入特征块输出...

【专利技术属性】
技术研发人员:吕丰钱凯吴帆任炬张尧学
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1