一种电信用户离网预测方法、系统、介质及设备技术方案

技术编号:25399245 阅读:29 留言:0更新日期:2020-08-25 23:04
本发明专利技术涉及一种电信用户离网预测方法、系统、介质及设备。方法包括:读取数据样本,将所述样本数据分割为训练集和测试集;选取Cox比例风险回归模型为预测模型,利用所述训练集中的训练数据估计Cox比例风险回归模型中的变量系数和训练数据的基准生存率,完成对所述Cox比例风险回归模型的模型训练;利用训练完成的所述Cox比例风险回归模型对所述测试集中的测试数据进行电信用户离网预测。本发明专利技术实施例提供的电信用户离网预测方法,相对于现有技术中的分类模型具有更高的精准率和召回率,同时可以预测未来一段时间内用户离网的概率,以便能提前发现,提前介入,提前挽留。

【技术实现步骤摘要】
一种电信用户离网预测方法、系统、介质及设备
本专利技术涉及概率预测
,尤其涉及一种电信用户离网预测方法、系统、介质及设备。
技术介绍
目前,离网概率的分析主要是通过分类模型进行分析,主要有两种,一种是基于传统机器学习算法的分类模型,如逻辑回归(LR)、支持向量机(SVM)、决策树(C4.5)、朴素贝叶斯等。另一种为基于集成学习算法的分类模型和多算法模型融合等方案,如GBDT、XGBOOST、LIGHTGBM等集成学习算法,或对几种算法进行融合使用,分为底层模型和上层模型,以达到对数据的拟合,训练出效果更好的模型。但无论上述哪种方案,本质上都是将客户是否流失简单的归类为二分类问题,建模时也仅是使用用户“在网”或“离网”状态作为因变量,既无法利用生存时间长度,也无法处理资料中的删失问题。分类模型只能预测用户当前时间的离网概率,而无法预测当前时间之后一段时间内用户的离网概率。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术存在的问题,提供一种电信用户离网预测方法、系统、介质及设备。>为解决上述技术问题本文档来自技高网...

【技术保护点】
1.一种电信用户离网预测方法,其特征在于,包括:/n读取数据样本,将所述样本数据分割为训练集和测试集;/n选取Cox比例风险回归模型为预测模型,利用所述训练集中的训练数据估计Cox比例风险回归模型中的变量系数和训练数据的基准生存率,完成对所述Cox比例风险回归模型的模型训练;/n利用训练完成的所述Cox比例风险回归模型对所述测试集中的测试数据进行电信用户离网预测。/n

【技术特征摘要】
1.一种电信用户离网预测方法,其特征在于,包括:
读取数据样本,将所述样本数据分割为训练集和测试集;
选取Cox比例风险回归模型为预测模型,利用所述训练集中的训练数据估计Cox比例风险回归模型中的变量系数和训练数据的基准生存率,完成对所述Cox比例风险回归模型的模型训练;
利用训练完成的所述Cox比例风险回归模型对所述测试集中的测试数据进行电信用户离网预测。


2.根据权利要求1所述的方法,其特征在于,将所述样本数据分割为训练集和测试集之前,对所述样本数据进行数据预处理。


3.根据权利要求1所述的方法,其特征在于,所述利用所述训练集中的训练数据估计Cox比例风险回归模型中的变量系数和基准生存率,包括:
利用statsmodels中的phreg函数对所述训练集中训练数据进行变量系数估计,利用非参数法或Breslow法对所述训练集中训练数据进行基准生存率估计。


4.根据权利要求1至3任一项所述的方法,其特征在于,所述利用训练完成的所述Cox比例风险回归模型对所述测试集中的测试数据进行电信用户离网预测之前,还包括向所述Cox比例风险回归模型输入训练数据和测试时间,通过getEvaluation函数统计得到训练集的流失比例,将所述流失比例作为评估阈值。


5.根据权利要求4所述的方法,其特征在于,所述利用训练完成的所述Cox比例风险回归模型对所述测试集中的测试数据进行电信用户离网预测,包括:
利用训练完成的所述Cox比例风险回归模型对所述测试集中的测试数据进行测试,得到测试数据对应的电信用户的生存率;
将所述电信用户的生存率与所述评估阈值进行比较,若所述生存率小于所述评估阈值,则预测结果为所述电信用户的生存状态为流失,否则为存活。


6.根据权利要求5所述的方法,其特征在于,所述利用训练...

【专利技术属性】
技术研发人员:孙亮
申请(专利权)人:北京思特奇信息技术股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1