System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,特别涉及一种客户流失率的预测方法、系统、存储介质和电子设备。
技术介绍
1、当前,为提升客户的产品客户流失率,会对即将到期的客户进行人工干预,客户经理通过帮助客户解决产品使用问题、引导客户使用更多高价值模块、让客户享用更多权益等方式,增强客户的使用满意度和忠诚度,以达到最终续费的目的。
2、然而,在实际业务中,因一线人力资源有限,难以对所有客户都进行人工干预。且当前业务方通过简单业务规则对客户进行筛选,但筛选过程可靠性差,准确度低。
3、相关技术中,在预测客户的续费概率时,需要框定时间节点这样才能有效地构建样本,例如:5个月后该客户是否会续费,但是,在实际的业务中,可能需要在任意一个时间点观察客户的续费概率,如此无法绕过时间限制,预测准确率较低。
技术实现思路
1、本申请的目的是提供一种客户流失率的预测方法、系统、存储介质和电子设备,能够在任意时间点执行财税产品的客户流失预测。
2、为解决上述技术问题,本申请提供一种客户流失率的预测方法,具体技术方案如下:
3、获取距离财税产品到期前不同时间段的用户的特征数据;
4、以设定时间点为基准,将所述用户随机分为若干用户组;每个所述用户组的特征数据构建一个对应的特征数据集;
5、确定所述特征数据集中的训练集、验证集和测试集,训练一阶段的catboost模型;
6、利用贝叶斯优化方法获取所述一阶段的catboost模型的超级参数,筛选出最佳特
7、将所述财税产品的近期特征数据输入至所述一阶段的catboost模型,利用时间序列预测模型根据历史流失概率均值数据进行训练,得到未来流失概率均值的预测值;
8、根据所述超级参数、最佳特征集和所述未来流失概率均值的预测值,训练得到二阶段的catboost模型;
9、利用所述二阶段的catboost模型预测所述财税产品的客户流失率。
10、可选的,所述获取距离财税产品到期前不同时间段的用户的特征数据包括:
11、获取距离所述财税产品到期前不同月份的用户的特征数据。
12、可选的,以设定时间点为基准,将所述用户随机分为若干用户组包括:
13、设定基准月份,并根据所述基准月份确定用户组;
14、将所述用户随机分配至各用户组;每个用户应用对应用户组所在月份的特征数据,且每个所述用户在所有用户组仅出现一次。
15、可选的,获取财税产品到期前不同时长的特征数据之后,还包括:
16、剔除所述特征数据中的异常数据;所述异常数据包括业务意义重复数据、高缺失数据和分布失衡数据。
17、可选的,所述筛选出最佳特征集包括:
18、计算各所述特征集的边际贡献的均值;
19、取所述均值最高的特征数据集作为最佳特征集。
20、可选的,根据所述超级参数、最佳特征集和所述未来流失概率均值的预测值,训练得到二阶段的catboost模型时,还包括:
21、调整所述近期数据的样本权重,以减少与未来流失概率均值的预测值的误差为训练目标。
22、可选的,所述特征数据包括企业属性信息和企业行为特征信息。
23、本申请还提供一种客户流失率的预测系统,包括:
24、特征获取模块,用于获取距离财税产品到期前不同时间段的用户的特征数据;
25、用户分组模块,用于以设定时间点为基准,将所述用户随机分为若干用户组;每个所述用户组的特征数据构建一个对应的特征数据集;
26、模型构建模块,用于确定所述特征数据集中的训练集、验证集和测试集,训练一阶段的catboost模型;
27、参数筛选模块,用于利用贝叶斯优化方法获取所述一阶段的catboost模型的超级参数,筛选出最佳特征集;其中,所述超级参数为影响所述一阶段的catboost模型的可变参数;
28、初始数据预测模块,用于将所述财税产品的近期特征数据输入至所述一阶段的catboost模型,利用时间序列预测模型根据历史流失概率均值数据进行训练,得到未来流失概率均值的预测值;
29、模型调优模块,用于根据所述超级参数、最佳特征集和所述未来流失概率均值的预测值,训练得到二阶段的catboost模型;
30、客户流失预测模块,用于利用所述二阶段的catboost模型预测所述财税产品的客户流失率。
31、可选的,所述特征获取模块为用于获取距离所述财税产品到期前不同月份的用户的特征数据的模块。
32、可选的,用户分组模块包括:
33、基准点设置单元,用于设定基准月份,并根据所述基准月份确定用户组;
34、随机分配单元,用于将所述用户随机分配至各用户组;每个用户应用对应用户组所在月份的特征数据,且每个所述用户在所有用户组仅出现一次。
35、可选的,还包括:
36、特征选择模块,用于剔除所述特征数据中的异常数据;所述异常数据包括业务意义重复数据、高缺失数据和分布失衡数据。
37、可选的,参数筛选模块包括:
38、特征集筛选单元,用于计算各所述特征集的边际贡献的均值;取所述均值最高的特征数据集作为最佳特征集。
39、可选的,还包括:
40、调优模块,用于调整所述近期数据的样本权重,以减少与未来流失概率均值的预测值的误差为训练目标。
41、本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法的步骤。
42、本申请还提供一种电子设备,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如上所述的方法的步骤。
43、本申请提供一种客户流失率的预测方法,包括:获取距离财税产品到期前不同时间段的用户的特征数据;以设定时间点为基准,将所述用户随机分为若干用户组;每个所述用户组的特征数据构建一个对应的特征数据集;确定所述特征数据集中的训练集、验证集和测试集,训练一阶段的catboost模型;利用贝叶斯优化方法获取所述一阶段的catboost模型的超级参数,筛选出最佳特征集;其中,所述超级参数为影响所述一阶段的catboost模型的可变参数;将所述财税产品的近期特征数据输入至所述一阶段的catboost模型,利用时间序列预测模型根据历史流失概率均值数据进行训练,得到未来流失概率均值的预测值;根据所述超级参数、最佳特征集和所述未来流失概率均值的预测值,训练得到二阶段的catboost模型;利用所述二阶段的catboost模型预测所述财税产品的客户流失率。
44、本申请在获取距离财税产品到期前不同时间段的用户的特征数据后,将用户随机分为若干用户组,使得不同时间段的用本文档来自技高网...
【技术保护点】
1.一种客户流失率的预测方法,其特征在于,包括:
2.根据权利要求1所述的预测方法,其特征在于,所述获取距离财税产品到期前不同时间段的用户的特征数据包括:
3.根据权利要求2所述的预测方法,其特征在于,以设定时间点为基准,将所述用户随机分为若干用户组包括:
4.根据权利要求1所述的预测方法,其特征在于,获取财税产品到期前不同时长的特征数据之后,还包括:
5.根据权利要求1所述的预测方法,其特征在于,所述筛选出最佳特征集包括:
6.根据权利要求1所述的预测方法,其特征在于,根据所述超级参数、最佳特征集和所述未来流失概率均值的预测值,训练得到二阶段的Catboost模型时,还包括:
7.根据权利要求1-6任一项所述的预测方法,其特征在于,所述特征数据包括企业属性信息和企业行为特征信息。
8.一种客户流失率的预测系统,其特征在于,包括:
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的客户流失率的预测方法的步骤。
>10.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如权利要求1-7任一项所述的客户流失率的预测方法的步骤。
...【技术特征摘要】
1.一种客户流失率的预测方法,其特征在于,包括:
2.根据权利要求1所述的预测方法,其特征在于,所述获取距离财税产品到期前不同时间段的用户的特征数据包括:
3.根据权利要求2所述的预测方法,其特征在于,以设定时间点为基准,将所述用户随机分为若干用户组包括:
4.根据权利要求1所述的预测方法,其特征在于,获取财税产品到期前不同时长的特征数据之后,还包括:
5.根据权利要求1所述的预测方法,其特征在于,所述筛选出最佳特征集包括:
6.根据权利要求1所述的预测方法,其特征在于,根据所述超级参数、最佳特征集和所述未来流失概率均值的预测...
【专利技术属性】
技术研发人员:陈泓,徐煌,王伟萍,吕蔚,
申请(专利权)人:亿企赢网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。