客户流失预警方法、设备及介质技术

技术编号:34436261 阅读:61 留言:0更新日期:2022-08-06 16:20
本发明专利技术提供一种客户流失预警方法、设备及介质,方法基于梯度提升决策树算法结合长短期记忆算法对数据进行处理,所述方法包括以下步骤:采集客户历史数据的原始数据集,采用梯度提升决策树算法预处理数据,选择客户特征数据;对预处理后的原始数据集进行优化,选择长短期记忆算法的最优化参数;采用长短期记忆算法以及所述S2步骤选择的最优化参数进行多层数据优化迭代,预测客户流失概率,对客户流失进行预警。本发明专利技术提出的客户流失预警方法,利用自适应增强算法和梯度提升树算法的融合提升模型在特征维度和样本权重处理的敏感度,结合长短期记忆算法以时序的角度可以更加敏感的获取流失意向。的获取流失意向。的获取流失意向。

【技术实现步骤摘要】
客户流失预警方法、设备及介质


[0001]本专利技术属于数据处理
,具体涉及客户流失预警方法、设备及介质。

技术介绍

[0002]对企业而言,客户流失被定义为客户放弃继续购买该企业的商品或服务的情况。客户的流失会对企业造成直接经济损失。随着市场竞争的激烈程度逐年增高,企业所面临的客户流失问题日益严重。造成企业客户流失的原因为“媒体粉尘化”,即用户获得品牌信息和产品反馈的渠道越来越碎片化,对产品认知的改变极可能在品牌企业无察觉的情况已经发生改变,造成过往的客户流失预警方法效果大不如前。媒体粉尘化和用户决策时间的变短,造成了两方面的问题。第一,参与预警模型的维度数据变得更加宽泛和稀疏;第二,样本数据存在媒体数据覆盖不全导致的质量下降。这样形成的横向数据稀疏、纵向数据质量下降需要新的预测模型来提高流失预测的准确度。
[0003]企业成功获取新客户所需要的成本远高于保留已有客户,这使得客户保留对于企业来说格外重要。保留现有客户的常用方法是准确识别出高流失倾向的客户,然后针对这些客户实施多样性的挽留策略。客户流失预测作为客户关系管理的重要组成部分,通过对客户的历史数据进行分析建模,旨在准确识别出高流失倾向的客户,为企业后续的客户挽留策略制定提供指导。
[0004]在过去数十年,客户流失预测已经在电信、银行、游戏以及音乐流媒体等不同领域内被广泛研究。学者通常把客户流失预测当作二分类数据挖掘任务处理,通过构造业务特征以及选择合适的分类器来预测客户未来流失与否。许多流行的机器学习模型和深度学习模型在客户流失预测中得到成功应用,如逻辑回归 (Logistic Regression,LR)、决策树(Decision Tree,DT)、支持向量机(Support VectorMachine,SVM)、多层反馈神经网络(Neural Networks,NN)和卷积神经网络(Convolutional Neural Networks,CNN)等。
[0005]与深度学习模型相比,传统机器学习模型存在特征工程对模型效果影响较大、模型容量小等缺点。目前客户流失预测任务中的模型集成方法的研究大多集中于传统机器学习模型方面,在深度学习模型集成方法方面的研究较少。
[0006]如中国专利201910399116.X公开了一种客户流失预警方法、系统、介质及电子设备。该方法包括:获取客户的历史信息数据,该历史信息数据包括基本属性数据、行为属性数据、业务属性数据及情感数据;清洗所述历史信息数据中的异常数据;分析不同客户的基本属性数据、行为属性数据及业务属性数据,构建客户流失预警模型;采用所述情感数据评价所述客户流失预警模型效果;通过所述客户流失预警模型预测出即将流失客户;采用RFM模型对即将流失客户进行分类,制定客户挽留策略。
[0007]此外,中国专利202110342928.8公开了一种电信行业集团客户流失的综合评估预警方法及系统,方法包括:定期采集集团客户和相应的集团成员的行为数据;由行为数据中统计不同维度的变量参数,并将变量参数输入至训练完成的综合评估预警模型中;根据综合评估预警模型的输出数据,判断得到对应维度下集团客户流失评估结果;将集团客户流
失评估结果超出预设阈值的集团流失预警清单下发至相应的客户经理。通过本专利技术的技术方案,能够提前预测可能会发生流失的客户并快速定位预警原因,从而及时有效地开展保有工作,降低客户流失的可能性,最终实现集团客户保有工作的闭环管理和效能提升。
[0008]但是,其均不能够有效地对客户的原始数据集中的进行关键特征类别进行筛选识别,选取关键特征数据进行后续的分类器深度学习强化,进而迭代优化出具有较高拟合度的客户流失率预测结果,到时预测结果不准确。

技术实现思路

[0009]本专利技术针对上述缺陷,提供一种客户流失预警方法、设备及介质。本专利技术提出的客户流失预警方法的预测精度高、拟合能力强,能够有效的行业中的客户流失率,可以为客户流失的预测预警提供帮助。
[0010]本专利技术提供如下技术方案:客户流失预警方法,所述方法基于梯度提升决策树算法结合长短期记忆算法对数据进行处理,所述方法包括以下步骤:
[0011]S1、采集客户历史数据的原始数据集,采用梯度提升决策树算法预处理数据,选择客户特征数据;
[0012]S2、对预处理后的原始数据集进行优化,选择长短期记忆算法的最优化参数;
[0013]S3、采用长短期记忆算法以及所述S2步骤选择的最优化参数进行多层数据优化迭代,预测客户流失概率,对客户流失进行预警。
[0014]进一步地,所述S1步骤包括以下步骤:
[0015]S11、初始化客户历史数据的原始数据集在不同客户特征上的估计值,构建损失函数最小化的参数估计值计算模型,估计使得损失函数最小的参数:
[0016]S12、对每个客户特征的若干个样本计算损失函数的梯度值w
n
,将其作为残差值d
n
的估计,并以此为样本新的真实值d,得到回归树,估计回归树叶节点的区域,拟合残差近似值err(d,w
n
);
[0017]S13、计算拟合残差近似值的最佳拟合值,得到更新的回归树ηh(x
n
);
[0018]S14、计算每个客户特征的全局重要度,并判断是否大于该特征的选取阈值;若大于该特征的选取阈值,则选取该客户特征数据,若小于等于该特征的选取阈值,则不选取该客户特征数据,重复步骤S11

S13。
[0019]进一步地,所述客户特征包括:客户交易单笔金额、客户付费订阅天数、客户续费频率和客户交易订单服务种类。
[0020]进一步地,所述S11步骤构建的损失函数最小化的参数估计值如下:
[0021][0022]其中,为损失函数参数估计值,k为客户历史数据的第k个客户特征,m
t
为与t节点相关联的客户特征,为t节点分裂产生的平方损失,J

1为非叶子节点数量,J为梯度提升决策树算法的决策树叶子节点数量。
[0023]5、根据权利要求2所述的客户流失预警方法,其特征在于,所述拟合残差近似值的
最佳拟合值计算模型如下:
[0024][0025]其中,M为迭代次数,ηh(x
n
)为更新得到的回归树。
[0026]进一步地,所述客户历史数据存储于Hadoop分布式文件系统中。
[0027]进一步地,所述S3步骤包括以下步骤:
[0028]S31、长短期记忆算法的遗忘门读取预处理后的原始数据集中上一个样本的输出量h
t
‑1和当前样本的输入量x
t
,构建第σ层的遗忘门计算模型f
t
,输出0~1 之间的数值,决定从样本中丢弃的信息;
[0029]S32、将S31步骤经过丢弃信息后的样本x
e
输入至输入门,构建第σ层的输入门计算模型i
t
,,根本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.客户流失预警方法,所述方法基于梯度提升决策树算法结合长短期记忆算法对数据进行处理,其特征在于,所述方法包括以下步骤:S1、采集客户历史数据的原始数据集,采用梯度提升决策树算法预处理数据,选择客户特征数据;S2、对预处理后的原始数据集进行优化,选择长短期记忆算法的最优化参数;S3、采用长短期记忆算法以及所述S2步骤选择的最优化参数进行多层数据优化迭代,预测客户流失概率,对客户流失进行预警。2.根据权利要求1所述的客户流失预警方法,其特征在于,所述S1步骤包括以下步骤:S11、初始化客户历史数据的原始数据集在不同客户特征上的估计值,构建损失函数最小化的参数估计值计算模型,估计使得损失函数最小的参数:S12、对每个客户特征的若干个样本计算损失函数的梯度值w
n
,将其作为残差值d
n
的估计,并以此为样本新的真实值d,得到回归树,估计回归树叶节点的区域,拟合残差近似值err(d,w
n
);S13、计算拟合残差近似值的最佳拟合值,得到更新的回归树ηh(x
n
);S14、计算每个客户特征的全局重要度,并判断是否大于该特征的选取阈值;若大于该特征的选取阈值,则选取该客户特征数据,若小于等于该特征的选取阈值,则不选取该客户特征数据,重复步骤S11

S13。3.根据权利要求1所述的客户流失预警方法,其特征在于,所述客户特征包括:客户交易单笔金额、客户付费订阅天数、客户续费频率和客户交易订单服务种类。4.根据权利要求2所述的客户流失预警方法,其特征在于,所述S11步骤构建的损失函数最小化的参数估计值如下:其中,为损失函数参数估计值,k为客户历史数据的第k个客户特征,m
t
为与t节点相关联的客户特征,为t节点分裂产生的平方损失,J

1为非叶子节点数量,J为梯度提升决策树算法的决策树叶子节点数量。5.根据权利要求2所述的客户流失预警方法,其特征在于,所述拟合残差近似值的最佳拟合值计算模型如下:其中,M为迭代次数,ηh(x
n
)为更新得到的回归树。6.根据权利要求1所述的客户流失预警方法,其特征在于,所述客户历史数据存储于Hadoop分布式文件系统中。7.根据权利要求1所述的客户流失预警方法,其特征在于,所述S3步骤包括以下步骤:S31、长短期记忆算法的遗忘门读取预处理后的原始数据集中上一个样本的输出量h
t
‑1和当前样本的输入量x
t
,构建第σ层的遗忘门计算模型f
t
,输出0~1之间的数值,决定从样本
中丢弃的信息;S32、将S31步骤经过丢弃信息后的样本x
e
输入至输入门,构建第σ层的输入门计算模型i
t
,根据输入门的计算结果X
e
构建输入门tanh层计算模型,计算得到t时刻的备选更新内容根据t

1时刻的记忆样本(细胞)值C
t
‑1构建t时刻记忆样本计算值C
t
计算模型,确定新的信息加入当前细胞的数据量;S33、将S32步骤得到的t时刻记忆样本计算值C

【专利技术属性】
技术研发人员:江元元
申请(专利权)人:创络上海数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1