客户流失预警方法、设备及介质技术

技术编号：34436261 阅读：61 留言：0更新日期：2022-08-06 16:20

本发明专利技术提供一种客户流失预警方法、设备及介质，方法基于梯度提升决策树算法结合长短期记忆算法对数据进行处理，所述方法包括以下步骤：采集客户历史数据的原始数据集，采用梯度提升决策树算法预处理数据，选择客户特征数据；对预处理后的原始数据集进行优化，选择长短期记忆算法的最优化参数；采用长短期记忆算法以及所述S2步骤选择的最优化参数进行多层数据优化迭代，预测客户流失概率，对客户流失进行预警。本发明专利技术提出的客户流失预警方法，利用自适应增强算法和梯度提升树算法的融合提升模型在特征维度和样本权重处理的敏感度，结合长短期记忆算法以时序的角度可以更加敏感的获取流失意向。的获取流失意向。的获取流失意向。

全部详细技术资料下载

【技术实现步骤摘要】
客户流失预警方法、设备及介质

[0001]本专利技术属于数据处理
，具体涉及客户流失预警方法、设备及介质。

技术介绍

[0002]对企业而言，客户流失被定义为客户放弃继续购买该企业的商品或服务的情况。客户的流失会对企业造成直接经济损失。随着市场竞争的激烈程度逐年增高，企业所面临的客户流失问题日益严重。造成企业客户流失的原因为“媒体粉尘化”，即用户获得品牌信息和产品反馈的渠道越来越碎片化，对产品认知的改变极可能在品牌企业无察觉的情况已经发生改变，造成过往的客户流失预警方法效果大不如前。媒体粉尘化和用户决策时间的变短，造成了两方面的问题。第一，参与预警模型的维度数据变得更加宽泛和稀疏；第二，样本数据存在媒体数据覆盖不全导致的质量下降。这样形成的横向数据稀疏、纵向数据质量下降需要新的预测模型来提高流失预测的准确度。
[0003]企业成功获取新客户所需要的成本远高于保留已有客户，这使得客户保留对于企业来说格外重要。保留现有客户的常用方法是准确识别出高流失倾向的客户，然后针对这些客户实施多样性的挽留策略。客户流失预测作为客户关系管理的重要组成部分，通过对客户的历史数据进行分析建模，旨在准确识别出高流失倾向的客户，为企业后续的客户挽留策略制定提供指导。
[0004]在过去数十年，客户流失预测已经在电信、银行、游戏以及音乐流媒体等不同领域内被广泛研究。学者通常把客户流失预测当作二分类数据挖掘任务处理，通过构造业务特征以及选择合适的分类器来预测客户未来流失与否。许多流行的机器学习模型和深度学习模型在客户流失预测...

【技术保护点】

【技术特征摘要】
1.客户流失预警方法，所述方法基于梯度提升决策树算法结合长短期记忆算法对数据进行处理，其特征在于，所述方法包括以下步骤：S1、采集客户历史数据的原始数据集，采用梯度提升决策树算法预处理数据，选择客户特征数据；S2、对预处理后的原始数据集进行优化，选择长短期记忆算法的最优化参数；S3、采用长短期记忆算法以及所述S2步骤选择的最优化参数进行多层数据优化迭代，预测客户流失概率，对客户流失进行预警。2.根据权利要求1所述的客户流失预警方法，其特征在于，所述S1步骤包括以下步骤：S11、初始化客户历史数据的原始数据集在不同客户特征上的估计值，构建损失函数最小化的参数估计值计算模型，估计使得损失函数最小的参数：S12、对每个客户特征的若干个样本计算损失函数的梯度值w
n
，将其作为残差值d
n
的估计，并以此为样本新的真实值d，得到回归树，估计回归树叶节点的区域，拟合残差近似值err(d，w
n
)；S13、计算拟合残差近似值的最佳拟合值，得到更新的回归树ηh(x
n
)；S14、计算每个客户特征的全局重要度，并判断是否大于该特征的选取阈值；若大于该特征的选取阈值，则选取该客户特征数据，若小于等于该特征的选取阈值，则不选取该客户特征数据，重复步骤S11
‑
S13。3.根据权利要求1所述的客户流失预警方法，其特征在于，所述客户特征包括：客户交易单笔金额、客户付费订阅天数、客户续费频率和客户交易订单服务种类。4.根据权利要求2所述的客户流失预警方法，其特征在于，所述S11步骤构建的损失函数最小化的参数估计值如下：其中，为损失函数参数估计值，k为客户历史数据的第k个客户特征，m
t
为与t节点相关联的客户特征，为t节点分裂产生的平方损失，J
‑
1为非叶子节点数量，J为梯度提升决策树算法的决策树叶子节点数量。5.根据权利要求2所述的客户流失预警方法，其特征在于，所述拟合残差近似值的最佳拟合值计算模型如下：其中，M为迭代次数，ηh(x
n
)为更新得到的回归树。6.根据权利要求1所述的客户流失预警方法，其特征在于，所述客户历史数据存储于Hadoop分布式文件系统中。7.根据权利要求1所述的客户流失预警方法，其特征在于，所述S3步骤包括以下步骤：S31、长短期记忆算法的遗忘门读取预处理后的原始数据集中上一个样本的输出量h
t
‑1和当前样本的输入量x
t
，构建第σ层的遗忘门计算模型f
t
，输出0～1之间的数值，决定从样本
中丢弃的信息；S32、将S31步骤经过丢弃信息后的样本x
e
输入至输入门，构建第σ层的输入门计算模型i
t
，根据输入门的计算结果X
e
构建输入门tanh层计算模型，计算得到t时刻的备选更新内容根据t
‑
1时刻的记忆样本(细胞)值C
t
‑1构建t时刻记忆样本计算值C
t
计算模型，确定新的信息加入当前细胞的数据量；S33、将S32步骤得到的t时刻记忆样本计算值C

【专利技术属性】
技术研发人员：江元元，
申请(专利权)人：创络上海数据科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人