当前位置: 首页 > 专利查询>苏州大学专利>正文

客户流失预测方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:21434248 阅读:38 留言:0更新日期:2019-06-22 12:32
本发明专利技术实施例公开了一种客户流失预测方法、装置、设备及计算机可读存储介质。其中,方法包括按照具体时间粒度对待预测项目客户信息的历史日志数据进行处理得到时序特征数据;将时序特征数据输入至预先构建的树模型中,得到树模型特征;将时序特征数据和树模型特征输入至客户流失预测模型中,客户流失预测模型为由长短期记忆网络和卷积神经网络模型构成、且包含跨层连接的混合模型,该模型输出的即为待预测项目的每个客户流失概率。本申请解决了相关技术依靠人工提取特征存在的弊端,提升了客户流失预测准确率,具有好的通用性。

【技术实现步骤摘要】
客户流失预测方法、装置、设备及计算机可读存储介质
本专利技术实施例涉及机器学习
,特别是涉及一种客户流失预测方法、装置、设备及计算机可读存储介质。
技术介绍
客户流失为客户放弃继续使用企业提供的某项服务的一种现象,比如电信行业的手机用户离网现象、互联网付费订阅服务的会员不再续订的现象。随着市场商业竞争的日益激烈,客户流失现象也越来越容易发生。客户的流失会给公司利润带来很大的影响,同时获取新客户的成本也远高于保留现有客户。所以,为了追求持续发展,公司必须做好保留现有客户的工作。客户流失预测可以帮助公司及时的识别出潜在的流失客户以便对其实施对应的维挽操作。客户流失预测的核心问题就是如何利用历史数据准确预测客户未来的流失情况。由于预测客户的流失并不需要实时进行,预测的结果只需要定期提供给公司的客户关系管理人员进行策略的制定,所以客户流失预测系统不需要具备像推荐系统那般的实时性以及高性能要求。目前客户流失预测方法一般是通过对客户的大量历史数据进行分析,人工提取高质量的业务特征,然后选择合适的分类器算法进行预测,获得最终的客户流失概率。基于人工特征配合经典分类器的传统客户流失预测方法,人工提取特征需要耗费大量的人力,同时不具备通用性,换个业务场景可能提取特征的方法或者特征的效果就失效了,这就导致最终客户流失预测的准确度依赖于人工特征的好坏,而且也不具备跨业务预测的通用性。
技术实现思路
本公开实施例提供了一种客户流失预测方法、装置、设备及计算机可读存储介质,解决了相关技术依靠人工提取特征存在的弊端,提升了客户流失预测准确率,通用性好。为解决上述技术问题,本专利技术实施例提供以下技术方案:本专利技术实施例一方面提供了一种客户流失预测方法,包括:按照预设时间粒度对待预测项目客户信息的历史日志数据进行处理,得到时序特征数据;将所述时序特征数据输入至预先构建的树模型中,得到树模型特征;将所述时序特征数据和所述树模型特征输入至预先构建的客户流失预测模型中,得到所述待预测项目的每个客户流失概率;其中,所述客户流失预测模型为由长短期记忆网络和卷积神经网络模型构成、且包含跨层连接的混合模型。可选的,所述客户流失预测模型从前到后依次包括输入层、第一LSTM层、第二LSTM层、第一卷积层、第二卷积层、第三卷积层、池化层、拼接层、第一全连接层、第二全连接层以及输出层;其中,所述时序特征数据通过输入层输入至所述第一LSTM层,所述第一连接层和所述树模型特征作为所述第二全连接层的输入;所述第一LSTM层和所述第二LSTM层的输出分别输入至所述第一卷积层、所示第二卷积层、所述第三卷积层中。可选的,所述得到所述待预测项目的每个客户流失概率之后,还包括:按照概率值从大到小对所述待预测项目的客户进行排序,并输出前N个客户信息,以作为高概率流失客户。可选的,所述客户流失预测模型包括多个分支结构,所述分支结构的个数与所述时序特征数据的特征子集个数相同,所述将所述时序特征数据和所述树模型特征输入至预先构建的客户流失预测模型中为:将所述时序特征数据按照不同时间粒度分为k个特征子集;将k个特征子集分别输入到所述模型客户流失预测模型相应的分支结构中。可选的,所述树模型为基于Boosting的算法,利用历史日志数据的时序特征数据训练XGBoost模型结构所得。本专利技术实施例另一方面提供了一种客户流失预测装置,包括:时序特征数据提取模块,用于按照预设时间粒度对待预测项目客户信息的历史日志数据进行处理,得到时序特征数据;树模型特征获取模块,用于将所述时序特征数据输入至预先构建的树模型中,得到树模型特征;客户流失预测模块,用于将所述时序特征数据和所述树模型特征输入至预先构建的客户流失预测模型中,得到所述待预测项目的每个客户流失概率;所述客户流失预测模型为由长短期记忆网络和卷积神经网络模型构成、且包含跨层连接的混合模型。可选的,还包括排序模块,用于按照概率值从大到小对所述待预测项目的客户进行排序,并输出前N个客户信息,以作为高概率流失客户。可选的,所述客户流失预测模块为将所述时序特征数据按照不同时间粒度分为k个特征子集;将k个特征子集分别输入到所述模型客户流失预测模型相应的分支结构中的模块,所述客户流失预测模型包括多个分支结构,所述分支结构的个数与所述时序特征数据的特征子集个数相同。本专利技术实施例还提供了一种客户流失预测设备,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述客户流失预测方法的步骤。本专利技术实施例最后还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有客户流失预测程序,所述客户流失预测程序被处理器执行时实现如前任一项所述客户流失预测方法的步骤。本申请提供的技术方案的优点在于,在基础时序特征上得到树模型特征,将树模型特征和基础时序特征拼接得到最终特征,充分利用时序特征,不仅可从特征层面提升客户流失的预测效果,结合树特征还适用于各种业务,具有很好的通用性;最后将最终特征输入混合模型进行训练,可以充分挖掘时序特征中的隐藏序列信息以及将时序特征和树模型特征进行高阶组合,从模型层面提高预测效果。不仅解决了相关技术依靠人工提取特征存在的弊端,还有效地提升了客户流失预测准确率和通用性能。此外,本专利技术实施例还针对客户流失预测方法提供了相应的实现装置、设备及计算机可读存储介质,进一步使得所述方法更具有实用性,所述装置、设备及计算机可读存储介质具有相应的优点。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。附图说明为了更清楚的说明本专利技术实施例或相关技术的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种客户流失预测方法的流程示意图;图2为本专利技术实施例提供的一种树模型特征示意图;图3为本专利技术实施例提供的一种LSTM基本单元结构示意图;图4为本专利技术实施例提供的一种客户流失预测模型的结构示意图;图5为本专利技术实施例提供的客户流失预测装置的一种具体实施方式结构图;图6为本专利技术实施例提供的客户流失预测装置的另一种具体实施方式结构图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面结合附图和具体实施方式对本专利技术作进一步的详细说明。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。目前针对客户流失预测的常规做法就是将其看作一个二分类的任务,利用数据挖掘和机器学习技术,预测客户未来流失的概率。常用的机器学习模型有LR(LogisticRegression,逻辑回归)、RF(RandomFo本文档来自技高网
...

【技术保护点】
1.一种客户流失预测方法,其特征在于,包括:按照预设时间粒度对待预测项目客户信息的历史日志数据进行处理,得到时序特征数据;将所述时序特征数据输入至预先构建的树模型中,得到树模型特征;将所述时序特征数据和所述树模型特征输入至预先构建的客户流失预测模型中,得到所述待预测项目的每个客户流失概率;其中,所述客户流失预测模型为由长短期记忆网络和卷积神经网络模型构成、且包含跨层连接的混合模型。

【技术特征摘要】
1.一种客户流失预测方法,其特征在于,包括:按照预设时间粒度对待预测项目客户信息的历史日志数据进行处理,得到时序特征数据;将所述时序特征数据输入至预先构建的树模型中,得到树模型特征;将所述时序特征数据和所述树模型特征输入至预先构建的客户流失预测模型中,得到所述待预测项目的每个客户流失概率;其中,所述客户流失预测模型为由长短期记忆网络和卷积神经网络模型构成、且包含跨层连接的混合模型。2.根据权利要求1所述的客户流失预测方法,其特征在于,所述客户流失预测模型从前到后依次包括输入层、第一LSTM层、第二LSTM层、第一卷积层、第二卷积层、第三卷积层、池化层、拼接层、第一全连接层、第二全连接层以及输出层;其中,所述时序特征数据通过输入层输入至所述第一LSTM层,所述第一连接层和所述树模型特征作为所述第二全连接层的输入;所述第一LSTM层和所述第二LSTM层的输出分别输入至所述第一卷积层、所述第二卷积层、所述第三卷积层中。3.根据权利要求2所述的客户流失预测方法,其特征在于,所述得到所述待预测项目的每个客户流失概率之后,还包括:按照概率值从大到小对所述待预测项目的客户进行排序,并输出前N个客户信息,以作为高概率流失客户。4.根据权利要求2所述的客户流失预测方法,其特征在于,所述客户流失预测模型包括多个分支结构,所述分支结构的个数与所述时序特征数据的特征子集个数相同,所述将所述时序特征数据和所述树模型特征输入至预先构建的客户流失预测模型中为:将所述时序特征数据按照不同时间粒度分为k个特征子集;将k个特征子集分别输入到所述模型客户流失预测模型相应的分支结构中。5.根据权利要求1...

【专利技术属性】
技术研发人员:严建峰周捷
申请(专利权)人:苏州大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1