业务流失预测方法、装置、服务器及可读存储介质制造方法及图纸

技术编号:19859896 阅读:22 留言:0更新日期:2018-12-22 12:14
本说明书实施例提供了一种业务流失预测方法,通过原始训练及交叉训练得到的至少两个业务流失预测模型,可实现对特征数据的流失状态进行互补式预测,使得预测结果更为准确。

【技术实现步骤摘要】
业务流失预测方法、装置、服务器及可读存储介质
本说明书实施例涉及互联网
,尤其涉及一种业务流失预测方法、装置、服务器及可读存储介质。
技术介绍
由于市场竞争日益激烈,客户的个性化的要求也逐渐增多,对于某个产品来说,客户的流失一定程度上是不可避免的。例如,对于银行产品来说,保证一定的用户基数是必须的。除了不断地吸引新用户,还需要想方设法的留住老用户。因此,需要分析出造成客户不断流失的原因,并加以对业务发展的调整和营销策略的改进。
技术实现思路
本说明书实施例提供及一种。第一方面,本说明书实施例提供一种业务流失预测方法,包括:获取待预测业务数据,从所述待预测业务数据中提取出特征数据;基于预先通过原始训练及交叉训练得到的至少两个业务流失预测模型,对所述特征数据的流失状态的概率进行预测;根据各个模型预测的流失状态的概率,确定预测结果。第二方面,本说明书实施例提供一种业务流失预测的建模方法,通过原始训练及交叉训练得到至少两个业务流失预测模型;其中:所述原始训练的过程包括:从业务原始数据中提取出特征数据,并标记各个特征数据的流失状态;基于标记了流失状态的特征数据,分别对至少两个业务流失预测模型进行原始训练;所述交叉训练的过程包括:获取未标记流失状态的未标记数据,并将所述未标记数据划分为与预测模型数量相同的各个部分;将所述各部分数据经过各预测模型进行流失状态的标记;将所述标记了流失状态的各部分数据分别输入至不同于流失状态标记的其他预测模型,分别对各个预测模型进行交叉训练。第三方面,本说明书实施例提供一种业务流失预测装置,包括:特征数据提取单元,用于获取待预测业务数据,并从所述待预测业务数据中提取出特征数据;预测执行单元,用于基于预先通过原始训练及交叉训练得到的至少两个业务流失预测模型,对所述特征数据的流失状态的概率进行预测;结果获取单元,用于根据各个模型预测的流失状态的概率,确定预测结果。第四方面,本说明书实施例提供一种业务流失预测的建模装置,通过原始训练及交叉训练得到至少两个业务流失预测模型;所述装置包括:原始训练单元,用于从业务原始数据中提取出特征数据,并标记各个特征数据的流失状态;基于标记了流失状态的特征数据,分别对至少两个业务流失预测模型进行原始训练;交叉训练单元,用于获取未标记流失状态的未标记数据,并将所述未标记数据划分为与预测模型数量相同的各个部分;将所述各部分数据经过各预测模型进行流失状态的标记;将所述标记了流失状态的各部分数据分别输入至不同于流失状态标记的其他预测模型,分别对各个预测模型进行交叉训练。第五方面,本说明书实施例提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述方法的步骤。第六方面,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。本说明书实施例有益效果如下:本说明书实施例提供了一种业务流失预测方法,通过原始训练及交叉训练得到的至少两个业务流失预测模型,可实现对特征数据的流失状态进行互补式预测,使得预测结果更为准确。在一种可选方式中,相比于静态模型,一旦标记数据确定,经过训练,参数调优后,模型就不会改变了,无法随着时间的推移或用户新需求的改变而变化,本说明书实施例采用的半监督学习的策略,由于使用了未标记的数据标记后作为训练集进行训练,因此是一个随着时间不断迭代,不断调整优化的过程,能够动态的感知用户需求和市场环境的变化,所以会比传统算法的结果理想。附图说明图1为本说明书实施例业务流失预测场景示意图;图2为本说明书实施例第一方面业务流失预测方法流程图;图3为本说明书实施例第二方面业务流失预测的建模方法流程图;图4为本说明书实施例第二方面业务流失预测的建模方法实例示意图;图5为本说明书实施例第三方面业务流失预测装置结构示意图;图6为本说明书实施例第四方面业务流失预测的建模装置结构示意图;图7本说明书实施例第五方面提供的服务器结构示意图。具体实施方式为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。请参见图1,为本说明书实施例的业务流失预测的场景示意图。终端100位于用户侧,与网络侧的服务器200通信。终端100中的业务处理客户端101可以是基于互联网实现用户业务的APP或网站,为用户提供业务交易的界面并将业务数据(用户相关数据或交易相关数据)提供给网络侧进行处理;服务器200中的业务流失预测系统201利用预先训练的业务流失预测模型用于对客户端101中涉及的业务进行流失概率的预测。经过分析发现,造成客户的流失的原因往往是多样性的,用户的喜好会随着时间推移和兴趣转变而改变。因此,本说明书实施例通过原始训练及交叉训练得到的至少两个业务流失预测模型,对所述特征数据的流失状态的概率进行预测,由于各个模型可基于不同的算法进行训练,因此可实现对特征数据的流失状态进行互补式预测,使得预测结果更为准确。第一方面,本说明书实施例提供一种业务流失预测方法,请参考图2,包括:S201:获取待预测业务数据,从待预测业务数据中提取出特征数据。业务可以是指在线交易,也可以是指搜索引擎、在线资源或广告推荐等网络服务。业务数据是指业务相关的历史数据以及实时数据,例如包括但不限于操作信息、用户信息和/或账户信息,可能涉及业务成交量、业务额度、业务频次、用户状态、用户信息、账户状态等相关数据。从业务数据进行特征提取得到特征数据。例如,首先,从业务数据提取出操作信息、用户信息和/或账户信息;然后,再从操作信息、用户信息和/或账户信息中,选取出特征数据。以网络金融业务为例,从业务数据进行特征提取得到特征数据的过程,主要是从银行用户的原始特征中提取有用的特征数据的过程,例如,需要提取用户的数据包括最近登录时间、最近一段时间(例如:一周)平均在线时长、用户年龄、用户存款、近三个月的交易总额等。S202:基于预先通过原始训练及交叉训练得到的至少两个业务流失预测模型,对特征数据的流失状态的概率进行预测。本说明书实施例中,用于业务流失预测的模型至少包括两个,每个预测模型都经过原始训练和交叉训练两个训练过程。初始训练过程,可理解为是采用已标记流失状态(包括已流失,浅流失,无流失)的数据,分别对各个模型进行训练,例如,为了互补,每个模型基于不同的训练算法。初始训练完成后,各个模型具有一定的判断能力,即可以对未标记流失状态的未标记数据进行状态初步预测。交叉训练过程,是在各个模型经过初步预测已具备一定的判断能力之后进行的。整个交叉训练可以理解为一个模型的输出,输入到另一个模型。例如,假设有两个模型A和B,第一部分未标记数据输入至模型A,第二部分未标记数据输入至模型B,得到这两部分数据的流失状态后,再将模型A输出的第一部分数据输入值模型B,对模型B进行训练,同理,将模型B输出的第二部分数据输入值模型A,对模型A进行训练,这就是所谓的交叉训练。如前提到的,由于各个模型优选采取不同本文档来自技高网...

【技术保护点】
1.一种业务流失预测方法,包括:获取待预测业务数据,从所述待预测业务数据中提取出特征数据;基于预先通过原始训练及交叉训练得到的至少两个业务流失预测模型,对所述特征数据的流失状态的概率进行预测;根据各个模型预测的流失状态的概率,确定预测结果。

【技术特征摘要】
1.一种业务流失预测方法,包括:获取待预测业务数据,从所述待预测业务数据中提取出特征数据;基于预先通过原始训练及交叉训练得到的至少两个业务流失预测模型,对所述特征数据的流失状态的概率进行预测;根据各个模型预测的流失状态的概率,确定预测结果。2.根据权利要求1所述的方法,所述原始训练的过程包括:从业务原始数据中提取出特征数据,并标记各个特征数据的流失状态;基于标记了流失状态的特征数据,分别对至少两个业务流失预测模型进行原始训练;所述交叉训练的过程包括:获取未标记流失状态的未标记数据,并将所述未标记数据划分为与预测模型数量相同的各个部分;将所述各部分数据经过各预测模型进行流失状态的标记;将所述标记了流失状态的各部分数据分别输入至不同于流失状态标记的其他预测模型,分别对各个预测模型进行交叉训练。3.根据权利要求2所述的方法,所述从业务原始数据中提取出特征数据,包括:从所述业务原始数据提取出操作信息、用户信息和/或账户信息;从操作信息、用户信息和/或账户信息中,选取出所述特征数据。4.根据权利要求3所述的方法,所述标记各个特征数据的流失状态包括:统计预置时间段内所述操作信息、用户信息和/或账户信息的状态;根据统计结果,确定所述特征数据的流失状态。5.根据权利要求4所述的方法,所述流失状态包括已流失状态、浅流失状态、无流失状态中的一种。6.根据权利要求1所述的方法,所述预测模型是基于半监督学习算法进行训练的,所述半监督学习算法包括人工神经网络、支持向量机、叶贝斯分类器、逻辑回归、随机森林算法中的任一种。7.根据权利要求1-6任一项所述的方法,所述根据各个模型预测的流失状态的概率,确定预测结果,包括:获取各个模型预测对各个流失状态的概率值;根据每个模型的概率值分布,选择可信度高的模型的概率值,作为预测结果,或者,对各个模型的概率值进行平均值处理,得到预测结果。8.一种业务流失预测的建模方法,通过原始训练及交叉训练得到至少两个业务流失预测模型;其中:所述原始训练的过程包括:从业务原始数据中提取出特征数据,并标记各个特征数据的流失状态;基于标记了流失状态的特征数据,分别对至少两个业务流失预测模型进行原始训练;所述交叉训练的过程包括:获取未标记流失状态的未标记数据,并将所述未标记数据划分为与预测模型数量相同的各个部分;将所述各部分数据经过各预测模型进行流失状态的标记;将所述标记了流失状态的各部分数据分别输入至不同于流失状态标记的其他预测模型,分别对各个预测模型进行交叉训练。9.根据权利要求8所述的方法,所述从业务原始数据中提取出特征数据,包括:从所述业务原始数据提取出操作信息、用户信息和/或账户信息;从操作信息、用户信息和/或账户信息中,选取出所述特征数据。10.根据权利要求9所述的方法,所述标记各个特征数据的流失状态包括:统计预置时间段内所述操作信息、用户信息和/或账户信息的状态;根据统计结果,确定所述特征数据的流失状态。11.一种业务流失预测装置,包括:特征数据提取单元,用于获取待预测业务数据,并从所述待预测业务数据中提取出特征数据;预测执行单元,用于基于预先通过原始训练及交叉训练得到...

【专利技术属性】
技术研发人员:覃兆坤
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1