用户流失预测方法及装置制造方法及图纸

技术编号:20624084 阅读:22 留言:0更新日期:2019-03-20 15:07
本说明书一个或多个实施例公开了一种用户流失预测方法及装置,用以高效准确地对用户的流失风险进行预测。所述方法包括:针对多个样本用户,获取各所述样本用户的相关交易信息;其中,所述相关交易信息包括所述样本用户的第一用户信息、与所述样本用户进行交易的交易方用户的第二用户信息、交易时间、交易金额中的至少一项;根据所述相关交易信息,确定各所述样本用户的用户特征及用户类型;其中,所述用户类型包括流失类用户或留存类用户;根据各所述样本用户的用户特征及所用户类型,确定待预测用户的流失风险级别。

User Loss Prediction Method and Device

One or more embodiments of this specification disclose a user churn prediction method and device for efficiently and accurately predicting user churn risk. The method includes: obtaining relevant transaction information of each sample user for a plurality of sample users; among them, the relevant transaction information includes the first user information of the sample user, the second user information of the trader user who transacts with the sample user, the transaction time and the transaction amount at least one of the transaction amounts; and determining each exchange according to the relevant transaction information. The user characteristics and user types of the sample users are described, in which the user types include loss users or retention users, and the loss risk level of the user to be predicted is determined according to the user characteristics and user types of the sample users.

【技术实现步骤摘要】
用户流失预测方法及装置
本说明书涉及信息处理
,尤其涉及一种用户流失预测方法及装置。
技术介绍
在业务的营销和运营等过程中,商户参与业务的频次和质量对业务的推广效果有非常大的影响。对于业务主办方来说,投入一定的成本来开展业务,希望参与业务的商户能够长时间参与业务。在面对商户流失的情况下,如果能够对新入驻的参与业务的商户进行流失预测,就能够提前采取防流失等措施,以减少商户流失带来的业务成本。现有技术中,对商户进行流失预测时,主要采取设计流失、非流失用户的特征,并根据特征标签(即流失标签或非流失标签)来训练分类模型的方法。但是,这类方法由于没有考虑用户之间的关系,导致流失预测不够准确。对此,另一类方法加入了用户之间的关系数据作为特征,以训练用户的分类模型,进而预测用户的流失比率。然而,这种方法由于特征较为分散、单一,因此在流失率特别高的群组用户下,模型训练效果并不好。
技术实现思路
本说明书一个或多个实施例的目的是提供一种用户流失预测方法及装置,用以高效准确地对用户的流失风险进行预测。为解决上述技术问题,本说明书一个或多个实施例是这样实现的:一方面,本说明书一个或多个实施例提供一种用户流失预测方法,包括:针对多个样本用户,获取各所述样本用户的相关交易信息;其中,所述相关交易信息包括所述样本用户的第一用户信息、与所述样本用户进行交易的交易方用户的第二用户信息、交易时间、交易金额中的至少一项;根据所述相关交易信息,确定各所述样本用户的用户特征及用户类型;其中,所述用户类型包括流失类用户或留存类用户;根据各所述样本用户的用户特征及所用户类型,确定待预测用户的流失风险级别。在一个实施例中,所述根据各所述样本用户的用户特征及用户类型,确定待预测用户的流失风险级别,包括:根据各所述样本用户的用户特征,对各所述样本用户进行聚类,得到至少一个用户群组;根据各所述用户群组中的各所述样本用户的用户类型,确定各所述用户群组的群组类型;所述群组类型包括高流失风险群组或低流失风险群组;根据所述待预测用户的用户特征,确定所述待预测用户所在的第一用户群组;根据所述第一用户群组的群组类型,确定所述待预测用户的流失风险级别。在一个实施例中,所述根据各所述用户群组中的各所述样本用户的用户类型,确定各所述用户群组的群组类型,包括:若所述用户群组中属于所述流失类用户的样本用户的比例高于或等于预设阈值,则确定所述用户群组的群组类型为所述高流失风险群组;若所述用户群组中属于所述流失类用户的样本用户的比例低于所述预设阈值,则确定所述用户群组的群组类型为所述低流失风险群组。在一个实施例中,所述方法还包括:根据各所述样本用户的用户类型,确定所述样本用户的第一流失率;其中,所述第一流失率指属于所述流失类用户的样本用户占所有样本用户的比率;确定所述第一流失率为所述预设阈值。在一个实施例中,所述根据所述第一用户群组的群组类型,确定所述待预测用户的流失风险级别,包括:若所述第一用户群组的群组类型为所述高流失风险群组,则确定所述待预测用户的流失风险级别为高流失风险级别;若所述第一用户群组的群组类型为所述低流失风险群组,则确定所述待预测用户的流失风险级别为低流失风险级别。在一个实施例中,所述根据各所述样本用户的用户特征及用户类型,确定待预测用户的流失风险级别,包括:对各所述样本用户的用户特征及各所述样本用户的用户类型进行训练,得到预测模型;所述预测模型包括所述用户特征对应的样本用户属于所述流失类用户的第一概率,和/或,所述用户特征对应的样本用户属于所述留存类用户的第二概率;将所述待预测用户的用户特征作为所述预测模型的输入数据,确定所述待预测用户的用户特征对应的所述第一概率和/或所述第二概率;根据所述待预测用户的用户特征对应的所述第一概率和/或所述第二概率,确定所述待预测用户的流失风险级别。在一个实施例中,所述根据所述相关交易信息,确定各所述样本用户的用户特征及用户类型,包括:根据所述相关交易信息,确定各所述样本用户和所述交易方用户之间的交易关系;根据所述交易关系,确定各所述样本用户之间的关联关系;其中,与相同交易方用户具有所述交易关系的多个所述样本用户之间具有所述关联关系;根据各所述样本用户和与其相邻的邻接用户之间的关联关系,确定各所述样本用户的拓扑特征;根据所述拓扑特征确定各所述样本用户的用户特征。在一个实施例中,所述关联关系包括各所述样本用户之间具有的相同交易方用户的数量;相应的,所述根据各所述样本用户和与其相邻的邻接用户之间的关联关系,确定各所述样本用户的拓扑特征,包括:根据各所述样本用户和与其相邻的邻接用户之间具有的相同交易方用户的数量,确定各所述样本用户和所述邻接用户之间的距离参数值;其中,所述距离参数值与所述样本用户和所述邻接用户之间具有的相同交易方用户的数量成正比;根据所述距离参数值,确定各所述样本用户的拓扑特征。在一个实施例中,所述确定各所述样本用户的拓扑特征之后,还包括:将所述样本用户的拓扑特征作为输入向量、将所述邻接用户的第二流失率作为输出向量进行训练,以训练出所述样本用户的流失相关特征;其中,所述第二流失率指属于所述流失类用户的所述邻接用户占所有所述邻接用户的比率;相应的,所述根据所述拓扑特征确定各所述样本用户的用户特征,包括:根据所述拓扑特征和/或所述流失相关特征,确定各所述样本用户的用户特征。另一方面,本说明书一个或多个实施例提供一种用户流失预测装置,包括:获取模块,用于针对多个样本用户,获取各所述样本用户的相关交易信息;其中,所述相关交易信息包括所述样本用户的第一用户信息、与所述样本用户进行交易的交易方用户的第二用户信息、交易时间、交易金额中的至少一项;第一确定模块,用于根据所述相关交易信息,确定各所述样本用户的用户特征及用户类型;其中,所述用户类型包括流失类用户或留存类用户;第二确定模块,用于根据各所述样本用户的用户特征及所用户类型,确定待预测用户的流失风险级别。在一个实施例中,所述第二确定模块包括:聚类单元,用于根据各所述样本用户的用户特征,对各所述样本用户进行聚类,得到至少一个用户群组;第一确定单元,用于根据各所述用户群组中的各所述样本用户的用户类型,确定各所述用户群组的群组类型;所述群组类型包括高流失风险群组或低流失风险群组;第二确定单元,用于根据所述待预测用户的用户特征,确定所述待预测用户所在的第一用户群组;第三确定单元,用于根据所述第一用户群组的群组类型,确定所述待预测用户的流失风险级别。在一个实施例中,所述第一确定单元还用于:若所述用户群组中属于所述流失类用户的样本用户的比例高于或等于预设阈值,则确定所述用户群组的群组类型为所述高流失风险群组;若所述用户群组中属于所述流失类用户的样本用户的比例低于所述预设阈值,则确定所述用户群组的群组类型为所述低流失风险群组。在一个实施例中,所述第一确定单元还用于:根据各所述样本用户的用户类型,确定所述样本用户的第一流失率;其中,所述第一流失率指属于所述流失类用户的样本用户占所有样本用户的比率;确定所述第一流失率为所述预设阈值。在一个实施例中,所述第三确定单元还用于:若所述第一用户群组的群组类型为所述高流失风险群组,则确定所述待预测用户的流失风险级别为高流失风险级别;若所述第本文档来自技高网...

【技术保护点】
1.一种用户流失预测方法,包括:针对多个样本用户,获取各所述样本用户的相关交易信息;其中,所述相关交易信息包括所述样本用户的第一用户信息、与所述样本用户进行交易的交易方用户的第二用户信息、交易时间、交易金额中的至少一项;根据所述相关交易信息,确定各所述样本用户的用户特征及用户类型;其中,所述用户类型包括流失类用户或留存类用户;根据各所述样本用户的用户特征及所用户类型,确定待预测用户的流失风险级别。

【技术特征摘要】
1.一种用户流失预测方法,包括:针对多个样本用户,获取各所述样本用户的相关交易信息;其中,所述相关交易信息包括所述样本用户的第一用户信息、与所述样本用户进行交易的交易方用户的第二用户信息、交易时间、交易金额中的至少一项;根据所述相关交易信息,确定各所述样本用户的用户特征及用户类型;其中,所述用户类型包括流失类用户或留存类用户;根据各所述样本用户的用户特征及所用户类型,确定待预测用户的流失风险级别。2.根据权利要求1所述的方法,所述根据各所述样本用户的用户特征及用户类型,确定待预测用户的流失风险级别,包括:根据各所述样本用户的用户特征,对各所述样本用户进行聚类,得到至少一个用户群组;根据各所述用户群组中的各所述样本用户的用户类型,确定各所述用户群组的群组类型;所述群组类型包括高流失风险群组或低流失风险群组;根据所述待预测用户的用户特征,确定所述待预测用户所在的第一用户群组;根据所述第一用户群组的群组类型,确定所述待预测用户的流失风险级别。3.根据权利要求2所述的方法,所述根据各所述用户群组中的各所述样本用户的用户类型,确定各所述用户群组的群组类型,包括:若所述用户群组中属于所述流失类用户的样本用户的比例高于或等于预设阈值,则确定所述用户群组的群组类型为所述高流失风险群组;若所述用户群组中属于所述流失类用户的样本用户的比例低于所述预设阈值,则确定所述用户群组的群组类型为所述低流失风险群组。4.根据权利要求3所述的方法,还包括:根据各所述样本用户的用户类型,确定所述样本用户的第一流失率;其中,所述第一流失率指属于所述流失类用户的样本用户占所有样本用户的比率;确定所述第一流失率为所述预设阈值。5.根据权利要求2-4中任一项所述的方法,所述根据所述第一用户群组的群组类型,确定所述待预测用户的流失风险级别,包括:若所述第一用户群组的群组类型为所述高流失风险群组,则确定所述待预测用户的流失风险级别为高流失风险级别;若所述第一用户群组的群组类型为所述低流失风险群组,则确定所述待预测用户的流失风险级别为低流失风险级别。6.根据权利要求1所述的方法,所述根据各所述样本用户的用户特征及用户类型,确定待预测用户的流失风险级别,包括:对各所述样本用户的用户特征及各所述样本用户的用户类型进行训练,得到预测模型;所述预测模型包括所述用户特征对应的样本用户属于所述流失类用户的第一概率,和/或,所述用户特征对应的样本用户属于所述留存类用户的第二概率;将所述待预测用户的用户特征作为所述预测模型的输入数据,确定所述待预测用户的用户特征对应的所述第一概率和/或所述第二概率;根据所述待预测用户的用户特征对应的所述第一概率和/或所述第二概率,确定所述待预测用户的流失风险级别。7.根据权利要求1所述的方法,所述根据所述相关交易信息,确定各所述样本用户的用户特征及用户类型,包括:根据所述相关交易信息,确定各所述样本用户和所述交易方用户之间的交易关系;根据所述交易关系,确定各所述样本用户之间的关联关系;其中,与相同交易方用户具有所述交易关系的多个所述样本用户之间具有所述关联关系;根据各所述样本用户和与其相邻的邻接用户之间的关联关系,确定各所述样本用户的拓扑特征;根据所述拓扑特征确定各所述样本用户的用户特征。8.根据权利要求7所述的方法,所述关联关系包括各所述样本用户之间具有的相同交易方用户的数量;相应的,所述根据各所述样本用户和与其相邻的邻接用户之间的关联关系,确定各所述样本用户的拓扑特征,包括:根据各所述样本用户和与其相邻的邻接用户之间具有的相同交易方用户的数量,确定各所述样本用户和所述邻接用户之间的距离参数值;其中,所述距离参数值与所述样本用户和所述邻接用户之间具有的相同交易方用户的数量成正比;根据所述距离参数值,确定各所述样本用户的拓扑特征。9.根据权利要求7所述的方法,所述确定各所述样本用户的拓扑特征之后,还包括:将所述样本用户的拓扑特征作为输入向量、将所述邻接用户的第二流失率作为输出向量进行训练,以训练出所述样本用户的流失相关特征;其中,所述第二流失率指属于所述流失类用户的所述邻接用户占所有所述邻接用户的比率;相应的,所述根据所述拓扑特征确定各所述样本用户的用户特征,包括:根据所述拓扑特征和/或所述流失相关特征,确定各所述样本用户的用户特征。10.一种用户流失预测装置,包括:获取模块,用于针对多个样本用户,获取各所述样本用户的相关交易信息;其中,所述相关交易信息包括所述样本用户的第一用户信息、与所述样本用户进行交易的交易方用户的第二用户信息、交易时间、交易金额中的至少一项;第一确定模块,用于根据所述相关交易信息,确定各所述样本用户的用户特征及用户类型;其中,所述用户类型包括流失类用户或留存类用户;第二确定模块,用于根据各所述样本用户的用户特征及所用户类型,确定待预测用户的流失...

【专利技术属性】
技术研发人员:肖锦文赵嘉寅周琳
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1