用户流失预测方法、装置及电子设备制造方法及图纸

技术编号:20869032 阅读:23 留言:0更新日期:2019-04-17 09:51
本发明专利技术涉及用户流失预测方法、装置及电子设备。用户流失预测方法,包括:获取目标产品对应的用户历史活跃记录,并基于用户历史活跃记录确定流失判断周期;基于流失判断周期在目标产品的历史使用时段中选取目标时段,获取目标时段内的样本用户集合;根据样本用户集合对目标机器学习模型进行训练,获得对应的流失概率预测模型;基于流失判断周期在历史使用时段中选取预测数据获取时段,使得预测数据获取时段的时长等于流失判断周期,并获得预测数据获取时段内的待预测用户的特征数据;基于待预测用户的特征数据和流失概率预估模型,获得针对待预测用户的用户流失预测结果。所述用户流失预测方法能高效快捷的获得用户流失预测结果,且预测效果较佳。

【技术实现步骤摘要】
用户流失预测方法、装置及电子设备
本专利技术涉及互联网产品
,具体而言,涉及一种用户流失预测方法、装置及电子设备。
技术介绍
在互联网产品领域,用户生命周期是指用户从对产品产生兴趣开始使用到停止使用且不再关注产品的全过程。在该领域,用户生命周期有可能很短,因为互联网产品用户在每一个过程中都有可能直接走向流失。因此,互联网产品运营商几乎都需要制定针对自己产品的流失用户召回策略。但现有技术中,仍然没有较为可靠的方法确定流失用户,故而制定的流失用户召回策略便没有较强的针对性,进而无法保证流失用户的召回效果。因此,如何准确高效的预测流失用户,使得互联网产品运营商制定的流失用户召回策略能够有的放矢,从而增强流失用户的召回效果,成为互联网产品
亟待解决的技术难题。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供一种用户流失预测方法、装置及电子设备,以有效改善上述问题。本专利技术实施例提供的用户流失预测方法,包括:获取目标产品对应的用户历史活跃记录,并基于所述用户历史活跃记录确定出流失判断周期;基于所述流失判断周期在所述目标产品的历史使用时段中选取目标时段,获取所述目标时段内的样本用户集合;利用所述样本用户集合对目标机器学习模型进行训练,获得对应的流失概率预测模型;基于所述流失判断周期在所述历史使用时段中选取预测数据获取时段,使得所述预测数据获取时段的时长等于所述流失判断周期,并获得所述预测数据获取时段内的待预测用户的特征数据;基于待预测用户的特征数据和所述流失概率预估模型,获得针对所述待预测用户的用户流失预测结果。进一步地,所述获取目标产品对应的用户历史活跃记录,并基于所述用户历史活跃记录确定出流失判断周期,包括:基于所述用户历史活跃记录,获得所述历史使用时段内的用户累计留存率变化曲线;基于所述用户累计留存率变化曲线获得所述流失判断周期。进一步地,所述基于所述用户累计留存率变化曲线获得所述流失判断周期,包括:从所述历史使用时段的起始时间点,按照预设时间步长获取N个待分析时段,所述N个待分析时段具有相同时长,其中,N≥2,且为正整数;分别将每个待分析时段的截至时间点对应的累计留存率与起始时间点对应的累计留存率相减,得到对应的留存率差值;将N个待分析时段对应的留存率差值与预设阈值进行对比,确定出小于或等于所述预设阈值的M个留存率差值,其中,M≤N,且为正整数;从所述M个留存率差值中确定出数值最大的留存率差值,作为目标留存率差值;将所述历史使用时段的起始时间点到所述目标留存率差值对应的起始时间点的间隔时长作为所述用户流失周期。进一步地,所述基于所述流失判断周期在所述目标产品的历史使用时段中选取目标时段,获取所述目标时段内的样本用户集合,包括:基于流失判断周期在所述目标产品的历史使用时段中选取第一目标时段和位于所述第一目标时段之后的第二目标时段,使得所述第一目标时段内的时长和所述第二目标时段内的时长都等于所述流失判断周期;获得所述样本用户集合中的各个样本用户在所述第一目标时段中的特征数据;根据所述第二目标时段中所述目标产品对应的用户历史活跃记录确定出样本用户集合中的各个样本用户的流失判定标签,所述流失判定标签包括未流失标签和已流失标签,其中,所述未流失标签用于表征对应的样本用户不具有流失倾向,所述已流失标签用于表征对应的样本用户具有流失倾向。进一步地,所述利用所述样本用户集合对目标机器学习模型进行训练,获得对应的流失概率预测模型,包括:利用所述样本用户集合中的各个样本用户的特征数据和所述样本用户集合中的各个样本用户的流失判定标签对所述目标机器学习模型进行训练,获得所述流失概率预测模型。进一步地,所述目标机器学习模型具有两个以上;所述利用所述样本用户集合对目标机器学习模型进行训练,获得对应的流失概率预测模型,包括:将所述样本用户集合划分为训练集和测试集;利用所述训练集中的各个样本用户的特征数据和所述训练集中的各个样本用户的流失判定标签对两个以上所述目标机器学习模型进行训练,获得两个以上的训练模型;利用所述测试集分别对所述两个以上的训练模型进行测试,得到对应的测试结果;利用预设判定指标对所述两个以上的训练模型对应的测试结果进行评估,获得评估结果最好的训练模型,作为所述流失概率预测模型。本专利技术实施例提供的用户流失预测装置,包括:流失判断周期获取模块,用于获取目标产品对应的用户历史活跃记录,并基于所述用户历史活跃记录确定出流失判断周期;样本用户集合获取模块,用于基于所述流失判断周期在所述目标产品的历史使用时段中选取目标时段,获取所述目标时段内的样本用户集合;流失概率预测模型获取模块,用于利用所述样本用户集合对目标机器学习模型进行训练,获得对应的流失概率预测模型;特征数据获取模块,用于基于所述流失判断周期在所述历史使用时段中选取预测数据获取时段,使得所述预测数据获取时段的时长等于所述流失判断周期,并获得所述预测数据获取时段内的待预测用户的特征数据;用户流失预测结果获取模块,用于基于待预测用户的特征数据和所述流失概率预估模型,获得针对所述待预测用户的用户流失预测结果。进一步地,所述流失判断周期获取模块,具体用于:基于所述用户历史活跃记录,获得所述历史使用时段内的用户累计留存率变化曲线;基于所述用户累计留存率变化曲线获得所述流失判断周期。进一步地,所述流失判断周期获取模块,又具体用于:从所述历史使用时段的起始时间点,按照预设时间步长获取N个待分析时段,所述N个待分析时段具有相同时长,其中,N≥2,且为正整数;分别将每个待分析时段的截至时间点对应的累计留存率与起始时间点对应的累计留存率相减,得到对应的留存率差值;将N个待分析时段对应的留存率差值与预设阈值进行对比,确定出小于或等于所述预设阈值的M个留存率差值,其中,M≤N,且为正整数;从所述M个留存率差值中确定出数值最大的留存率差值,作为目标留存率差值;将所述历史使用时段的起始时间点到所述目标留存率差值对应的起始时间点的间隔时长作为所述用户流失周期。进一步地,所述样本用户集合获取模块,具体用于:基于流失判断周期在所述目标产品的历史使用时段中选取第一目标时段和位于所述第一目标时段之后的第二目标时段,使得所述第一目标时段内的时长和所述第二目标时段内的时长都等于所述流失判断周期;获得所述样本用户集合中的各个样本用户在所述第一目标时段中的特征数据;根据所述第二目标时段中所述目标产品对应的用户历史活跃记录确定出样本用户集合中的各个样本用户的流失判定标签,所述流失判定标签包括未流失标签和已流失标签,其中,所述未流失标签用于表征对应的样本用户不具有流失倾向,所述已流失标签用于表征对应的样本用户具有流失倾向。进一步地,所述流失概率预测模型获取模块,具体用于:利用所述样本用户集合中的各个样本用户的特征数据和所述样本用户集合中的各个样本用户的流失判定标签对所述目标机器学习模型进行训练,获得所述流失概率预测模型。进一步地,所述目标机器学习模型具有两个以上;所述流失概率预测模型获取模块,具体用于:将所述样本用户集合划分为训练集和测试集;利用所述训练集中的各个样本用户的特征数据和所述训练集中的各个样本用户的流失判定标签对两个以上所述目标机器学习模型进行训练,获得两个以上的训练模型;利用所述测试集本文档来自技高网...

【技术保护点】
1.一种用户流失预测方法,其特征在于,包括:获取目标产品对应的用户历史活跃记录,并基于所述用户历史活跃记录确定出流失判断周期;基于所述流失判断周期在所述目标产品的历史使用时段中选取目标时段,获取所述目标时段内的样本用户集合;利用所述样本用户集合对目标机器学习模型进行训练,获得对应的流失概率预测模型;基于所述流失判断周期在所述历史使用时段中选取预测数据获取时段,使得所述预测数据获取时段的时长等于所述流失判断周期,并获得所述预测数据获取时段内的待预测用户的特征数据;基于待预测用户的特征数据和所述流失概率预估模型,获得针对所述待预测用户的用户流失预测结果。

【技术特征摘要】
1.一种用户流失预测方法,其特征在于,包括:获取目标产品对应的用户历史活跃记录,并基于所述用户历史活跃记录确定出流失判断周期;基于所述流失判断周期在所述目标产品的历史使用时段中选取目标时段,获取所述目标时段内的样本用户集合;利用所述样本用户集合对目标机器学习模型进行训练,获得对应的流失概率预测模型;基于所述流失判断周期在所述历史使用时段中选取预测数据获取时段,使得所述预测数据获取时段的时长等于所述流失判断周期,并获得所述预测数据获取时段内的待预测用户的特征数据;基于待预测用户的特征数据和所述流失概率预估模型,获得针对所述待预测用户的用户流失预测结果。2.根据权利要求1所述的用户流失预测方法,其特征在于,所述获取目标产品对应的用户历史活跃记录,并基于所述用户历史活跃记录确定出流失判断周期,包括:基于所述用户历史活跃记录,获得所述历史使用时段内的用户累计留存率变化曲线;基于所述用户累计留存率变化曲线获得所述流失判断周期。3.根据权利要求2所述的用户流失预测方法,其特征在于,所述基于所述用户累计留存率变化曲线获得所述流失判断周期,包括:从所述历史使用时段的起始时间点,按照预设时间步长获取N个待分析时段,所述N个待分析时段具有相同时长,其中,N≥2,且为正整数;分别将每个待分析时段的截至时间点对应的累计留存率与起始时间点对应的累计留存率相减,得到对应的留存率差值;将N个待分析时段对应的留存率差值与预设阈值进行对比,确定出小于或等于所述预设阈值的M个留存率差值,其中,M≤N,且为正整数;从所述M个留存率差值中确定出数值最大的留存率差值,作为目标留存率差值;将所述历史使用时段的起始时间点到所述目标留存率差值对应的起始时间点的间隔时长作为所述用户流失周期。4.根据权利要求1所述的用户流失预测方法,其特征在于,所述基于所述流失判断周期在所述目标产品的历史使用时段中选取目标时段,获取所述目标时段内的样本用户集合,包括:基于流失判断周期在所述目标产品的历史使用时段中选取第一目标时段和位于所述第一目标时段之后的第二目标时段,使得所述第一目标时段内的时长和所述第二目标时段内的时长都等于所述流失判断周期;获得所述样本用户集合中的各个样本用户在所述第一目标时段中的特征数据;根据所述第二目标时段中所述目标产品对应的用户历史活跃记录确定出样本用户集合中的各个样本用户的流失判定标签,所述流失判定标签包括未流失标签和已流失标签,其中,所述未流失标签用于表征对应的样本用户不具有流失倾向,所述已流失标签用...

【专利技术属性】
技术研发人员:冯晓明颜培英李倩倩许纬东
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1