一种流失用户的预测方法、装置、计算设备及介质制造方法及图纸

技术编号:21142292 阅读:23 留言:0更新日期:2019-05-18 05:30
本发明专利技术公开了一种流失用户的预测方法、装置、计算设备及介质,该方法包括:获取用户数据集合,用户数据集合包括多条用户数据;将各用户数据分别输入到流失用户预测模型中进行处理,以预测出用户数据对应用户流失的概率;根据各用户数据对应用户流失的概率,确定流失用户。

【技术实现步骤摘要】
一种流失用户的预测方法、装置、计算设备及介质
本专利技术涉及互联网及大数据处理
,特别涉及一种流失用户的预测方法、装置、计算设备及介质。
技术介绍
随着互联网技术和硬件技术的不断发展,越来越多的人开始使用如智能手机、平板电脑等移动终端设备。同时,移动互联网的广泛普及促使移动应用的发展更加迅猛,用户通过使用移动终端上安装的各类移动应用,进行阅读、聊天、购物等各项活动。对于应用的开发者或提供者而言,考虑到获取应用的新用户的成本,保留现有用户对于最大化获客成本和客户终身价值至关重要。通常,可通过分析应用内的事件来预测用户流失的可能性,并根据预测的可能性积极地与正确的用户进行交流,从而达到降低用户流失率的目的。然而,目前在对流失用户进行预测时,基于的特征只有十几种,如应用打开、设备平台、信息发送、应用版本等,特征类型还不够丰富,预测结果的准确性有待提高,且不能提供流失相关性较高的特征,不便于研发人员或运营人员后期进行流失分析。因此,需要一种新的流失用户的预测方法来优化上述处理过程。
技术实现思路
为此,本专利技术提供一种流失用户的预测方案,以力图解决或者至少缓解上面存在的问题。根据本专利技术的一个方面,提供一种流失用户的预测方法,该方法包括如下步骤:首先,获取用户数据集合,用户数据集合包括多条用户数据;将各用户数据分别输入到流失用户预测模型中进行处理,以预测出用户数据对应用户流失的概率;根据各用户数据对应用户流失的概率,确定流失用户。可选地,在根据本专利技术的流失用户的预测方法中,用户数据包括用户标识、行为特征和属性特征。可选地,在根据本专利技术的流失用户的预测方法中,获取用户数据集合,包括:从应用日志中提取用户标识和应用数据,应用数据包括事件信息、应用信息和设备信息;根据应用数据,确定各用户标识对应的行为特征和属性特征;将用户标识、行为特征和属性特征相应关联,以生成用户数据;汇集各用户数据,以形成用户数据集合。可选地,在根据本专利技术的流失用户的预测方法中,事件信息包括事件名称、事件发生时间和事件时间信息,应用信息包括应用时间信息、应用版本和应用位置信息。可选地,在根据本专利技术的流失用户的预测方法中,根据应用数据,确定各用户标识对应的行为特征和属性特征,包括:通过独热码的编码方式,分别对事件发生时间、应用版本、应用位置信息和设备信息进行编码处理,以生成对应的第一事件时间特征、应用版本特征、位置特征和设备特征;将第一事件时间特征、应用版本特征、位置特征和设备特征,作为用户标识对应的属性特征。可选地,在根据本专利技术的流失用户的预测方法中,根据应用数据,确定各用户标识对应的行为特征和属性特征,包括:根据用户标识和事件名称,确定对应事件的事件发生次数特征;分别对事件时间信息和应用时间信息进行相应转换,以生成对应的第二事件时间特征和应用时间特征;基于第一事件时间特征,确定用户标识对应用户的用户活跃天数特征;将事件发生次数特征、第二事件时间特征、应用时间特征和用户活跃天数特征,作为用户标识对应的行为特征。可选地,在根据本专利技术的流失用户的预测方法中,根据各用户数据对应用户流失的概率,确定流失用户,包括:若用户数据对应用户流失的概率低于第一概率阈值,则将该用户确定为低概率流失用户;若用户数据对应用户流失的概率不低于第一概率阈值,且不高于第二概率阈值,则将该用户确定为中概率流失用户;若用户数据对应用户流失的概率高于第二概率阈值,则将该用户确定为高概率流失用户。可选地,在根据本专利技术的流失用户的预测方法中,流失用户预测模型包括逻辑回归模型。可选地,在根据本专利技术的流失用户的预测方法中,还包括确定流失相关行为特征,确定流失相关行为特征,包括:确定各行为特征对应的拐点值;根据拐点值,计算行为特征对应的标准分数;基于标准分数,对各行为特征进行相应排序;将前第一数量个行为特征作为流失相关行为特征。可选地,在根据本专利技术的流失用户的预测方法中,还包括确定流失相关属性特征,确定流失相关属性特征,包括:对各属性特征,计算属性特征对应用户流失的概率与平均用户流失概率的差值;计算属性特征对应用户的数量与用户总数的比值;基于差值和比值,对各属性特征进行相应排序;将前第二数量个属性特征作为流失相关属性特征。根据本专利技术的又一个方面,提供一种流失用户的预测装置,该装置包括获取模块、预测模块和确定模块。其中,获取模块适于获取用户数据集合,用户数据集合包括多条用户数据;预测模块适于将各用户数据分别输入到流失用户预测模型中进行处理,以预测出用户数据对应用户流失的概率;确定模块适于根据各用户数据对应用户流失的概率,确定流失用户。可选地,在根据本专利技术的流失用户的预测装置中,用户数据包括用户标识、行为特征和属性特征。可选地,在根据本专利技术的流失用户的预测装置中,获取模块进一步适于从应用日志中提取用户标识和应用数据,应用数据包括事件信息、应用信息和设备信息;根据应用数据,确定各用户标识对应的行为特征和属性特征;将用户标识、行为特征和属性特征相应关联,以生成用户数据;汇集各用户数据,以形成用户数据集合。可选地,在根据本专利技术的流失用户的预测装置中,事件信息包括事件名称、事件发生时间和事件时间信息,应用信息包括应用时间信息、应用版本和应用位置信息。可选地,在根据本专利技术的流失用户的预测装置中,获取模块进一步适于通过独热码的编码方式,分别对事件发生时间、应用版本、应用位置信息和设备信息进行编码处理,以生成对应的第一事件时间特征、应用版本特征、位置特征和设备特征;将第一事件时间特征、应用版本特征、位置特征和设备特征,作为用户标识对应的属性特征。可选地,在根据本专利技术的流失用户的预测装置中,获取模块进一步适于根据用户标识和事件名称,确定对应事件的事件发生次数特征;分别对事件时间信息和应用时间信息进行相应转换,以生成对应的第二事件时间特征和应用时间特征;基于第一事件时间特征,确定用户标识对应用户的用户活跃天数特征;将事件发生次数特征、第二事件时间特征、应用时间特征和用户活跃天数特征,作为用户标识对应的行为特征。可选地,在根据本专利技术的流失用户的预测装置中,确定模块进一步适于当用户数据对应用户流失的概率低于第一概率阈值时,将该用户确定为低概率流失用户;当用户数据对应用户流失的概率不低于第一概率阈值,且不高于第二概率阈值时,将该用户确定为中概率流失用户;当用户数据对应用户流失的概率高于第二概率阈值时,将该用户确定为高概率流失用户。可选地,在根据本专利技术的流失用户的预测装置中,流失用户预测模型包括逻辑回归模型。可选地,在根据本专利技术的流失用户的预测装置中,确定模块还适于确定流失相关行为特征,进一步适于确定各行为特征对应的拐点值;根据拐点值,计算行为特征对应的标准分数;基于标准分数,对各行为特征进行相应排序;将前第一数量个行为特征作为流失相关行为特征。可选地,在根据本专利技术的流失用户的预测装置中,确定模块还适于确定流失相关属性特征,进一步适于对各属性特征,计算属性特征对应用户流失的概率与平均用户流失概率的差值;计算属性特征对应用户的数量与用户总数的比值;基于差值和比值,对各属性特征进行相应排序;将前第二数量个属性特征作为流失相关属性特征。根据本专利技术的又一个方面,提供一种计算设备,包括一个或多个处理器、存储器以及一个或多本文档来自技高网...

【技术保护点】
1.一种流失用户的预测方法,包括:获取用户数据集合,所述用户数据集合包括多条用户数据;将各用户数据分别输入到流失用户预测模型中进行处理,以预测出所述用户数据对应用户流失的概率;根据各用户数据对应用户流失的概率,确定流失用户。

【技术特征摘要】
1.一种流失用户的预测方法,包括:获取用户数据集合,所述用户数据集合包括多条用户数据;将各用户数据分别输入到流失用户预测模型中进行处理,以预测出所述用户数据对应用户流失的概率;根据各用户数据对应用户流失的概率,确定流失用户。2.如权利要求1所述的方法,其中,所述用户数据包括用户标识、行为特征和属性特征。3.如权利要求1或2所述的方法,其中,所述获取用户数据集合,包括:从应用日志中提取用户标识和应用数据,所述应用数据包括事件信息、应用信息和设备信息;根据所述应用数据,确定各用户标识对应的行为特征和属性特征;将所述用户标识、行为特征和属性特征相应关联,以生成用户数据;汇集各用户数据,以形成用户数据集合。4.如权利要求3所述的方法,其中,所述事件信息包括事件名称、事件发生时间和事件时间信息,所述应用信息包括应用时间信息、应用版本和应用位置信息。5.如权利要求4所述的方法,其中,所述根据所述应用数据,确定各用户标识对应的行为特征和属性特征,包括:通过独热码的编码方式,分别对所述事件发生时间、应用版本、应用位置信息和设备信息进行编码处理,以生成对应的第一事件时间特征、应用版本特征、位置特征和设备特征;将所述第一事件时间特征、应用版本特征、位置特征和设备特征,作为所述用户标识对应的属性特征。6.如权利要求5所述的方法,其中,所述根据所述应用数据,确定各用户标识对应的行为特征和属性特征,包括:根据所述用户标识和所述事件名称,确定对应事件的事件发生次数特征;分别对所述事件时间...

【专利技术属性】
技术研发人员:张小艳
申请(专利权)人:北京腾云天下科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1