一种流失用户预测方法、装置及计算机可读存储介质制造方法及图纸

技术编号:31569740 阅读:20 留言:0更新日期:2021-12-25 11:09
本发明专利技术实施例公开了一种流失用户预测方法、装置及计算机可读存储介质。该方法包括:获取预测模型和待测数据,预测模型是采用极端梯度提升XGBoost算法训练得到的,待测数据为目标用户的用户数据,用户数据至少包括用户标识ID、用户在第一预设时长内的登录数据和在第二预设时长内的登录数据,第一预设时长短于第二预设时长;将待测数据输入预测模型,输出测试结果,测试结果用于指示目标用户是否会成为第一预设时长的流失用户。本发明专利技术提供的方案能够高效、准确地预测目标用户是否会成为流失用户,为后续的用户分析提供基础。为后续的用户分析提供基础。为后续的用户分析提供基础。

【技术实现步骤摘要】
一种流失用户预测方法、装置及计算机可读存储介质


[0001]本专利技术涉及数据处理
,尤其涉及一种流失用户预测方法、装置及计算机可读存储介质。

技术介绍

[0002]随着电子竞技行业的发展和越来越多的游戏出现,许多爆款游戏会拥有大量的游戏玩家。为了延长玩家的游戏生命周期,游戏开发者希望能够根据玩家的行为来预测其是否会流失。而数据作为记载大量信息的载体,在如今的网络和大数据时代的重要性不容置疑。因此,如何利用游戏玩家的用户数据进行精准、快速的预测成为当前游戏开发者亟需解决的问题。

技术实现思路

[0003]为解决上述技术问题,本专利技术实施例期望提供一种流失用户预测方法、装置及计算机可读存储介质,能够高效、准确地预测目标用户是否会成为流失用户,为后续的用户分析提供基础。
[0004]本专利技术的技术方案是这样实现的:
[0005]第一方面,本专利技术实施例提供一种流失用户预测方法,包括:
[0006]获取预测模型和待测数据,预测模型是采用极端梯度提升XGBoost算法训练得到的,待测数据为目标用户的用户数据,用户数据至少包括用户标识ID、用户在第一预设时长内的登录数据和在第二预设时长内的登录数据,第一预设时长短于第二预设时长;
[0007]将待测数据输入预测模型,输出测试结果,测试结果用于指示目标用户是否会成为第一预设时长的流失用户。
[0008]可选的,登陆数据包括以下数据中的至少一项:在线时长、登陆天数、登陆次数、付费次数、付费金额、游戏次数、胜利次数、游戏时长、游戏天数。
[0009]可选的,用户数据还包括以下数据中的至少一项:用户级别、总在线时长、首次登陆距离当前时刻的天数、最后一次登陆距离当前时刻的天数、首次付费距离当前时刻的天数、最后一次付费距离当前时刻的天数。
[0010]可选的,获取预测模型,包括:
[0011]获取历史数据集,历史数据集包括多个历史用户的用户数据;
[0012]调用分离器函数,将历史数据集划分为历史训练数据和历史测试数据;
[0013]采用XGBoost算法构建初始训练模型,并利用历史训练数据对初始训练模型进行模型训练,得到预测模型。
[0014]可选的,在利用历史训练数据对初始训练模型进行模型训练后,还包括:
[0015]利用历史测试数据对训练后的初始训练模型进行预测验证;
[0016]若验证通过,则将训练后的初始训练模型作为预测模型;
[0017]若验证不通过,则返回执行“利用历史训练数据对初始训练模型进行模型训练”的
步骤,直至验证通过为止。
[0018]可选的,在获取历史数据集后,还包括:
[0019]对历史数据集进行数据预处理,数据预处理包括缺值填补、异常数据修正、数据格式转换、冗余数据剔除中的至少一种。
[0020]可选的,历史训练数据和历史测试数据的比例为7:3。
[0021]可选的,当测试结果为第一标识时,表示目标用户不会成为第一预设时长的流失用户;当测试结果为第二标识时,表示目标用户会成为第一预设时长的流失用户;其中,
[0022]第一标识为0,第二标识为1;或者,
[0023]第一标识为1,第二标识为0。
[0024]可选的,第二预设时长为14天,第一预设时长为7天。
[0025]第二方面,本专利技术实施例提供了一种流失用户预测装置,包括:处理器,处理器用于在执行计算机程序时实现具有上述第一方面任一特征的流失用户预测方法。
[0026]第三方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现具有上述第一方面任一特征的流失用户预测方法。
[0027]本专利技术实施例提供了一种流失用户预测方法、装置及计算机可读存储介质。通过极端梯度提升XGBoost算法构建预测模型,并采用预测模型对目标用户进行预测,输出该目标用户是否会成为第一预设时长的流失用户的测试结果。从而高效、准确地预测目标用户是否会成为流失用户,为后续的用户分析提供基础,如对预测的将要流失的用户实施有针对性的挽留措施、提升游戏用户的游戏生命周期等,以使得游戏生态更加有活力。
附图说明
[0028]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0029]图1为本专利技术实施例一提供的一种流失用户预测方法的流程示意图;
[0030]图2为本专利技术实施例二提供的一种流失用户预测方法的流程示意图;
[0031]图3为本专利技术实施例三提供的一种流失用户预测装置的结构示意图;
[0032]图4为本专利技术实施例四提供的一种流失用户预测装置的结构示意图。
具体实施方式
[0033]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0034]需要说明的是,本专利技术中术语“系统”和“网络”在本文中常被可互换使用。本专利技术的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于限定特定顺序。
[0035]还需要说明是,本专利技术下述各个实施例可以单独执行,各个实施例之间也可以相
互结合执行,本专利技术实施例对此不作具体限制。
[0036]下面,对流失用户预测方法、装置及其技术效果进行详细描述。
[0037]实施例一
[0038]图1为本专利技术实施例一提供的一种流失用户预测方法的流程示意图,本专利技术实施例公开的方法适用于流失用户预测装置(如计算机设备等)。如图1所示,该方法可以包括如下步骤:
[0039]S110、获取预测模型和待测数据,预测模型是采用极端梯度提升XGBoost算法训练得到的,待测数据为目标用户的用户数据,用户数据至少包括用户标识ID、用户在第一预设时长内的登录数据和在第二预设时长内的登录数据,第一预设时长短于第二预设时长。
[0040]极端梯度提升XGBoost算法是一种经典的集成式分类算法,是基于梯度提升决策树(Gradient Boosting DecisionTree,GBDT)算法的一种优化。与传统的GBDT算法相比,XGBoost算法具有训练效率高、预测效果好、可控参数多、使用方便等特性,是大数据分析领域的一柄利器。本专利技术采用XGBoost算法训练预测模型,能够高效、准确地预测目标用户是否会成为流失用户,为后续的用户分析提供基础。
[0041]具体的,采用极端梯度提升XGBoost算法训练预测模型的步骤可以参考下述实施例二的内容,此处不再赘述。
[0042]在一实施例中,用户(包括目标用户本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种流失用户预测方法,其特征在于,包括:获取预测模型和待测数据,所述预测模型是采用极端梯度提升XGBoost算法训练得到的,所述待测数据为目标用户的用户数据,所述用户数据至少包括用户标识ID、用户在第一预设时长内的登录数据和在第二预设时长内的登录数据,所述第一预设时长短于所述第二预设时长;将所述待测数据输入所述预测模型,输出测试结果,所述测试结果用于指示所述目标用户是否会成为第一预设时长的流失用户。2.根据权利要求1所述的流失用户预测方法,其特征在于,所述用户数据还包括以下数据中的至少一项:用户级别、总在线时长、首次登陆距离当前时刻的天数、最后一次登陆距离当前时刻的天数、首次付费距离当前时刻的天数、最后一次付费距离当前时刻的天数。3.根据权利要求1所述的流失用户预测方法,其特征在于,所述获取预测模型,包括:获取历史数据集,所述历史数据集包括多个历史用户的用户数据;调用分离器函数,将所述历史数据集划分为历史训练数据和历史测试数据;采用所述XGBoost算法构建初始训练模型,并利用所述历史训练数据对所述初始训练模型进行模型训练,得到所述预测模型。4.根据权利要求3所述的流失用户预测方法,其特征在于,在利用所述历史训练数据对所述初始训练模型进行模型训练后,还包括:利用所述历史测试数据对训练后的所述初始训练模型进行预测验证;若验证通过,则将训练后的所述...

【专利技术属性】
技术研发人员:黄晓鑫
申请(专利权)人:杭州电魂网络科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1