一种基于手机游戏商店的用户流失预测方法及系统技术方案

技术编号:17098179 阅读:25 留言:0更新日期:2018-01-21 10:22
本发明专利技术提供一种基于手机游戏商店的用户流失预测方法及系统,包括以下步骤:从服务器日志中采集用户的基本信息、行为信息和游戏信息,并分为训练集用户和预测集用户;对训练集用户建立流失用户标签,并对原始数据进行预处理;对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行特征提取、选择及规范化;根据训练集用户的特征和流失用户标签,训练梯度提升决策树算法得到用户流失预测模型;根据预测集用户的特征,通过用户流失预测模型识别出手机游戏商店的流失用户。本发明专利技术基于手机游戏商店的业务场景,能够快速准确识别潜在流失用户,为手机游戏商店及时召回流失用户提供决策支持。

A method and system for prediction of user loss based on mobile game store

The present invention provides a method and system for predicting user loss based on mobile phone game store, which comprises the following steps: collecting the user from the server log in the basic information, behavioral information and game information, and divided into a training set and prediction set user user; the training set users to establish the loss of the user label, and the original data pretreatment; the training set and prediction set the user's basic information, user behavior information and game information for feature extraction, selection and standardization; according to the training set user's characteristics and the loss of the user label, training gradient boosted decision tree algorithm prediction model for customer churn prediction set; according to the characteristics of the user, through the prediction model to identify loss the user mobile phone game store user loss. Based on the business scenario of mobile game store, the invention can identify potential loss users quickly and accurately, and provide decision support for mobile game shops to recalling the loss customers in time.

【技术实现步骤摘要】
一种基于手机游戏商店的用户流失预测方法及系统
本专利技术涉及网络数据挖掘
,具体是涉及一种基于手机游戏商店的用户流失预测方法及系统。
技术介绍
近年来,随着移动通信设备的普及与发展,手机游戏市场在全球范围持续稳定快速增长。手机游戏商店,作为用户手机游戏入口,一直是手机游戏商家的战略部署重地。在此前提下,手机游戏商店行业竞争白热化,各手机游戏商店面临用户流失严峻形势;而且,留住现有用户往往能比引入新用户产生更大利润。因此,对于日趋饱和的手机游戏商店行业,建立有效的用户流失预测分析机制,能为手机游戏商店的用户留存、乃至市场份额的占据与扩张提供决策支持,商业意义重大。另一方面,有效用户流失预测分析机制的建立,必须基于对具体业务场景的精准理解。目前存在的游戏业务场景下的用户流失预测研究虽然类目繁多,针对的游戏类型从大型多人对战游戏到休闲游戏应有尽有,但都是仅针对单一游戏的分析。而基于手机游戏商店的用户流失预测分析,需要研究多种游戏类型下的用户行为,也就是说,多了“游戏”维度,其业务场景及相应特征工程的复杂度及建模的难度大大增加。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提供了一种有效的基于手机游戏商店的用户流失预测方法及系统。本专利技术通过以下的方案实现:一种基于手机游戏商店的用户流失预测方法,包括以下步骤:S1:从服务器日志中采集训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签,并对原始数据进行预处理;S2:对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行特征提取、选择及规范化;S3:根据训练集用户的特征和流失用户标签,训练梯度提升决策树算法得到用户流失预测模型;S4:根据预测集用户的特征,通过用户流失预测模型识别出手机游戏商店的流失用户。本专利技术提出一种基于手机游戏商店的用户流失预测方法及系统。该方法及系统基于流失用户的定义,结合手机游戏商店的业务场景,提取服务器日志的用户数据作为用户基础特征、用户行为特征和用户游戏特征,训练并建立最优梯度提升决策树算法模型识别未来一段时间内的流失用户。本专利技术能够根据手机游戏商店的实际业务场景进行自调整,快速准确识别手机游戏商店的潜在流失用户,为手机游戏商店及时召回潜在流失用户提供决策支持,解决了市场日趋饱和的手机游戏商店行业预测流失用户的急切需求。同时,本专利技术还弥补了现有技术中基于手机游戏商店的用户流失预测技术的空缺。作为本专利技术的进一步改进,所述步骤S1中具体包括:S11:根据需要进行用户流失预测的时间段,从服务器日志中采集对应时间段的训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签;S12:对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行数据清洗,包括剔除异常用户和用户的无效事件。作为本专利技术的进一步改进,所述流失用户的定义为:前n天上线的用户中,在后m天内未达到活跃条件的用户记为流失用户,其中活跃条件为用户的已发生事件总数大于j并且活跃时间大于k天;其中,n、m、j和k为可调参数。作为本专利技术的进一步改进,所述步骤S2中具体包括:S21:基于训练集用户和预测集用户的基本信息和游戏信息,提取基本特征和游戏特征;S22:基于训练集用户的行为信息,提取行为特征;S23:根据训练集用户的流失用户标签,对训练集用户的行为特征进行特征选择,获取关键行为特征;S24:基于训练集用户的关键行为特征和预测集用户的行为信息,提取预测集用户的关键行为特征;S25:规范化训练集用户和预测集用户的基本特征、游戏特征和关键行为特征。作为本专利技术的进一步改进,所述S3具体为:通过设定考核指标,并采用K折交叉验证法获取最优用户流失预测模型。作为本专利技术的进一步改进,所述考核指标包括精确率和召回率;所述精确率指预测为流失用户中实际为流失用户的概率,所述召回率指实际为流失用户中预测为流失用户的概率。作为本专利技术的进一步改进,所述步骤S4具体为:以预测集用户的特征为输入变量,通过所述用户流失预测模型,输出用户的流失概率;若流失概率大于设定阈值,则标签为流失用户。本专利技术还提供了一种基于手机游戏商店的用户流失预测系统,其包括数据采集及预处理模块,用于从服务器日志中采集训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签,并对原始数据进行预处理;特征提取、选择及规范化模块,用于对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行特征提取、选择及规范化;训练模块,用于根据训练集用户的特征和流失用户标签,训练梯度提升决策树算法得到用户流失预测模型;预测模块,用于根据预测集用户的特征,通过用户流失预测模型识别出手机游戏商店的流失用户。作为本专利技术的进一步改进,所述数据采集及预处理模块包括:数据采集子模块,用于根据需要进行用户流失预测的时间段,从服务器日志中采集对应时间段的训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签;预处理子模块,用于对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行数据清洗,包括剔除异常用户和用户的无效事件。作为本专利技术的进一步改进,所述流失用户为:前n天上线的用户中,在后m天内未达到活跃条件的用户记为流失用户,其中活跃条件为用户的已发生事件总数大于j并且活跃时间大于k天;其中,n、m、j和k为设定的参数。作为本专利技术的进一步改进,所述特征提取、选择及规范化模块具体包括:基本特征和游戏特征提取子模块,用于基于训练集用户和预测集用户的基本信息和游戏信息,提取基本特征和游戏特征;关键行为特征选择及提取子模块,用于基于训练集用户的行为信息,提取行为特征;根据训练集用户的流失用户标签,对训练集用户的行为特征进行选择,获取关键行为特征;基于训练集用户的关键行为特征和预测集用户的行为信息,提取预测集用户的关键行为特征;特征规范化子模块,用于规范化训练集用户和预测集用户的基本特征、游戏特征和关键行为特征。作为本专利技术的进一步改进,所述训练模块具体为:通过设定考核指标,并采用K折交叉验证法获取最优用户流失预测模型。作为本专利技术的进一步改进,所述考核指标包括精确率和召回率;所述精确率为预测为流失用户中实际为流失用户的概率,所述召回率为实际为流失用户中预测为流失用户的概率。作为本专利技术的进一步改进,所述预测模块具体为:以预测集用户的特征为输入变量,通过所述用户流失预测模型,输出用户的流失概率;若流失概率大于设定阈值,则标签为流失用户。综上所述,本专利技术相比于现有技术,具备以下效果:1、本专利技术通过提取服务器日志的用户数据作为用户基础特征、用户行为特征和用户游戏特征,训练并建立最优梯度提升决策树算法模型,能够快速准确地识别未来一段时间内手机游戏商店的潜在流失用户。2、本专利技术提出流失用户可结合手机游戏商店的复杂场景进行定义,使模型能够灵活反映当前实际应用情形,预测准确率更高。3、本专利技术提出的基于手机游戏商店的用户流失预测模型可根据手机游戏商店的实际业务场景进行自调整,对用户行为特征进实时选择以及实时训练最优梯度提升决策树模型,灵活度高,并且能够实时识别流失用户。为了更好地理解和实施,下面结合附图详细说明本专利技术。附图说明图1是本专利技术的基于手机游戏商店的用户流失本文档来自技高网...
一种基于手机游戏商店的用户流失预测方法及系统

【技术保护点】
一种基于手机游戏商店的用户流失预测方法,其特征在于,包括以下步骤:S1:从服务器日志中采集训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签,并对原始数据进行预处理;S2:对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行特征提取、选择及规范化;S3:根据训练集用户的特征和流失用户标签,训练梯度提升决策树算法得到用户流失预测模型;S4:根据预测集用户的特征,通过用户流失预测模型识别出手机游戏商店的流失用户。

【技术特征摘要】
1.一种基于手机游戏商店的用户流失预测方法,其特征在于,包括以下步骤:S1:从服务器日志中采集训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签,并对原始数据进行预处理;S2:对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行特征提取、选择及规范化;S3:根据训练集用户的特征和流失用户标签,训练梯度提升决策树算法得到用户流失预测模型;S4:根据预测集用户的特征,通过用户流失预测模型识别出手机游戏商店的流失用户。2.根据权利要求1所述基于手机游戏商店的用户流失预测方法,其特征在于,所述步骤S1中具体包括:S11:根据需要进行用户流失预测的时间段,从服务器日志中采集对应时间段的训练集用户和预测集用户的基本信息、行为信息和游戏信息,并对训练集用户建立流失用户标签;所述流失用户的定义为:前n天上线的用户中,在后m天内未达到活跃条件的用户记为流失用户,其中活跃条件为用户的已发生事件总数大于j并且活跃时间大于k天;其中,n、m、j和k为可调的参数;S12:对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行数据清洗,包括剔除异常用户和用户的无效事件。3.根据权利要求1所述基于手机游戏商店的用户流失预测方法,其特征在于,所述步骤S2中具体包括:S21:基于训练集用户和预测集用户的基本信息和游戏信息,提取基本特征和游戏特征;S22:基于训练集用户的行为信息,提取行为特征;S23:根据训练集用户的流失用户标签,对训练集用户的行为特征进行特征选择,获取关键行为特征;S24:基于训练集用户的关键行为特征和预测集用户的行为信息,提取预测集用户的关键行为特征;S25:规范化训练集用户和预测集用户的基本特征、游戏特征和关键行为特征。4.根据权利要求1所述基于手机游戏商店的用户流失预测方法,其特征在于,所述S3具体为:通过设定考核指标,并采用K折交叉验证法获取最优用户流失预测模型;所述考核指标包括精确率和召回率;所述精确率指预测为流失用户中实际为流失用户的概率,所述召回率指实际为流失用户中预测为流失用户的概率。5.根据权利要求1所述基于手机游戏商店的用户流失预测方法,其特征在于,所述步骤S4具体为:以预测集用户的特征为输入变量,通过所述用户流失预测模型,输出用户的流失概率;若流失概率大于设定阈值,则标签为流失用户。6.一种基于手机游戏商店的用户流失预测系统,其特征在于,包括:数据采集及预处...

【专利技术属性】
技术研发人员:刘冶刘宇琛彭楠陈宇恒杨泽锋印鉴
申请(专利权)人:广州赫炎大数据科技有限公司中山大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1