本发明专利技术提供一种基于集成学习的预测方法、预测系统和可读存储介质,所述预测方法包括:对获取的至少一个用户的日志数据进行分析处理,确定至少一个用户中的目标用户的至少一个相关特征向量;将目标用户的至少一个相关特征向量分别输入至少一个预训练好的子模型中,相应地得到目标用户的至少一个训练结果子向量;将得到的至少一个训练结果子向量输入预训练好的集成学习模型中,得到目标用户的训练结果预测向量,从而得到目标用户的付费预测值;以及将目标用户的付费预测值与预设付费阈值进行对比,确定付费预测值大于或等于预设付费阈值的目标用户为高概率付费用户。通过本发明专利技术大大提高了预测目标用户的概率。
Prediction method, prediction system and readable storage medium based on Integrated Learning
【技术实现步骤摘要】
基于集成学习的预测方法、预测系统和可读存储介质
本专利技术涉及计算机领域,具体涉及一种基于集成学习的预测方法、预测系统和可读存储介质。
技术介绍
当前,国内广告商买流量,通常是基于“人工经验”,筛选目标玩家。这种筛选目标玩家的方式在市场中沿用多年,在早期有着不错的成效。但是随着时间的推移,用“人工经验”筛选的目标玩家,从这些目标玩家中确定未来会付费的玩家的效果越来越低低,这从而说明基于“人工经验”的筛选策略在逐渐失效。例如:现有专利CN201811317641.4基于BP神经网络的游戏用户流失预测方法,基于BP神经网络的游戏用户流失预测方法,解决了现有的游戏用户流失严重,没有精细化地根据BP神经网络的方法预测游戏用户的流失的问题。尽管该专利申请中也采用了模型训练预测的方法,但是该申请并没有解决预测未来会付费的玩家的问题。因此需要一些新方法其能够帮助筛选出且预测出玩家中未来会付费的高概率玩家。
技术实现思路
为至少解决上述技术问题,提出了本专利技术的如下所述的多个方案。具体地,根据本专利技术的第一方面,提供一种基于集成学习的预测方法,所述预测方法获取至少一个用户的日志数据,所述预测方法还包括:对获取的至少一个用户的日志数据进行分析处理,确定所述至少一个用户中的目标用户的至少一个相关特征向量;将所述目标用户的至少一个相关特征向量分别输入至少一个预训练好的子模型中,相应地得到所述目标用户的至少一个训练结果子向量;将得到的所述至少一个训练结果子向量输入预训练好的集成学习模型中,得到所述目标用户的训练结果预测向量,并基于所述目标用户的训练结果预测向量,得到所述目标用户的付费预测值;以及将所述目标用户的付费预测值与预设付费阈值进行对比,确定所述付费预测值大于或等于所述预设付费阈值的所述目标用户为高概率付费用户。可选地,所述对获取的至少一个用户的日志数据进行分析处理,确定所述至少一个用户中的目标用户的至少一个相关特征向量,包括:采用至少一种数据分析对获取的至少一个用户的日志数据进行分析处理,得到所述至少一个用户中的目标用户的原始数据;在分析处理后,对所述目标用户的原始数据进行过滤和清洗,得到所述目标用户的真实数据;以及对所述目标用户的真实数据进行特征处理,确定所述目标用户的至少一个相关特征向量。可选地,所述对所述目标用户的真实数据进行特征处理,确定所述目标用户的至少一个相关特征向量,包括:对所述目标用户的真实数据进行特征提取,得到所述目标用户的至少一个第一相关特征向量;将所述目标用户的第一相关特征向量进行衍生,得到所述目标用户的至少一个第二相关特征向量;以及融合所述目标用户的至少一个第一相关特征向量与所述目标用户的至少一个第二相关特征向量,确定所述目标用户的至少一个相关特征向量。可选地,所述至少一个预训练好的子模型包括深度神经网络模型、极端梯度提升模型和预定义人工规则模型。可选地,所述集成学习模型采用堆叠泛化方法实现。可选地,所述至少一种数据分析包括以下一种或多种的组合:归因类型分析、MTTI趋势洞察与点击劫持分析、僵尸用户分析和安卓应用市场安装劫持分析。根据本专利技术的第二方面,提供一种基于集成学习的预测系统,所述预测系统包括获取单元用于获取至少一个用户的日志数据,所述预测系统还包括:特征向量处理单元,用于对获取的至少一个用户的日志数据进行分析处理,确定所述至少一个用户中的目标用户的至少一个相关特征向量;模型训练单元,用于将所述目标用户的至少一个相关特征向量分别输入至少一个预训练好的子模型中,相应地得到所述目标用户的至少一个训练结果子向量;以及将得到的所述至少一个训练结果子向量输入预训练好的集成学习模型中,得到所述目标用户的训练结果预测向量;以及预测单元,用于基于所述目标用户的训练结果预测向量,得到所述目标用户的付费预测值,并将所述目标用户的付费预测值与预设付费阈值进行对比,确定所述付费预测值大于或等于所述预设付费阈值的所述目标用户为高概率付费用户。可选地,所述特征向量处理单元,包括:数据处理模块,用于采用至少一种数据分析对获取的至少一个用户的日志数据进行分析处理,得到所述至少一个用户中的目标用户的原始数据;以及在分析处理后,对所述目标用户的原始数据进行过滤和清洗,得到所述目标用户的真实数据;特征处理模块,用于对所述目标用户的真实数据进行特征处理,确定所述目标用户的至少一个相关特征向量。可选地,所述特征处理模块包括:第一特征处理模块,用于对所述目标用户的真实数据进行特征提取,得到所述目标用户的至少一个第一相关特征向量;第二特征处理模块,用于将所述目标用户的第一相关特征向量进行衍生,得到所述目标用户的至少一个第二相关特征向量;以及融合处理模块,用于融合所述目标用户的至少一个第一相关特征向量与所述目标用户的至少一个第二相关特征向量,确定所述目标用户的至少一个相关特征向量。可选地,所述至少一个预训练好的子模型包括深度神经网络模型、极端梯度提升模型和预定义人工规则模型。可选地,所述集成学习模型采用堆叠泛化方法实现。可选地,所述至少一种数据分析包括以下一种或多种的组合:归因类型分析、MTTI趋势洞察与点击劫持分析、僵尸用户分析和安卓应用市场安装劫持分析。根据本专利技术的第三方面,提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现上述任一项所述的预测方法。本专利技术的预测方法和预测系统,可以对用户的日志数据进行分析处理,确定目标用户的至少一个相关特征向量,再根据这些相关特征向量对模型进行训练,得到所述目标用户的付费预测值,并与预设付费阈值进行对比,确定所述付费预测值大于或等于所述预设付费阈值的所述目标用户为高概率付费用户,这样大大提高了预测目标用户为高概率付费用户的准确率,同时也能够有针对性地加强对这些高概率付费用户的关注。附图说明以示例的方式参考以下附图描述本专利技术的非限制性且非穷举性实施方案,其中:图1示出根据本专利技术一实施方案的预测系统的示意图;图2示出根据本专利技术一实施方案的目标用户对应的至少一个相关特征向量的示意图;图3示出根据本专利技术一实施方案的相关特征向量训练模型的示意图;图4示出根据本专利技术一实施方案的特征向量处理单元的结构示意图;图5示出根据本专利技术一实施方案的特征处理模块的结构示意图;以及图6示出根据本专利技术一实施方案的预测方法的流程图。具体实施方式为了使本专利技术的上述以及其他特征和优点更加清楚,下面结合附图进一步描述本专利技术。应当理解,本文给出的具体实施方案是出于向本领域技术人员解释的目的,仅是示例性的,而非限制性的。图1示出根据本专利技术一实施方案的预测系统的示意图。图2示出根据本专利技术一实施方案的目标用户对应的至少一个相关特征向量的示意图。如图1和图2所示,所述预测系本文档来自技高网...
【技术保护点】
1.一种基于集成学习的预测方法,所述预测方法包括获取至少一个用户的日志数据,其特征在于,所述预测方法还包括:/n对获取的所述至少一个用户的日志数据进行分析处理,确定所述至少一个用户中的目标用户的至少一个相关特征向量;/n将所述目标用户的至少一个相关特征向量分别输入至少一个预训练好的子模型中,相应地得到所述目标用户的至少一个训练结果子向量;/n将得到的所述至少一个训练结果子向量输入预训练好的集成学习模型中,得到所述目标用户的训练结果预测向量,并且基于所述目标用户的训练结果预测向量,得到所述目标用户的付费预测值;以及/n将所述目标用户的付费预测值与预设付费阈值进行对比,确定所述付费预测值大于或等于所述预设付费阈值的所述目标用户为高概率付费用户。/n
【技术特征摘要】
1.一种基于集成学习的预测方法,所述预测方法包括获取至少一个用户的日志数据,其特征在于,所述预测方法还包括:
对获取的所述至少一个用户的日志数据进行分析处理,确定所述至少一个用户中的目标用户的至少一个相关特征向量;
将所述目标用户的至少一个相关特征向量分别输入至少一个预训练好的子模型中,相应地得到所述目标用户的至少一个训练结果子向量;
将得到的所述至少一个训练结果子向量输入预训练好的集成学习模型中,得到所述目标用户的训练结果预测向量,并且基于所述目标用户的训练结果预测向量,得到所述目标用户的付费预测值;以及
将所述目标用户的付费预测值与预设付费阈值进行对比,确定所述付费预测值大于或等于所述预设付费阈值的所述目标用户为高概率付费用户。
2.根据权利要求1所述的预测方法,其特征在于,所述对获取的至少一个用户的日志数据进行分析处理,确定所述至少一个用户中的目标用户的至少一个相关特征向量,包括:
采用至少一种数据分析对获取的至少一个用户的日志数据进行分析处理,得到所述至少一个用户中的目标用户的原始数据;
在分析处理后,对所述目标用户的原始数据进行过滤和清洗,得到所述目标用户的真实数据;以及
对所述目标用户的真实数据进行特征处理,确定所述目标用户的至少一个相关特征向量。
3.根据权利要求2所述的预测方法,其特征在于,所述对所述目标用户的真实数据进行特征处理,确定所述目标用户的至少一个相关特征向量,包括:
对所述目标用户的真实数据进行特征提取,得到所述目标用户的至少一个第一相关特征向量;
将所述目标用户的至少一个第一相关特征向量进行衍生,得到所述目标用户的至少一个第二相关特征向量;以及
融合所述目标用户的至少一个第一相关特征向量与所述目标用户的至少一个第二相关特征向量,确定所述目标用户的至少一个相关特征向量。
4.根据权利要求1-3任一项所述的预测方法,其特征在于,所述至少一个预训练好的子模型包括深度神经网络模型、极端梯度提升模型和预定义人工规则模型。
5.根据权利要求1-3任一项所述的预测方法,其特征在于,所述集成学习模型采用堆叠泛化方法实现。
6.根据权利要求2所述的预测方法...
【专利技术属性】
技术研发人员:曹晓晓,佟立兵,白冬立,
申请(专利权)人:北京热云科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。