用户留存预测方法及装置制造方法及图纸

技术编号:36090773 阅读:9 留言:0更新日期:2022-12-24 11:07
本发明专利技术公开了一种用户留存预测方法及装置,涉及人工智能技术领域,其中该方法包括:获取用户数据;所述用户数据包括用户个人数据、用户登录数据、用户交易数据;根据用户数据生成用户登录行为序列、用户交易行为序列和衍生特征数据;所述衍生特征数据包括根据用户登录数据确定的用户特征数据;将用户个人数据、衍生特征数据输入融合树模型,输出用户在未来预设天数内的每一天是否会登录的判断结果;所述融合树模型对多种决策树模型融合训练得到;将用户个人数据、用户登录行为序列、用户交易行为序列、衍生特征数据和所述判断结果输入时间序列模型,输出用户在未来预设天数内的每一天登录的概率值。本发明专利技术可以提高用户留存预测的准确度。准确度。准确度。

【技术实现步骤摘要】
用户留存预测方法及装置


[0001]本专利技术涉及人工智能
,尤其涉及一种用户留存预测方法及装置。需要说明的是,本专利技术用户留存预测方法及装置可用于人工智能
,也可用于除人工智能
之外的任意领域,本专利技术用户留存预测方法及装置的应用领域不做限定。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]留存率是一个互联网产品最核心的指标,是一个互联网产品留住用户的能力,利用留存率可以了解用户,分析用户流失,从而提升产品服务质量。众多实践证明,提升用户留存率,减少用户流失,对于任何一家企业来说都是非常重要的。随着互联网的高速发展,对于企业来说,用户留存也逐渐成为了反映企业及产品核心竞争力的关键要素。
[0004]现有技术中用户留存预测的方法主要有基于快照视图预测用户留存、基于同期群视图预测用户留存以及基于随机森林分类原理预测用户留存等方法,这些方法基本是利用历史用户留存数据的变化规律、变化趋势进行预测分析,存在预测准确度较低的问题。

技术实现思路

[0005]本专利技术实施例提供一种用户留存预测方法,用以提高用户留存预测准确度,该方法包括:
[0006]获取用户数据;所述用户数据包括用户个人数据、用户登录数据、用户交易数据;
[0007]根据用户数据生成用户登录行为序列、用户交易行为序列和衍生特征数据;所述衍生特征数据包括根据用户登录数据确定的用户特征数据;<br/>[0008]将用户个人数据、衍生特征数据输入融合树模型,输出用户在未来预设天数内的每一天是否会登录的判断结果;所述融合树模型根据历史用户个人数据、历史衍生特征数据和历史用户在历史预设天数内的每一天是否登录的实际结果对多种决策树模型融合训练得到;
[0009]将用户个人数据、用户登录行为序列、用户交易行为序列、衍生特征数据和所述判断结果输入时间序列模型,输出用户在未来预设天数内的每一天登录的概率值;所述时间序列模型根据历史用户登录行为序列、历史用户交易行为序列、历史用户在历史预设天数内的每一天是否登录的实际结果和历史用户在历史预设天数内的每一天登录的概率值对卷积神经网络CNN模型训练得到。
[0010]本专利技术实施例还提供一种用户留存预测装置,用以提高用户留存预测准确度,该装置包括:
[0011]数据获取模块,用于获取用户数据;所述用户数据包括用户个人数据、用户登录数据、用户交易数据;
[0012]数据处理模块,用于根据用户数据生成用户登录行为序列、用户交易行为序列和
衍生特征数据;所述衍生特征数据包括根据用户登录数据确定的用户特征数据;
[0013]融合树模型处理模块,用于将用户个人数据、衍生特征数据输入融合树模型,输出用户在未来预设天数内的每一天是否会登录的判断结果;所述融合树模型根据历史用户个人数据、历史衍生特征数据和历史用户在历史预设天数内的每一天是否登录的实际结果对多种决策树模型融合训练得到;
[0014]时间序列模型处理模块,用于将用户个人数据、用户登录行为序列、用户交易行为序列、衍生特征数据和所述判断结果输入时间序列模型,输出用户在未来预设天数内的每一天登录的概率值;所述时间序列模型根据历史用户登录行为序列、历史用户交易行为序列、历史用户在历史预设天数内的每一天是否登录的实际结果和历史用户在历史预设天数内的每一天登录的概率值对卷积神经网络CNN模型训练得到。
[0015]本专利技术实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述用户留存预测方法。
[0016]本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述用户留存预测方法。
[0017]本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述用户留存预测方法。
[0018]本专利技术实施例中获取用户数据;所述用户数据包括用户个人数据、用户登录数据、用户交易数据;根据用户数据生成用户登录行为序列、用户交易行为序列和衍生特征数据;所述衍生特征数据包括根据用户登录数据确定的用户特征数据;将用户个人数据、衍生特征数据输入融合树模型,输出用户在未来预设天数内的每一天是否会登录的判断结果;所述融合树模型根据历史用户个人数据、历史衍生特征数据和历史用户在历史预设天数内的每一天是否登录的实际结果对多种决策树模型融合训练得到;将用户个人数据、用户登录行为序列、用户交易行为序列、衍生特征数据和所述判断结果输入时间序列模型,输出用户在未来预设天数内的每一天登录的概率值;所述时间序列模型根据历史用户登录行为序列、历史用户交易行为序列、历史用户在历史预设天数内的每一天是否登录的实际结果和历史用户在历史预设天数内的每一天登录的概率值对卷积神经网络CNN模型训练得到。本专利技术实施例中,首先利用融合树模型判断用户在未来预设天数内的每一天是否会登录,然后利用时间序列模型,结合融合树模型输出的判断结果,预测用户在未来预设天数内的每一天登录的概率值,实现了用融合树模输出的判断结果对时间序列模型输出的预测结果进行加强判断处理,输出了最终的用户留存预测结果,提高了用户留存预测的准确度;另外,融合树模型未使用单一树模型,而是融合了多种决策树树模型,避免了单一模型计算数据的片面性,并且充分考虑了用户交易数据、用户登录数据和用户个人数据对用户留存预测的影响,具有更多的有效数据特征,进一步提高了用户留存预测的准确度。
附图说明
[0019]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以
根据这些附图获得其他的附图。在附图中:
[0020]图1为本专利技术实施例中用户留存预测方法的流程示意图;
[0021]图2为本专利技术实施例中用户留存预测方法的一具体实施例;
[0022]图3为本专利技术实施例中用户留存预测方法的一具体实施例;
[0023]图4为本专利技术实施例中用户留存预测方法的一具体实施例;
[0024]图5为本专利技术实施例中用户留存预测装置的示意图。
具体实施方式
[0025]为使本专利技术实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本专利技术实施例做进一步详细说明。在此,本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限定。
[0026]首先对本专利技术中涉及的技术名词进行解释。
[0027]时间序列数据:按照时间的顺序记录的一列有序数据,任意一个时刻只能获得唯一的一个序列观察值。
[0028]卷积神经网络模型(Convolutional Neural Networks本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户留存预测方法,其特征在于,包括:获取用户数据;所述用户数据包括用户个人数据、用户登录数据、用户交易数据;根据用户数据生成用户登录行为序列、用户交易行为序列和衍生特征数据;所述衍生特征数据包括根据用户登录数据确定的用户特征数据;将用户个人数据、衍生特征数据输入融合树模型,输出用户在未来预设天数内的每一天是否会登录的判断结果;所述融合树模型根据历史用户个人数据、历史衍生特征数据和历史用户在历史预设天数内的每一天是否登录的实际结果对多种决策树模型融合训练得到;将用户个人数据、用户登录行为序列、用户交易行为序列、衍生特征数据和所述判断结果输入时间序列模型,输出用户在未来预设天数内的每一天登录的概率值;所述时间序列模型根据历史用户登录行为序列、历史用户交易行为序列、历史用户在历史预设天数内的每一天是否登录的实际结果和历史用户在历史预设天数内的每一天登录的概率值对卷积神经网络CNN模型训练得到。2.如权利要求1所述的方法,其特征在于,所述用户登录数据包括如下之一或任意组合:用户登录时间;用户登录次数;用户登录方式。3.如权利要求1所述的方法,其特征在于,所述衍生特征数据包括如下之一或任意组合:用户历史登录总次数;用户过去预设天数内的登录总次数;用户过去最近一次登录和计算日期当天的时间差;用户历史登录历史;计算日期当天用户是否登录过。4.如权利要求1所述的方法,其特征在于,将用户登录行为序列、用户交易行为序列和所述判断结果输入时间序列模型,输出用户在未来预设天数内的每一天登录的概率值,包括:将用户登录行为序列、用户交易行为序列在时间序列模型中经过两层卷积层、两层池化层计算后,输出第一结果;将第一结果和用户个人数据、衍生特征数据进行合并,输出第二结果;将第二结果和所述判断结果输入激活层,输出用户在未来预设天数内的每一天登录的概率值;其中,时间序列模型包括两层卷积层、两层池化层和激活层。5.如权利要求2所述的方法,其特征在于,所述时间序列模型按如下方式训练得到:收集历史用户数据;从历史用户数据中抽样选取用户登录时间不一致的用户数据;根据抽样选取的用户登录时间不一致的用户数据,获取对应的历史用户登录行为序列、历史用户交易行为序列、历史用户在历史未来预设天数内的每一天是否登录的实际结
果和历史用户在历史预设天数内的每一天登录的概率值,构建训练集和测试集;搭建CNN模型,利用训练集对CNN模型进行训练,得到时间序列模型;利用测试集对时间序列模型进行测试。6.如权利要求5所述的方法,其特征在于,根据抽样选取的用户登录时间不一致的用户数据,获取对应的历史用户登录行为序列、历史用户交易行为序列、历史用户在历史未来预设天数内的每一天是否登录的实际结果和历史用户在历史预设天数内的每一天登录的概率值,构建训练集和测试集,包括:根据抽样选取的用户登录时间不一致的用户数据,再次抽样选取第一预设比例的用户未登录或用户未交易的用户数据,获取对应的历史用户登录行为序列、历史用户交易行为序列、历史用户在历史未来预设天数内的每一天是否登录的实际结果和历史用户在历史预设天数内的每一天登录的概率值,构建训练集;根据抽样选取的用户登录时间不一致的用户数据,再次抽样选取第二预设比例的用户未登录或用户未交易的用户数据,获取对应的历史用户登录行为序列、历史用户交易行为序列、历史用户在历史未来预设天数内的每一天是否登录的实际结果和历史用户在历史预设天数内的每一天登录的概率值,构建测试集;其中,第一预设比例大于第二预设比例。7.如权利要求1所述的方法,其特征在于,在将用户个人数据、衍生特征数据输入融合树模型,输出用户在未来预设天数内的每一天是否会登录的判断结果之前,还包括:对用户个人数据中数值进行平均处理。8.一种用户留存预测装置,其特征在于,包括:数据获取模块,用于获取用户数据;所述用户数据包括用户个人数据、用户登录数据、用户交易数据;数据处理模块,用于根据用户数据生成用户登录行为序列、用户交易行为序列和衍生特征数据;所述衍生特征数据包括根据用...

【专利技术属性】
技术研发人员:童楚婕
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1