【技术实现步骤摘要】
用户留存预测方法及装置
[0001]本专利技术涉及人工智能
,尤其涉及一种用户留存预测方法及装置。需要说明的是,本专利技术用户留存预测方法及装置可用于人工智能
,也可用于除人工智能
之外的任意领域,本专利技术用户留存预测方法及装置的应用领域不做限定。
技术介绍
[0002]本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]留存率是一个互联网产品最核心的指标,是一个互联网产品留住用户的能力,利用留存率可以了解用户,分析用户流失,从而提升产品服务质量。众多实践证明,提升用户留存率,减少用户流失,对于任何一家企业来说都是非常重要的。随着互联网的高速发展,对于企业来说,用户留存也逐渐成为了反映企业及产品核心竞争力的关键要素。
[0004]现有技术中用户留存预测的方法主要有基于快照视图预测用户留存、基于同期群视图预测用户留存以及基于随机森林分类原理预测用户留存等方法,这些方法基本是利用历史用户留存数据的变化规律、变化趋势进行预测分析,存在预测准确度较低的问题。
技术实现思路
[0005]本专利技术实施例提供一种用户留存预测方法,用以提高用户留存预测准确度,该方法包括:
[0006]获取用户数据;所述用户数据包括用户个人数据、用户登录数据、用户交易数据;
[0007]根据用户数据生成用户登录行为序列、用户交易行为序列和衍生特征数据;所述衍生特征数据包括根据用户登录数据确定的用户特征数据;< ...
【技术保护点】
【技术特征摘要】
1.一种用户留存预测方法,其特征在于,包括:获取用户数据;所述用户数据包括用户个人数据、用户登录数据、用户交易数据;根据用户数据生成用户登录行为序列、用户交易行为序列和衍生特征数据;所述衍生特征数据包括根据用户登录数据确定的用户特征数据;将用户个人数据、衍生特征数据输入融合树模型,输出用户在未来预设天数内的每一天是否会登录的判断结果;所述融合树模型根据历史用户个人数据、历史衍生特征数据和历史用户在历史预设天数内的每一天是否登录的实际结果对多种决策树模型融合训练得到;将用户个人数据、用户登录行为序列、用户交易行为序列、衍生特征数据和所述判断结果输入时间序列模型,输出用户在未来预设天数内的每一天登录的概率值;所述时间序列模型根据历史用户登录行为序列、历史用户交易行为序列、历史用户在历史预设天数内的每一天是否登录的实际结果和历史用户在历史预设天数内的每一天登录的概率值对卷积神经网络CNN模型训练得到。2.如权利要求1所述的方法,其特征在于,所述用户登录数据包括如下之一或任意组合:用户登录时间;用户登录次数;用户登录方式。3.如权利要求1所述的方法,其特征在于,所述衍生特征数据包括如下之一或任意组合:用户历史登录总次数;用户过去预设天数内的登录总次数;用户过去最近一次登录和计算日期当天的时间差;用户历史登录历史;计算日期当天用户是否登录过。4.如权利要求1所述的方法,其特征在于,将用户登录行为序列、用户交易行为序列和所述判断结果输入时间序列模型,输出用户在未来预设天数内的每一天登录的概率值,包括:将用户登录行为序列、用户交易行为序列在时间序列模型中经过两层卷积层、两层池化层计算后,输出第一结果;将第一结果和用户个人数据、衍生特征数据进行合并,输出第二结果;将第二结果和所述判断结果输入激活层,输出用户在未来预设天数内的每一天登录的概率值;其中,时间序列模型包括两层卷积层、两层池化层和激活层。5.如权利要求2所述的方法,其特征在于,所述时间序列模型按如下方式训练得到:收集历史用户数据;从历史用户数据中抽样选取用户登录时间不一致的用户数据;根据抽样选取的用户登录时间不一致的用户数据,获取对应的历史用户登录行为序列、历史用户交易行为序列、历史用户在历史未来预设天数内的每一天是否登录的实际结
果和历史用户在历史预设天数内的每一天登录的概率值,构建训练集和测试集;搭建CNN模型,利用训练集对CNN模型进行训练,得到时间序列模型;利用测试集对时间序列模型进行测试。6.如权利要求5所述的方法,其特征在于,根据抽样选取的用户登录时间不一致的用户数据,获取对应的历史用户登录行为序列、历史用户交易行为序列、历史用户在历史未来预设天数内的每一天是否登录的实际结果和历史用户在历史预设天数内的每一天登录的概率值,构建训练集和测试集,包括:根据抽样选取的用户登录时间不一致的用户数据,再次抽样选取第一预设比例的用户未登录或用户未交易的用户数据,获取对应的历史用户登录行为序列、历史用户交易行为序列、历史用户在历史未来预设天数内的每一天是否登录的实际结果和历史用户在历史预设天数内的每一天登录的概率值,构建训练集;根据抽样选取的用户登录时间不一致的用户数据,再次抽样选取第二预设比例的用户未登录或用户未交易的用户数据,获取对应的历史用户登录行为序列、历史用户交易行为序列、历史用户在历史未来预设天数内的每一天是否登录的实际结果和历史用户在历史预设天数内的每一天登录的概率值,构建测试集;其中,第一预设比例大于第二预设比例。7.如权利要求1所述的方法,其特征在于,在将用户个人数据、衍生特征数据输入融合树模型,输出用户在未来预设天数内的每一天是否会登录的判断结果之前,还包括:对用户个人数据中数值进行平均处理。8.一种用户留存预测装置,其特征在于,包括:数据获取模块,用于获取用户数据;所述用户数据包括用户个人数据、用户登录数据、用户交易数据;数据处理模块,用于根据用户数据生成用户登录行为序列、用户交易行为序列和衍生特征数据;所述衍生特征数据包括根据用...
【专利技术属性】
技术研发人员:童楚婕,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。