System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,尤其涉及一种用户活跃度评估方法、装置、电子设备和存储介质。
技术介绍
1、随着数字化产业不断深入,各方位的数据收集、储存和处理能力得到了显著提升。在此过程中,合作商积累了大量广泛涵盖、持续性强且精度高的海量用户数据。金融行业已广泛应用这些数据来挖掘潜在客户、拓展新产品以及指导业务发展方向。在实际工作中,通过制定相应的专家经验规则、传统的统计学方法或者机器学习建模的方式衡量用户对购车类app的活跃,用以评估用户购车贷款意向的方法已有很多。
2、传统的统计学方案,通过对用户使用app的序列行为数据进行分析,提取出影响用户活跃的关键因素,并使用回归模型或arima模型等方法进行预测。传统的统计学习方法的准确率往往非常低。
3、广泛使用的机器学习建模方案中,会过多依赖于人工经验解构特征,进而损失一些信息,影响模型的最终效果。
4、依托于专家经验的规则建设,需要基于单指标的统计分析或多指标的联合分布观察等,这限制了指标数量,过多难以形成固定的筛选口径,过少又无法保证结果的准确性。种种原因导致规则模型大都较为简单、稳定性较差,准确率较低。
5、现行几种方案的预测目标,不能很好的评估用户对app的活跃程度。
技术实现思路
1、本专利技术提供一种用户活跃度评估方法、装置、电子设备和存储介质,用以解决现有评估用户活跃度的方法不准确的问题,通过确定基础特征、去时序化特征和序列特征,进而得到第一留存分和留存分的二分类值;并基于第一留
2、本专利技术提供一种用户活跃度评估方法,包括:
3、获取用户数据的基础特征、去时序化特征和序列特征;
4、基于所述基础特征、所述去时序化特征和所述序列特征,获取初始留存分和留存分的二分类值;
5、基于所述二分类值和所述初始留存分,确定用户的留存分,基于所述留存分确定活跃用户;所述留存分表征用户使用购物软件的活跃程度。
6、在一个实施例中,基于所述基础特征、所述去时序化特征和所述序列特征,获取留存分的二分类值,包括:
7、将所述基础特征、所述去时序化特征和所述序列特征,输入第一二分类模型,获取所述第一二分类模型输出的第一预测概率;所述第一预测概率表征留存分为0的概率;
8、将所述基础特征、所述去时序化特征和所述序列特征,输入第二二分类模型,获取所述第二二分类模型输出的第二预测概率;所述第二预测概率表征留存分为n的概率;
9、基于所述第一预测概率的排序结果,将所述第一预测概率对应的二分类值设置为0或不为0;
10、基于所述第二预测概率的排序结果,将所述第二预测概率对应的二分类值设置为n或不为n。
11、在一个实施例中,基于所述基础特征、所述去时序化特征和所述序列特征,获取初始留存分,包括:
12、基于轻量级梯度提升机lightgbm模型、分类增强catboost模型、极端梯度提升xgboost模型以及深度森林deepforest模型,对所述基础特征和去时序化特征进行融合得到融合特征;
13、基于门控循环单元gru模型,对所述序列特征进行处理得到序列特征结果;
14、将所述融合特征和所述序列特征结果进行融合,得到所述初始留存分。
15、在一个实施例中,获取用户数据的去时序化特征和序列特征,包括:
16、对所述用户数据进行衍生,得到衍生数据;
17、获取与所述用户数据关联的历史留存分,并对所述历史留存分设置权重;
18、基于所述衍生数据、所述历史留存分及其权重,获取所述去时序化特征和所述序列特征。
19、在一个实施例中,基于所述基础特征、所述去时序化特征和所述序列特征,获取初始留存分之后,还包括:
20、若用户存在大于n天未访问所述购物软件,则将所述用户的初始留存分设置为0;
21、若用户的所述初始留存分小于设定阈值,且所述用户访问所述购物软件的次数为0,则将所述用户的初始留存分设置为0。
22、在一个实施例中,所述基于所述二分类值和所述初始留存分,确定用户的留存分,包括:
23、当所述初始留存分与所述二分类值匹配时,将所述初始留存分设置为所述留存分;
24、当所述初始留存分与所述二分类值不匹配时,将所述二分类值设置为所述留存分。
25、在一个实施例中,所述用户数据包括基础数据和用户访问购物软件的访问数据,获取所述基础数据,包括:
26、确定影响所述用户购物意向的影响因子;
27、基于所述影响因子获取所述基础数据,所述基础数据包括用户身份数据、用户特征数据以及用户通信数据。
28、本专利技术还提供了一种用户活跃度评估装置,包括:
29、获取模块,用于获取用户数据的基础特征、去时序化特征和序列特征;
30、第一确定模块,用于基于所述基础特征、所述去时序化特征和所述序列特征,获取初始留存分和留存分的二分类值;
31、第二确定模块,用于基于所述二分类值和所述初始留存分,确定用户的留存分,基于所述留存分确定活跃用户;所述留存分表征用户使用购物软件的活跃程度。
32、本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述用户活跃度评估方法。
33、本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述用户活跃度评估方法。
34、本专利技术提供的用户活跃度评估方法、装置、电子设备和存储介质,通过获取用户数据的基础特征、去时序化特征和序列特征;基于所述基础特征、所述去时序化特征和所述序列特征,获取初始留存分和留存分的二分类值;基于所述二分类值和所述初始留存分,确定用户的留存分,基于所述留存分确定活跃用户;所述留存分表征用户使用购物软件的活跃程度。本专利技术通过确定基础特征、去时序化特征和序列特征,进而得到第一留存分和留存分的二分类值;并基于第一留存分和二分类值,确定用户的留存分,进而确定活跃用户,提高了评估用户活跃度的准确性。
本文档来自技高网...【技术保护点】
1.一种用户活跃度评估方法,其特征在于,包括:
2.根据权利要求1所述的用户活跃度评估方法,其特征在于,基于所述基础特征、所述去时序化特征和所述序列特征,获取留存分的二分类值,包括:
3.根据权利要求1所述的用户活跃度评估方法,其特征在于,基于所述基础特征、所述去时序化特征和所述序列特征,获取初始留存分,包括:
4.根据权利要求1所述的用户活跃度评估方法,其特征在于,获取用户数据的去时序化特征和序列特征,包括:
5.根据权利要求1所述的用户活跃度评估方法,其特征在于,基于所述基础特征、所述去时序化特征和所述序列特征,获取初始留存分之后,还包括:
6.根据权利要求1所述的用户活跃度评估方法,其特征在于,所述基于所述二分类值和所述初始留存分,确定用户的留存分,包括:
7.根据权利要求1所述的用户活跃度评估方法,其特征在于,所述用户数据包括基础数据和用户访问购物软件的访问数据,获取所述基础数据,包括:
8.一种用户活跃度评估装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述用户活跃度评估方法。
...【技术特征摘要】
1.一种用户活跃度评估方法,其特征在于,包括:
2.根据权利要求1所述的用户活跃度评估方法,其特征在于,基于所述基础特征、所述去时序化特征和所述序列特征,获取留存分的二分类值,包括:
3.根据权利要求1所述的用户活跃度评估方法,其特征在于,基于所述基础特征、所述去时序化特征和所述序列特征,获取初始留存分,包括:
4.根据权利要求1所述的用户活跃度评估方法,其特征在于,获取用户数据的去时序化特征和序列特征,包括:
5.根据权利要求1所述的用户活跃度评估方法,其特征在于,基于所述基础特征、所述去时序化特征和所述序列特征,获取初始留存分之后,还包括:
6.根据权利要求1所述的用户活跃度...
【专利技术属性】
技术研发人员:郑才华,杨弋鋆,
申请(专利权)人:浪潮通信信息系统有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。