【技术实现步骤摘要】
用户活跃度预测模型训练方法、系统、设备及存储介质
本专利技术涉及机器学习
,尤其涉及一种用户活跃度预测模型训练方法、系统、设备及存储介质。
技术介绍
平台用户生命流程,通常会经历注册阶段、活跃阶段、流失阶段和沉默阶段。沉默阶段的用户数量较大且不能给平台带来价值,需要针对一些高概率可被激活的用户后续再进行push营销、短信营销、客服回访等方法进行挽留,提升平台用户的整体活跃度。然而,现有的活跃度预测方法中,如果采用活跃度预测模型,由于沉默用户和非沉默用户的比例差异巨大,并且样本平衡的方法比较匮乏,容易丢失大量样本信息,无法直接进行简单的有监督学习,并且在常规的预测方法中,对特征交叉和特征深度都没有成熟的应用,活跃度预测模型的准确率无法得到保证。
技术实现思路
针对现有技术中的问题,本专利技术的目的在于提供一种用户活跃度预测模型训练方法、系统、设备及存储介质,采用半监督学习的方法,可以有效地重复利用不平衡样本中偏少的样本数据,更加有效地进行信息提取,快速有效地构建准确率高的活跃度预测模型。本专利技术实施例提供一种用户活跃度预测模型训练方法,用于指定平台的用户活跃度预 ...
【技术保护点】
1.一种用户活跃度预测模型训练方法,其特征在于,用于指定平台的用户活跃度预测,所述方法包括如下步骤:采集用户在平台的历史数据,将用户划分为活跃度标签确定的第一用户和活跃度标签不确定的第二用户;将所述第一用户的历史数据和活跃度标签加入第一训练集,采用所述第一训练集训练预分类模型;将所述第二用户的历史数据输入所述预分类模型,根据所述预分类模型的输出结果为所述第二用户添加活跃度标签;将所述第一用户的历史数据和活跃度标签以及所述第二用户的历史数据和活跃度标签加入第二训练集,采用所述第二训练集训练活跃度预测模型。
【技术特征摘要】
1.一种用户活跃度预测模型训练方法,其特征在于,用于指定平台的用户活跃度预测,所述方法包括如下步骤:采集用户在平台的历史数据,将用户划分为活跃度标签确定的第一用户和活跃度标签不确定的第二用户;将所述第一用户的历史数据和活跃度标签加入第一训练集,采用所述第一训练集训练预分类模型;将所述第二用户的历史数据输入所述预分类模型,根据所述预分类模型的输出结果为所述第二用户添加活跃度标签;将所述第一用户的历史数据和活跃度标签以及所述第二用户的历史数据和活跃度标签加入第二训练集,采用所述第二训练集训练活跃度预测模型。2.根据权利要求1所述的用户活跃度预测模型训练方法,其特征在于,所述将用户划分为活跃度标签确定的第一用户和活跃度标签不确定的第二用户,包括如下步骤:统计用户在第一预设时间内和第二预设时间内是否执行过指定类型操作,根据统计结果将用户划分为活跃度标签确定的第一用户和活跃度标签不确定的第二用户,所述第一预设时间大于所述第二预设时间。3.根据权利要求2所述的用户活跃度预测模型训练方法,其特征在于,所述根据统计结果将用户划分为活跃度标签确定的第一用户和活跃度标签不确定的第二用户,包括如下步骤:将在第一预设时间内未执行过指定类型操作的用户作为所述第一用户,将在第二预设时间内执行过指定类型操作的用户作为所述第一用户,将在第二预设时间内未执行过指定类型操作,且在第一预设时间内执行过指定类型操作的用户作为所述第二用户;将在第一预设时间内未执行过指定类型操作的用户的历史数据作为预分类模型的正样本,将在第二预设时间内执行过指定类型操作的用户的历史数据作为预分类模型的负样本,为所述正样本和负样本添加标签。4.根据权利要求2所述的用户活跃度预测模型训练方法,其特征在于,应用于物流司机平台,所述指定类型操作包括用户在平台上执行的联系货主操作。5.根据...
【专利技术属性】
技术研发人员:王东,沙韬伟,罗竞佳,邓金秋,刘祥,
申请(专利权)人:江苏满运软件科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。