用于更新预测模型的方法、装置、介质和电子设备制造方法及图纸

技术编号:25441360 阅读:13 留言:0更新日期:2020-08-28 22:28
公开了一种用于更新预测模型的方法、装置、介质以及电子设备。其中的方法包括:从系统当前使用的预测模型的训练样本集合中获取多个用户的用户特征;从准训练样本集合中获取多个用户的用户特征;确定来自所述训练样本集合的多个用户的用户特征和来自所述准训练样本集合的多个用户的用户特征的特征分布差异信息;若所述特征分布差异信息满足预设差异条件,则利用准训练样本集合中的用户特征进行预测模型训练;利用所述训练获得的预测模型更新系统当前使用的预测模型;其中,所述预测模型用于预测系统中的用户在预定时间点之后的第一时间范围内执行目标行为的概率。本公开提供的技术方案有利于促使系统当前使用的预测模型持续保持较好的预测准确性。

【技术实现步骤摘要】
用于更新预测模型的方法、装置、介质和电子设备
本公开涉及计算机技术,尤其是涉及一种用于更新预测模型的方法、用于更新预测模型的装置、存储介质以及电子设备。
技术介绍
在为系统中的用户提供服务的过程中,往往需要利用预测模型来预测用户发生成交行为等目标行为的概率,以便于为用户提供更好的服务。为了提高预测模型的预测准确率,往往需要对预测模型进行更新。如何及时更新预测模型,以便于提高预测模型的预测准确率,是一个值得关注的技术问题。
技术实现思路
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种用于更新预测模型的方法、用于更新预测模型的装置、存储介质以及电子设备。根据本公开实施例的一个方面,提供了一种用于更新预测模型的方法,该方法包括:从系统当前使用的预测模型的训练样本集合中获取多个用户的用户特征;从准训练样本集合中获取多个用户的用户特征;确定来自所述训练样本集合的多个用户的用户特征和来自所述准训练样本集合的多个用户的用户特征的特征分布差异信息;若所述特征分布差异信息满足预设差异条件,则利用所述准训练样本集合中的用户特征进行预测模型训练;利用所述训练获得的预测模型更新所述系统当前使用的预测模型;其中,所述预测模型用于预测系统中的用户在预定时间点之后的第一时间范围内执行目标行为的概率。在本公开一实施方式中,所述方法在从准训练样本集合中获取多个用户的用户特征之前,还包括:根据业务数据,定时获取距离预定历史时间最近的第二时间范围内的所有活跃用户的用户特征,形成准训练样本集合。在本公开又一实施方式中,所述特征分布差异信息包括:特征分布差异程度;和/或,用户特征中的各特征元素对特征分布差异的贡献的排序信息。在本公开再一实施方式中,所述确定来自所述训练样本集合中的多个用户的用户特征和来自所述准训练样本集合中的多个用户的用户特征的特征分布差异信息,包括:为训练样本集合中的各用户的用户特征分别设置第一版本标注信息;为准训练样本集合中的各用户的用户特征分别设置第二版本标注信息;将所述训练样本集合中的用户特征和所述准训练样本集合中的用户特征分别作为输入提供给版本识别模型,经由所述版本识别模型对输入的用户特征分别进行版本识别处理;根据所述版本识别模型输出的版本识别处理结果、所述第一版本标注信息以及第二版本标注信息,确定来自所述训练样本集合的多个用户的用户特征和来自所述准训练样本集合的多个用户的用户特征的特征分布差异信息。在本公开再一实施方式中,所述将所述训练样本集合中的用户特征和所述准训练样本集合中的用户特征分别作为输入提供给版本识别模型,经由所述版本识别模型对输入的用户特征分别进行版本识别处理,包括:将所述训练样本集合中的部分用户的用户特征,作为第一训练样本;将所述准训练样本集合中的部分用户的用户特征,作为第二训练样本;利用所述第一训练样本和第二训练样本对版本识别模型进行训练;将所述训练样本集合中的另一部分用户的用户特征和所述准训练样本集合中的另一部分用户的用户特征,分别作为输入提供给训练后的版本识别模型,经由所述训练后的版本识别模型对输入的用户特征分别进行版本识别处理。在本公开再一实施方式中,所述根据所述版本识别模型输出的版本识别处理结果、所述第一版本标注信息以及第二版本标注信息,确定来自所述训练样本集合中的多个用户的用户特征和来自所述准训练样本集合中的多个用户的用户特征的特征分布差异信息,包括:根据所述版本识别模型输出的各用户特征的版本信息以及所述输入的各用户特征的第一版本标注信息/第二版本标注信息,计算所述训练样本集合中的用户特征和所述准训练样本集合中的用户特征的马修斯相关系数。在本公开再一实施方式中,所述若所述特征分布差异信息满足预设差异条件,则利用所述准训练样本集合中的用户特征进行预测模型训练,包括:若所述马修斯相关系数达到预定阈值,则将所述准训练样本集合中的用户特征作为输入,提供给待训练预测模型;经由所述待训练预测模型对输入的用户特征进行预测处理;根据所述待训练预测模型输出的预测处理结果和所述输入的用户特征的目标行为发生标注信息,调整所述待训练预测模型的网络参数。在本公开再一实施方式中,所述方法还包括:若实时检测到系统中的一用户产生执行行为操作,则获取所述用户的当前用户特征;将所述当前用户特征提供给所述系统当前使用的预测模型,经由所述预测模型执行线上预测处理;根据所述预测模型的预测处理结果,获得所述当前用户在未来第一时间范围内执行目标行为的概率。在本公开再一实施方式中,所述方法还包括:根据所述当前用户在未来第一时间范围内执行目标行为的概率,更新所述系统的当前价值。在本公开再一实施方式中,所述方法还包括:根据所述预测模型针对多个当前用户的预测处理结果,确定所述预测模型的受试者工作特征曲线下的面积AUC;和/或,根据所述预测模型针对多个当前用户的预测处理结果以及执行目标行为的用户数量的后验值,确定所述系统的当前价值的偏差;和/或,根据所述预测模型针对多个当前用户的预测处理结果以及执行目标行为的用户数量的后验值,确定所述系统当前使用的预测模型的预测偏差。根据本公开实施例的另一个方面,提供了一种用于更新预测模型的装置,该装置包括:第一获取模块,用于从系统当前使用的预测模型的训练样本集合中获取多个用户的用户特征;第二获取模块,用于从准训练样本集合中获取多个用户的用户特征;确定分布差异模块,用于确定来自所述训练样本集合的多个用户的用户特征和来自所述准训练样本集合的多个用户的用户特征的特征分布差异信息;预测模型训练模块,用于若所述特征分布差异信息满足预设差异条件,则利用所述准训练样本集合中的用户特征进行预测模型训练;模型更新模块,用于利用所述预测模型训练模块训练获得的预测模型更新所述系统当前使用的预测模型;其中,所述预测模型用于预测系统中的用户在预定时间点之后的第一时间范围内执行目标行为的概率。在本公开一实施方式中,所述装置还包括:形成集合模块,用于根据业务数据,定时获取距离预定历史时间最近的第二时间范围内的所有活跃用户的用户特征,形成准训练样本集合。在本公开又一实施方式中,所述特征分布差异信息包括:特征分布差异程度;和/或,用户特征中的各特征元素对特征分布差异的贡献的排序信息。在本公开再一实施方式中,所述确定分布差异模块,包括:第一子模块,用于为训练样本集合中的各用户的用户特征分别设置第一版本标注信息;第二子模块,用于为准训练样本集合中的各用户的用户特征分别设置第二版本标注信息;第三子模块,用于将所述训练样本集合中的用户特征和所述准训练样本集合中的用户特征分别作为输入提供给版本识别模型,经由所述版本识别模型对输入的用户特征分别进行版本识别处理;第四子模块,用于根据所述版本识别模型输出的版本识别处理结果、所述第一版本标注信息以及第二版本标注信息,确定来自所述训练样本集合的多个用户的用户特征和来自所述准训练样本集合的多个用户的用户特征的特征分布差异信息。在本公开再一实施方式中,所述第三子模块包括:第一单元,用于将所述训练样本集合中的部本文档来自技高网...

【技术保护点】
1.一种用于更新预测模型的方法,包括:/n从系统当前使用的预测模型的训练样本集合中获取多个用户的用户特征;/n从准训练样本集合中获取多个用户的用户特征;/n确定来自所述训练样本集合的多个用户的用户特征和来自所述准训练样本集合的多个用户的用户特征的特征分布差异信息;/n若所述特征分布差异信息满足预设差异条件,则利用所述准训练样本集合中的用户特征进行预测模型训练;/n利用所述训练获得的预测模型更新所述系统当前使用的预测模型;/n其中,所述预测模型用于预测系统中的用户在预定时间点之后的第一时间范围内执行目标行为的概率。/n

【技术特征摘要】
1.一种用于更新预测模型的方法,包括:
从系统当前使用的预测模型的训练样本集合中获取多个用户的用户特征;
从准训练样本集合中获取多个用户的用户特征;
确定来自所述训练样本集合的多个用户的用户特征和来自所述准训练样本集合的多个用户的用户特征的特征分布差异信息;
若所述特征分布差异信息满足预设差异条件,则利用所述准训练样本集合中的用户特征进行预测模型训练;
利用所述训练获得的预测模型更新所述系统当前使用的预测模型;
其中,所述预测模型用于预测系统中的用户在预定时间点之后的第一时间范围内执行目标行为的概率。


2.根据权利要求1所述的方法,其中,所述方法在从准训练样本集合中获取多个用户的用户特征之前,还包括:
根据业务数据,定时获取距离预定历史时间最近的第二时间范围内的所有活跃用户的用户特征,形成准训练样本集合。


3.根据权利要求1或2所述的方法,其中,所述特征分布差异信息包括:
特征分布差异程度;和/或
用户特征中的各特征元素对特征分布差异的贡献的排序信息。


4.根据权利要求1至3中任一项所述的方法,其中,所述确定来自所述训练样本集合中的多个用户的用户特征和来自所述准训练样本集合中的多个用户的用户特征的特征分布差异信息,包括:
为训练样本集合中的各用户的用户特征分别设置第一版本标注信息;
为准训练样本集合中的各用户的用户特征分别设置第二版本标注信息;
将所述训练样本集合中的用户特征和所述准训练样本集合中的用户特征分别作为输入提供给版本识别模型,经由所述版本识别模型对输入的用户特征分别进行版本识别处理;
根据所述版本识别模型输出的版本识别处理结果、所述第一版本标注信息以及第二版本标注信息,确定来自所述训练样本集合的多个用户的用户特征和来自所述准训练样本集合的多个用户的用户特征的特征分布差异信息。


5.根据权利要求4所述的方法,其中,所述将所述训练样本集合中的用户特征和所述准训练样本集合中的用户特征分别作为输入提供给版本识别模型,经由所述版本识别模型对输入的用户特征分别进行版本识别处理,包括:
将所述训练样本集合中的部分用户的用户特征,作为第一训练样本;
将所述准训练样本集合中的部分用户的用户特征,作为第二训练样本;
利用所述第一训练样本和第二训练样本对版本识别模型进行训练;
将所述训练样本集合中的另一部分用户的用户特征和所述准...

【专利技术属性】
技术研发人员:刘思明郭凯李嘉晨刘雷付东东胡磊
申请(专利权)人:贝壳技术有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1