预测模型的更新方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34019737 阅读:12 留言:0更新日期:2022-07-02 16:38
本申请提供了一种预测模型的更新方法、装置、电子设备及存储介质。方法包括使用第一预测模型对应用场景当前的待预测数据进行第一预测;对应用场景指定时段内的全量数据进行采样,将采样得到的数据作为待训练数据添加至待训练集合;在发生模型训练触发事件时,获取待训练集合中待训练数据对应的关键特征集合;根据关键特征集合训练第二预测模型;在训练完成的第二预测模型的性能衡量参数优于第一预测模型的性能衡量参数时,将第一预测模型更新为第二预测模型,以利用第二预测模型对应用场景当前的待预测数据进行预测。采用本申请可以提高模型更新的效率和灵活性。高模型更新的效率和灵活性。高模型更新的效率和灵活性。

【技术实现步骤摘要】
预测模型的更新方法、装置、电子设备及存储介质


[0001]本申请涉及游戏
,尤其是涉及一种预测模型的更新方法、装置、电子设备及存储介质。

技术介绍

[0002]在电商、游戏、广告、医疗、银行等应用场景中,为了提升服务质量,完善系统性能,通常会采用预先训练好的网络模型进行商品或服务等信息的推荐。这种网络模型对应的推荐系统,相当于一种信息的过滤系统。以游戏为例,通过游戏中的道具推荐模型,可以预测出针对同一玩家不同虚拟道具的“评分”或“偏好”等相关信息,根据该信息向玩家推荐合适的虚拟道具。再比如电商平台的商品推荐模型,可以预测用户的购买倾向,进而将购买倾向较大的商品推荐给用户。
[0003]在训练上述模型的过程中,通常将训练数据输入到模型进行“拟合”,使得模型改变内部的参数来“适应”到应用场景的数据,进而确定可以应用的模型。这种方式得到的模型在开始阶段是有效的,但是随着时间的推移,因为应该场景中的数据的分布情况发生变化,例如,以服装类的电商推荐模型为例,具有较强的季节性,适合冬季服务推荐的模型,可能对于夏装的推荐效果会很差。针对这种情况,需要定期更新模型,比如每天训练一个模型,或者加入一些实时特征(比如5分种的点击量,3分钟内的浏览量),来略微增强模型的预测能力。但是,定期更新的模型经常需要分为特征处理、特征部署、模型调试、模型部署等模块,且开发周期长,模型更新的成本较高,不满足应用需要。而实时特征又需要人工检测某个特征的可用性,人工成本较高,也难以实施。

技术实现思路

[0004]本申请的目的在于提供一种预测模型的更新方法、装置、电子设备及存储介质,以提高模型更新的效率和灵活性,降低模型的更新成本。
[0005]第一方面,本申请实施例提供一种预测模型的更新方法,所述方法包括:使用第一预测模型对应用场景当前的待预测数据进行第一预测;其中,所述第一预测模型的性能衡量参数为第一参数;对所述应用场景指定时段内的全量数据进行采样,将采样得到的数据作为待训练数据添加至待训练集合;响应于模型训练触发事件,获取所述待训练集合中待训练数据对应的关键特征集合;其中,所述关键特征集合中的关键特征的权重大于所述待训练数据对应的特征中除所述关键特征之外的其它特征的权重;根据所述关键特征集合训练第二预测模型;其中,训练完成的所述第二预测模型的性能衡量参数为第二参数;响应于所述第二参数优于所述第一参数,将所述第一预测模型更新为所述第二预测模型,以利用所述第二预测模型对所述应用场景当前的待预测数据进行预测。
[0006]结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述使用第一预测模型对应用场景当前的待预测数据进行第一预测包括:获取应用场景当前的待预测数据;从所述待预测数据中确定第一预测模型对应的关键特征集合;将所述第一
预测模型对应的关键特征集合输入所述第一预测模型进行第一预测,得到所述第一预测模型输出的预测结果。
[0007]结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述对所述应用场景指定时段内的全量数据进行采样包括:获取所述应用场景指定时段内的全量数据;从所述全量数据中抽取设定类别属性对应的数据。
[0008]结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中,所述方法还包括:监听所述应用场景是否发生模型训练触发事件;其中,所述模型训练触发事件包括以下事件中的至少之一:所述待训练集合中的数据量达到第一设定阈值、所述第一预测模型的性能衡量参数低于第二设定阈值、所述应用场景对应的应用程序更新、接收到所述应用场景的模型训练指令。
[0009]结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方式,其中,所述获取所述待训练集合中待训练数据对应的关键特征集合包括:解析所述待训练集合中的待训练数据的各个维度特征;对每个所述待训练数据的多个维度特征进行特征交叉,得到每个所述待训练数据对应的间接特征;应用每个所述待训练数据对应的维度特征和间接特征训练第三预测模型,根据训练完成的第三预测模型中的特征的权重确定所述待训练集合对应的关键特征集合。
[0010]结合第一方面,本申请实施例提供了第一方面的第五种可能的实施方式,其中,所述方法还包括:将所述第一预测模型更新为所述第二预测模型之后,清空所述待训练集合,应用所述第二预测模型对所述应用场景当前的待预测数据进行预测;和/或,响应于所述第二参数不优于所述第一参数,清空所述待训练集合,继续使用所述第一预测模型对所述应用场景中的待预测数据进行预测。
[0011]结合第一方面,本申请实施例提供了第一方面的第六种可能的实施方式,其中,所述第一预测模型和/或所述第二预测模型至少包括CatBoost模型;所述应用场景包括:商超中的商品或服务推荐场景、广告推荐场景、游戏信息推荐场景、医疗信息推荐场景、自动驾驶信息推荐场景或银行信息推荐场景。
[0012]结合第一方面,本申请实施例提供了第一方面的第七种可能的实施方式,其中,所述应用场景为游戏道具推荐场景;所述使用第一预测模型对应用场景当前的待预测数据进行第一预测包括:使用第一预测模型对所述游戏道具推荐场景中当前玩家的待预测数据进行第一预测;其中,所述待预测数据表征所述当前玩家的特征信息;所述对所述应用场景指定时段内的全量数据进行采样包括:对所述游戏道具推荐场景指定时段内部分玩家或全部玩家对应的数据进行采样;所述利用所述第二预测模型对所述应用场景当前的待预测数据进行预测包括:利用所述第二预测模型对所述游戏道具推荐场景中当前玩家的待预测数据进行预测。
[0013]第二方面,本申请实施例还提供一种预测模型的更新装置,所述装置包括:预测模块,用于使用第一预测模型对应用场景当前的待预测数据进行第一预测;其中,所述第一预测模型的性能衡量参数为第一参数;采样模块,用于对所述应用场景指定时段内的全量数据进行采样,将采样得到的数据作为待训练数据添加至待训练集合;关键特征集合获取模块,用于响应于模型训练触发事件,获取所述待训练集合中待训练数据对应的关键特征集合;其中,所述关键特征集合中的关键特征的权重大于所述待训练数据对应的特征中除所
述关键特征之外的其它特征的权重;训练模块,用于根据所述关键特征集合训练第二预测模型;其中,训练完成的所述第二预测模型的性能衡量参数为第二参数;模型更新模块,用于响应于所述第二参数优于所述第一参数,将所述第一预测模型更新为所述第二预测模型,以利用所述第二预测模型对所述应用场景当前的待预测数据进行预测。
[0014]第三方面,本申请实施例还提供一种电子设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现上述预测模型的更新方法。
[0015]第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述预测模型的更新方法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预测模型的更新方法,其特征在于,所述方法包括:使用第一预测模型对应用场景当前的待预测数据进行第一预测;其中,所述第一预测模型的性能衡量参数为第一参数;对所述应用场景指定时段内的全量数据进行采样,将采样得到的数据作为待训练数据添加至待训练集合;响应于模型训练触发事件,获取所述待训练集合中待训练数据对应的关键特征集合;其中,所述关键特征集合中的关键特征的权重大于所述待训练数据对应的特征中除所述关键特征之外的其它特征的权重;根据所述关键特征集合训练第二预测模型;其中,训练完成的所述第二预测模型的性能衡量参数为第二参数;响应于所述第二参数优于所述第一参数,将所述第一预测模型更新为所述第二预测模型,以利用所述第二预测模型对所述应用场景当前的待预测数据进行预测。2.根据权利要求1所述的方法,其特征在于,所述使用第一预测模型对应用场景当前的待预测数据进行第一预测包括:获取应用场景当前的待预测数据;从所述待预测数据中确定第一预测模型对应的关键特征集合;将所述第一预测模型对应的关键特征集合输入所述第一预测模型进行第一预测,得到所述第一预测模型输出的预测结果。3.根据权利要求1所述的方法,其特征在于,所述对所述应用场景指定时段内的全量数据进行采样包括:获取所述应用场景指定时段内的全量数据;从所述全量数据中抽取设定类别属性对应的数据。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:监听所述应用场景是否发生模型训练触发事件;其中,所述模型训练触发事件包括以下事件中的至少之一:所述待训练集合中的数据量达到第一设定阈值、所述第一预测模型的性能衡量参数低于第二设定阈值、所述应用场景对应的应用程序更新、接收到所述应用场景的模型训练指令。5.根据权利要求1所述的方法,其特征在于,所述获取所述待训练集合中待训练数据对应的关键特征集合包括:解析所述待训练集合中的待训练数据的各个维度特征;对每个所述待训练数据的多个维度特征进行特征交叉,得到每个所述待训练数据对应的间接特征;应用每个所述待训练数据对应的维度特征和间接特征训练第三预测模型,根据训练完成的第三预测模型中的特征的权重确定所述待训练集合对应的关键特征集合。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述第一预测模型更新为所述第二预测模型之后,清空所述待训练集合,应用所述第二预测模型对所述应用场景当前的待预测数据进行预测;和/或,响应于所述第二...

【专利技术属性】
技术研发人员:徐帅刘勇成胡志鹏袁思思程龙
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1