【技术实现步骤摘要】
线上机器学习模型的参数更新方法、装置及电子设备
[0001]本申请涉及计算机信息处理领域,具体而言,涉及一种线上机器学习模型的参数更新方法、装置、电子设备及计算机可读介质。
技术介绍
[0002]作为人工智能的分支和实现方法,机器学习被广泛应用于机器视觉、语音识别、自然语言处理、数据挖掘、风险控制等领域。机器学习根据样本数据模型,再用模型对数据进行预测与决策。
[0003]由于模型是以特定时期的样本数据所开发的,而随着时间的推移,模型测试的人群(测试样本)可能会发生变化,比如开发人群(开发样本)是工作白领人群,而之后模型主要应用于测试学生人群。由于不同人群样本会存在分布差异,导致稳定性差的模型就不能对新人群进行很好的区分,需要更新模型。
[0004]目前主要通过采集大量的新的人群样本数据对模型重新训练的方式来更新模型,以提高模型的稳定性。但这种方式需要对新的人群样本数据进行采集、清洗、打标签等处理,耗时耗力,效率低下。而且,当前的模型更新方式,仅仅能对模型进行更新,导致模型失效的原因却无从得知,当前对于模型性 ...
【技术保护点】
【技术特征摘要】
1.一种线上机器学习模型的参数更新方法,其特征在于,包括:获取在线运行的目标机器学习模型在当前周期内的当前预测集合;将所述当前预测集合和基准预测参数进行比对以确定最大分箱位置;根据所述最大分箱位置由所述当前预测集合中提取目标预测集合;基于所述目标预测集合和基准预测集合的差异比对,生成更新参数;基于所述更新参数对所述目标机器学习模型的当前参数进行更新。2.如权利要求1所述的方法,其特征在于,还包括:在所述目标机器学习模型上线后,获取首个时间周期内的所述目标机器学习模型的预测数据;基于所述预测数据生成所述基准预测集合。3.如权利要求2所述的方法,其特征在于,还包括:基于所述基准预测集合生成分箱区间;基于所述基准预测集合、所述分箱区间生成每个分箱区间对应的基准对标参数;基于所述分箱区间和每个分箱区间对应的基准对标参数生成所述基准预测参数。4.如权利要求3所述的方法,其特征在于,将所述当前预测集合和基准预测参数进行比对以确定最大分箱位置,包括:将所述当前预测集合按照所述分箱区间划分为多个当前子集合;分别计算所述多个当前子集合对应的当前对标参数;将所述当前对标参数和所述基准对标参数进行比对以确定所述最大分箱位置。5.如权利要求4所述的方法,其特征在于,将所述当前对标参数和所述基准对标参数进行比对以确定所述最大分箱位置,包括:基于分箱区间将每一个当前子集合对应的所述当前对标参数和所述基准对标参数进行比对,生成多个KS检验值;将多个KS检验值中最大的KS检验值对应的位置作为最大分箱位置。6.如权利要求1所述的方法,其特征在于,根据所述最大分箱位置由所述当前预测集合中提取目标预测集合,包括:基于所述最大分箱位置将所述当前预测集合分为第一集合和第二集合;分别计算所述第一集合和所述第二集合的KS检验值的均值;基于所述KS检验值的均值由所述第一集合和所述第二集合中确定所述目...
【专利技术属性】
技术研发人员:李达,丁楠,苏绥绥,
申请(专利权)人:北京淇瑀信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。