【技术实现步骤摘要】
模型更新方法、装置、设备及存储介质
[0001]本专利技术涉及人工智能
,尤其涉及一种模型更新方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]模型更新训练是算法迭代优化的关键操作,替换效果下降的老模型,上线效果更好的新模型,才能不断保持模型的良好性能。现有技术下,广泛使用实际应用中生产数据作为样本数据对模型进行离线再训练,以此来提高模型精度。然而这种方法对于样本经常出现变化的模型效果不佳,例如,在市场营销和风险识别领域,营销模型和风控模型完成一次样本数据准备和模型更新评估迭代,通常要花费数周时间,加上模型部署和测试的时间,等到模型真正能够上线应用,几个月的时间已经过去了,更新效率较低,而用户群经常随时间出现不同程度的波动,模型从训练到上线的时间跨度长,上线时不能及时捕捉当前用户群的特征,使得模型精度变差。
技术实现思路
[0003]本专利技术提供一种模型更新方法、装置、设备及存储介质,其主要目的在于解决模型更新效率较低且精度较低的问题。
[0004]为实现上述目的,本专利技术提 ...
【技术保护点】
【技术特征摘要】
1.一种模型更新方法,其特征在于,所述方法包括:将业务应用的业务数据分类,得到实时业务数据及离线业务数据;对所述实时业务数据进行统计变换,得到第一实时变量,利用所述业务数据中的离线用户信息对所述离线业务数据进行数据分离,得到第一离线变量及第二离线变量;对所述第一实时变量及所述第一离线变量进行合并,得到第一合并变量,并基于所述第一合并变量得到第二实时变量;汇总所述第一合并变量、所述第二离线变量及所述第二实时变量,得到训练数据,利用所述训练数据对待训练原始模型进行训练,得到标准模型。2.如权利要求1所述的模型更新方法,其特征在于,所述将业务应用的业务数据分类,得到实时业务数据及离线业务数据,包括:提取所述业务数据中的实时数据,利用预设的消息中间件对所述实时数据进行排列,得到实时业务队列,其中,所述实时业务队列中包含所述实时业务数据;提取所述业务数据中的离线日志,根据所述实时数据中的用户信息提取所述离线日志中同一用户的离线业务数据。3.如权利要求2所述的模型更新方法,其特征在于,所述对所述实时业务数据进行统计变换,得到第一实时变量,包括:利用预设的流计算平台依次从所述实时业务队列中获取实时业务数据;在所述流计算平台中,统计所述实时业务数据中的用户浏览操作的时长,并将统计到的时长作为所述第一实时变量。4.如权利要求1所述的模型更新方法,其特征在于,所述利用所述业务数据中的离线用户信息对所述离线业务数据进行数据分离,得到第一离线变量及第二离线变量,包括:利用预设的批处理平台对所述离线业务数据进行批量划分,得到批量离线数据;将所述批量离线数据中的离线用户信息作为所述第一离线变量,将所述批量离线数据中的历史用户点击操作作为所述第二离线变量。5.如权利要求4所述的模型更新方法,其特征在于,所述对所述第一实时变量及所述第一离线变量进行合并,得到第一合并变量,并基于所述第一合并变量得到第二实时变量,包括:对同一用户的第一实时变量及第一离线变量进行合并,得到第一合并变量;将所述第一合并变量合并后所述业务应用反馈的实时用户点击操作作为所述第二实时变量。6.如权利要求1所述的模型更新方法,其特征在于,所述利用所述训练数据对...
【专利技术属性】
技术研发人员:王志省,
申请(专利权)人:平安银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。