模型同步更新方法、装置及电子设备制造方法及图纸

技术编号:25837453 阅读:19 留言:0更新日期:2020-10-02 14:18
本公开实施例中提供了一种模型同步更新方法、装置及电子设备,属于数据处理技术领域,该方法包括:在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时,设置第二卷积神经网络模型和第二决策树模型;分别利用所述第一卷积神经网络模型和所述第二卷积神经网络模型的输出数据来训练所述第一决策树模型和所述第二决策树模型;基于所述第一决策树模型和所述第二决策树模型训练的结果,分别对所述第一决策树模型和所述第二决策树模型的性能指标进行评估;基于第一性能指标与第二性能指标的比较结果,对所述第一卷积神经网络模型或所述第二卷积神经网络模型中的一个执行下线操作。通过本公开的处理方案,能够提高模型更新的效率。

【技术实现步骤摘要】
模型同步更新方法、装置及电子设备
本公开涉及数据处理
,尤其涉及一种模型同步更新方法、装置及电子设备。
技术介绍
卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。卷积神经网络具有表征学习能力,能够按其阶层结构对输入信息进行平移不变分类。卷积神经网络仿造生物的视知觉机制构建,可以进行监督学习和非监督学习,其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征,例如像素和音频进行学习、有稳定的效果且对数据没有额外的特征工程要求。gbdt(GradientBoostingDecisionTree,梯度提升决策树),在回归和分类问题上的良好性能受到工业界和机器学习比赛的青睐,目前推荐用的gbdt模型依赖的视觉特征大部分产生于卷积神经网络(CNN)。如果只更新CNN模型而不更新gbdt模型,由于CNN输出的特征分布已经发生变化,但此时gbdt仍然假定分布没有变化,导致最终输出会产生偏差。因此需要一种机制在更新CNN时通知gbdt模型同步更新,另外当新的CNN模型效果不好时,希望能保留旧的CNN和旧的gbdt模型。
技术实现思路
有鉴于此,本公开实施例提供一种模型同步更新方法、装置及电子设备,以至少部分解决现有技术中存在的问题。第一方面,本公开实施例提供了一种模型同步更新方法,包括:在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时,设置第二卷积神经网络模型和第二决策树模型,其中,所述第二卷积神经网络模型与所述第一卷积神经网络模型不同,所述第二决策树模型与所述第一决策树模型相同;分别利用所述第一卷积神经网络模型和所述第二卷积神经网络模型的输出数据来训练所述第一决策树模型和所述第二决策树模型;基于所述第一决策树模型和所述第二决策树模型训练的结果,分别对所述第一决策树模型和所述第二决策树模型的性能指标进行评估,得到第一性能指标和第二性能指标;基于所述第一性能指标与所述第二性能指标的比较结果,对所述第一卷积神经网络模型或所述第二卷积神经网络模型中的一个执行下线操作。根据本公开实施例的一种具体实现方式,所述在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时,设置第二卷积神经网络模型和第二决策树模型,包括:获取新上线的与所述第一卷积神经网络模型不同的卷积神经网络模型;将获取到的所述新上线的卷积神经网络模型作为所述第二卷积神经网络模型。根据本公开实施例的一种具体实现方式,所述在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时,设置第二卷积神经网络模型和第二决策树模型,包括:将处于正在运行状态的第一决策树模型进行复制操作,生成复制的决策树模型;将所述复制的决策树模型作为所述二决策树模型。根据本公开实施例的一种具体实现方式,所述分别利用所述第一卷积神经网络模型和所述第二卷积神经网络模型的输出数据来训练所述第一决策树模型和所述第二决策树模型,包括:获取所述第一卷积神经网络模型全连接层生成的第一特征向量;将所述第一特征向量和模型训练相关的线上数据一起输入到所述第一决策树模型中,用以训练所述第一决策树模型。根据本公开实施例的一种具体实现方式,所述分别利用所述第一卷积神经网络模型和所述第二卷积神经网络模型的输出数据来训练所述第一决策树模型和所述第二决策树模型,包括:获取所述第二卷积神经网络模型全连接层生成的第二特征向量;将所述第二特征向量和模型训练相关的线上数据一起输入到所述第二决策树模型中,用以训练所述第二决策树模型。根据本公开实施例的一种具体实现方式,所述基于所述第一决策树模型和所述第二决策树模型训练的结果,分别对所述第一决策树模型和所述第二决策树模型的性能指标进行评估之前,所述方法还包括:预先设定用于对所述第一决策树模型和所述第二决策树模型进行评估的性能指标和评估样本,所述性能指标包括预测准确度,所述评估样本中包括针对评估结果的标识数据。根据本公开实施例的一种具体实现方式,所述基于所述第一决策树模型和所述第二决策树模型训练的结果,分别对所述第一决策树模型和所述第二决策树模型的性能指标进行评估,包括:利用所述评估样本分别对所述第一决策树模型和第二决策树模型进行数据预测,得到第一预测结果和第二预测结果;将所述第一预测结果和所述第二预测结果分别于所述标识数据进行比对,得到第一性能指标和第二性能指标。根据本公开实施例的一种具体实现方式,所述基于所述第一性能指标与所述第二性能指标的比较结果,对所述第一卷积神经网络模型或所述第二卷积神经网络模型中的一个执行下线操作,包括:当所述第一性能指标优于所述第二性能指标时,下线所述第二卷积神经网络模型;当所述第二性能指标优于所述第一性能指标时,下线所述第一卷积神经网络模型。第二方面,本公开实施例提供了一种模型同步更新装置,包括:设置模块,用于在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时,设置第二卷积神经网络模型和第二决策树模型,其中,所述第二卷积神经网络模型与所述第一卷积神经网络模型不同,所述第二决策树模型与所述第一决策树模型相同;训练模块,用于分别利用所述第一卷积神经网络模型和所述第二卷积神经网络模型的输出数据来训练所述第一决策树模型和所述第二决策树模型;评估模块,用于基于所述第一决策树模型和所述第二决策树模型训练的结果,分别对所述第一决策树模型和所述第二决策树模型的性能指标进行评估,得到第一性能指标和第二性能指标;执行模块,用于基于所述第一性能指标与所述第二性能指标的比较结果,对所述第一卷积神经网络模型或所述第二卷积神经网络模型中的一个执行下线操作。第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:至少一个处理器;以及,与该至少一个处理器通信连接的存储器;其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述第一方面或第一方面的任一实现方式中的模型同步更新方法。第四方面,本公开实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述第一方面或第一方面的任一实现方式中的模型同步更新方法。第五方面,本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述第一方面或第一方面的任一实现方式中的模型同步更新方法。本公开实施例中的模型同步更新方案,包括在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时,设置第二卷积神经网络模型和第二决策树模型,其中,所述第二卷积神经网络模型与所述第一卷本文档来自技高网...

【技术保护点】
1.一种模型同步更新方法,其特征在于,包括:/n在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时,设置第二卷积神经网络模型和第二决策树模型,其中,所述第二卷积神经网络模型与所述第一卷积神经网络模型不同,所述第二决策树模型与所述第一决策树模型相同;/n分别利用所述第一卷积神经网络模型和所述第二卷积神经网络模型的输出数据来训练所述第一决策树模型和所述第二决策树模型;/n基于所述第一决策树模型和所述第二决策树模型训练的结果,分别对所述第一决策树模型和所述第二决策树模型的性能指标进行评估,得到第一性能指标和第二性能指标;/n基于所述第一性能指标与所述第二性能指标的比较结果,对所述第一卷积神经网络模型或所述第二卷积神经网络模型中的一个执行下线操作。/n

【技术特征摘要】
1.一种模型同步更新方法,其特征在于,包括:
在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时,设置第二卷积神经网络模型和第二决策树模型,其中,所述第二卷积神经网络模型与所述第一卷积神经网络模型不同,所述第二决策树模型与所述第一决策树模型相同;
分别利用所述第一卷积神经网络模型和所述第二卷积神经网络模型的输出数据来训练所述第一决策树模型和所述第二决策树模型;
基于所述第一决策树模型和所述第二决策树模型训练的结果,分别对所述第一决策树模型和所述第二决策树模型的性能指标进行评估,得到第一性能指标和第二性能指标;
基于所述第一性能指标与所述第二性能指标的比较结果,对所述第一卷积神经网络模型或所述第二卷积神经网络模型中的一个执行下线操作。


2.根据权利要求1所述的方法,其特征在于,所述在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时,设置第二卷积神经网络模型和第二决策树模型,包括:
获取新上线的与所述第一卷积神经网络模型不同的卷积神经网络模型;
将获取到的所述新上线的卷积神经网络模型作为所述第二卷积神经网络模型。


3.根据权利要求1所述的方法,其特征在于,所述在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时,设置第二卷积神经网络模型和第二决策树模型,包括:
将处于正在运行状态的第一决策树模型进行复制操作,生成复制的决策树模型;
将所述复制的决策树模型作为所述二决策树模型。


4.根据权利要求1所述的方法,其特征在于,所述分别利用所述第一卷积神经网络模型和所述第二卷积神经网络模型的输出数据来训练所述第一决策树模型和所述第二决策树模型,包括:
获取所述第一卷积神经网络模型全连接层生成的第一特征向量;
将所述第一特征向量和模型训练相关的线上数据一起输入到所述第一决策树模型中,用以训练所述第一决策树模型。


5.根据权利要求1所述的方法,其特征在于,所述分别利用所述第一卷积神经网络模型和所述第二卷积神经网络模型的输出数据来训练所述第一决策树模型和所述第二决策树模型,包括:
获取所述第二卷积神经网络模型全连接层生成的第二特征向量;
将所述第二特征向量和模型训练相关的线上数据一起输入到所述第二决策树模型中,用以训练所述第二决策树模型。


6.根据权利要求1所述的方法,其特征在于,所述基于所述第一决策树模型和所述第二决策树模型训练的结果,分别对所述第一决策树模型和所述第二决策树模型的性能指标...

【专利技术属性】
技术研发人员:白戈袁泽寰
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1