模型同步更新方法、装置及电子设备制造方法及图纸

技术编号：25837453 阅读：19 留言：0更新日期：2020-10-02 14:18

本公开实施例中提供了一种模型同步更新方法、装置及电子设备，属于数据处理技术领域，该方法包括：在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时，设置第二卷积神经网络模型和第二决策树模型；分别利用所述第一卷积神经网络模型和所述第二卷积神经网络模型的输出数据来训练所述第一决策树模型和所述第二决策树模型；基于所述第一决策树模型和所述第二决策树模型训练的结果，分别对所述第一决策树模型和所述第二决策树模型的性能指标进行评估；基于第一性能指标与第二性能指标的比较结果，对所述第一卷积神经网络模型或所述第二卷积神经网络模型中的一个执行下线操作。通过本公开的处理方案，能够提高模型更新的效率。

全部详细技术资料下载

【技术实现步骤摘要】
模型同步更新方法、装置及电子设备
本公开涉及数据处理
，尤其涉及一种模型同步更新方法、装置及电子设备。
技术介绍
卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络，是深度学习的代表算法之一。卷积神经网络具有表征学习能力，能够按其阶层结构对输入信息进行平移不变分类。卷积神经网络仿造生物的视知觉机制构建，可以进行监督学习和非监督学习，其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征，例如像素和音频进行学习、有稳定的效果且对数据没有额外的特征工程要求。gbdt(GradientBoostingDecisionTree，梯度提升决策树)，在回归和分类问题上的良好性能受到工业界和机器学习比赛的青睐，目前推荐用的gbdt模型依赖的视觉特征大部分产生于卷积神经网络(CNN)。如果只更新CNN模型而不更新gbdt模型，由于CNN输出的特征分布已经发生变化，但此时gbdt仍然假定分布没有变化，导致最终输出会产生偏差。因此需要一种机制在更新CNN时通知gbdt模型同步更新，另外当新的CNN模型效果不好时，希望能保留旧的CNN和旧的gbdt模型。
技术实现思路
有鉴于此，本公开实施例提供一种模型同步更新方法、装置及电子设备，以至少部分解决现有技术中存在的问题。第一方面，本公开实施例提供了一种模型同步更新方法，包括：在利用第一卷积神经网络模型的输出数据训练第一决策树模...

【技术保护点】
1.一种模型同步更新方法，其特征在于，包括：/n在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时，设置第二卷积神经网络模型和第二决策树模型，其中，所述第二卷积神经网络模型与所述第一卷积神经网络模型不同，所述第二决策树模型与所述第一决策树模型相同；/n分别利用所述第一卷积神经网络模型和所述第二卷积神经网络模型的输出数据来训练所述第一决策树模型和所述第二决策树模型；/n基于所述第一决策树模型和所述第二决策树模型训练的结果，分别对所述第一决策树模型和所述第二决策树模型的性能指标进行评估，得到第一性能指标和第二性能指标；/n基于所述第一性能指标与所述第二性能指标的比较结果，对所述第一卷积神经网络模型或所述第二卷积神经网络模型中的一个执行下线操作。/n

【技术特征摘要】
1.一种模型同步更新方法，其特征在于，包括：
在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时，设置第二卷积神经网络模型和第二决策树模型，其中，所述第二卷积神经网络模型与所述第一卷积神经网络模型不同，所述第二决策树模型与所述第一决策树模型相同；
分别利用所述第一卷积神经网络模型和所述第二卷积神经网络模型的输出数据来训练所述第一决策树模型和所述第二决策树模型；
基于所述第一决策树模型和所述第二决策树模型训练的结果，分别对所述第一决策树模型和所述第二决策树模型的性能指标进行评估，得到第一性能指标和第二性能指标；
基于所述第一性能指标与所述第二性能指标的比较结果，对所述第一卷积神经网络模型或所述第二卷积神经网络模型中的一个执行下线操作。

2.根据权利要求1所述的方法，其特征在于，所述在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时，设置第二卷积神经网络模型和第二决策树模型，包括：
获取新上线的与所述第一卷积神经网络模型不同的卷积神经网络模型；
将获取到的所述新上线的卷积神经网络模型作为所述第二卷积神经网络模型。

3.根据权利要求1所述的方法，其特征在于，所述在利用第一卷积神经网络模型的输出数据训练第一决策树模型的同时，设置第二卷积神经网络模型和第二决策树模型，包括：
将处于正在运行状态的第一决策树模型进行复制操作，生成复制的决策树模型；
将所述复制的决策树模型作为所述二决策树模型。

4.根据权利要求1所述的方法，其特征在于，所述分别利用所述第一卷积神经网络模型和所述第二卷积神经网络模型的输出数据来训练所述第一决策树模型和所述第二决策树模型，包括：
获取所述第一卷积神经网络模型全连接层生成的第一特征向量；
将所述第一特征向量和模型训练相关的线上数据一起输入到所述第一决策树模型中，用以训练所述第一决策树模型。

5.根据权利要求1所述的方法，其特征在于，所述分别利用所述第一卷积神经网络模型和所述第二卷积神经网络模型的输出数据来训练所述第一决策树模型和所述第二决策树模型，包括：
获取所述第二卷积神经网络模型全连接层生成的第二特征向量；
将所述第二特征向量和模型训练相关的线上数据一起输入到所述第二决策树模型中，用以训练所述第二决策树模型。

6.根据权利要求1所述的方法，其特征在于，所述基于所述第一决策树模型和所述第二决策树模型训练的结果，分别对所述第一决策树模型和所述第二决策树模型的性能指标...

【专利技术属性】
技术研发人员：白戈，袁泽寰，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人