协同训练方法及装置、业务预测方法及装置制造方法及图纸

技术编号：38205379 阅读：6 留言：0更新日期：2023-07-21 16:51

本说明书实施例披露一种协同训练方法及装置，以及一种业务预测方法及装置。协同训练方法由第一方执行，包括：先利用第一方部署的第一预测模型中的第一嵌入层处理训练样本的第一特征部分，得到第一嵌入表征，并从第二方接收第二嵌入表征，其由第二方利用第二预测模型中的第二嵌入层处理训练样本的第二特征部分而得到；再利用第一预测模型中的第一预测层处理第一嵌入表征和第二嵌入表征的第一融合表征，得到第一预测结果，并从第二方接收第二预测结果，其由第二方利用第二预测模型对训练样本进行预测而得到；之后基于第一预测结果、第二预测结果和训练样本的真实标签，训练第一预测模型。上述业务预测方法由第一方基于训练好的第一预测模型而执行。好的第一预测模型而执行。好的第一预测模型而执行。

全部详细技术资料下载

【技术实现步骤摘要】
协同训练方法及装置、业务预测方法及装置

[0001]本说明书一个或多个实施例涉及机器学习
，尤其涉及一种协同训练方法及装置，以及一种业务预测方法及装置。

技术介绍

[0002]计算机技术的发展，使得机器学习在各种各样的业务场景中得到越来越广泛的应用。联邦学习（Federated Learning，简称FL）实现在隐私保护基础上，有效打破数据孤岛，实现多方联合建模。
[0003]然而，目前已有的联邦学习算法存在局限性。因此，需要一种联邦学习方案，可以更好地满足实际应用需求，例如，支持各参与方采用不同的模型结构，实现双向协同等。

技术实现思路

[0004]本说明书实施例描述一种协同训练方法及装置，以及一种业务预测方法及装置，可以更好地满足实际应用需求。
[0005]根据第一方面，提供一种协同训练方法，由第一方执行，包括：
[0006]利用第一方部署的第一预测模型中的第一嵌入层处理训练样本的第一特征部分，得到第一嵌入表征；从第二方接收第二嵌入表征，其由所述第二方利用第二预测模型中的第二嵌入层处理所述训练样本的第二特征部分而得到；利用所述第一预测模型中的第一预测层处理所述第一嵌入表征和第二嵌入表征的第一融合表征，得到第一预测结果；从所述第二方接收第二预测结果，其由所述第二方利用所述第二预测模型对所述训练样本进行预测而得到；基于所述第一预测结果、第二预测结果和所述训练样本的真实标签，训练所述第一预测模型。
[0007]在一个实施例中，所述第一预测模型还具有第一融合层；所述方...

【技术保护点】

【技术特征摘要】
1.一种协同训练方法，由第一方执行，包括：利用第一方部署的第一预测模型中的第一嵌入层处理训练样本的第一特征部分，得到第一嵌入表征；从第二方接收第二嵌入表征，其由所述第二方利用第二预测模型中的第二嵌入层处理所述训练样本的第二特征部分而得到；利用所述第一预测模型中的第一预测层处理所述第一嵌入表征和第二嵌入表征的第一融合表征，得到第一预测结果；从所述第二方接收第二预测结果，其由所述第二方利用所述第二预测模型对所述训练样本进行预测而得到；基于所述第一预测结果、第二预测结果和所述训练样本的真实标签，训练所述第一预测模型。2.根据权利要求1所述的方法，其中，所述第一预测模型还具有第一融合层；所述方法还包括：利用所述第一融合层处理所述第一嵌入表征和第二嵌入表征，得到所述第一融合表征。3.根据权利要求1所述的方法，其中，还包括：在所述第一嵌入表征中添加差分隐私噪声，得到加躁嵌入表征；将所述加躁嵌入表征发送给所述第二方。4.根据权利要求1所述的方法，其中，基于所述第一预测结果、第二预测结果和所述训练样本的真实标签，训练所述第一预测模型，包括：根据第一损失项和第二损失项确定第一训练损失，所述第一损失项与所述第一预测结果和所述真实标签之间的差距正相关，第二损失项与所述第一预测结果和第二预测结果之间的差距正相关；基于所述第一训练损失，训练所述第一预测模型。5.根据权利要求4所述的方法，其中，根据第一损失项和第二损失项确定第一训练损失，包括：基于第一权重系数对第一损失项和第二损失项加权求和；其中，所述第一权重系数不同于第二权重系数，所述第二权重系数是所述第二方对应训练所述第二预测模型所采用的权重系数。6.根据权利要求1所述的方法，其中，基于所述第一预测结果、第二预测结果和所述训练样本的真实标签，训练所述第一预测模型，包括：在所述第二预测结果指示的预测标签与所述真实标签一致的情况下，利用所述第一预测结果、真实标签和第二预测结果确定第一训练损失，训练所述第一预测模型。7.根据权利要求1所述的方法，其中，基于所述第一预测结果、第二预测结果和所述训练样本的真实标签，训练所述第一预测模型，包括：在所述第二预测结果指示的预测标签与所述真实标签不一致的情况下，仅利用所述第一预测结果和真实标签确定第一训练损失，训练所述第一预测模型。8.根据权利要求1所述的方法，其中，所述第一方为服务端，所述第二方是所述服务端的多个客户端之一；或者，
所述第二方为服务端，所述第一方是所述服务端的多个客户端之一。9.根据权利要求1
‑
7中任一项所述的方法，其中，所述第一方为服务端，所述第二方是所述服务端的多个客户端之一；其中，所述第一预测模型的模型参数数量大于所述第二预测模型的模型参数数量，和/或，所述第一预测模型的神经网络层数大于所述第二预测模型的神经网络...

【专利技术属性】
技术研发人员：李群伟，钟文亮，魏鹏，孙仁恩，林建滨，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人