模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号：38937527 阅读：12 留言：0更新日期：2023-09-25 09:38

本申请公开了一种模型训练方法、装置、设备及存储介质。第一客户端将第一客户端中的第一任务对应的有标签数据输入第一模型中的第一骨干网络得到第一特征，第一骨干网络的第一网络权重参考了第一结果和第二结果，第一结果是第一客户端使用第一客户端中的无标签数据对第一骨干网络进行训练的训练结果，第二结果是第二客户端使用第二客户端中的无标签数据对第二模型中的第二骨干网络进行训练的训练结果，第一模型用于执行第一任务，第二模型用于执行第二任务，第一任务和第二任务是不同的任务；第一客户端通过第一特征对第一模型中的第一任务网络进行训练。本申请实施例可以充分利用不同客户端的本地数据进行模型训练，提升模型效果。模型效果。模型效果。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置、设备及存储介质

[0001]本申请涉及机器学习
，尤其涉及一种模型训练方法、装置、设备及存储介质。

技术介绍

[0002]随着人工智能技术的发展，为了解决数据孤岛的问题，人们提出了联邦学习(federatedlearning)的概念。联邦学习本质上是一种分布式机器学习技术，它的目标是在保障数据隐私安全的前提下让多个参与方协作进行机器学习模型的训练，以提升模型的效果。
[0003]目前的联邦学习方法只支持对不同客户的相同任务进行联合建模，因此，对于具有不同任务需求的客户来说，他们是无法利用现有的联邦学习方法进行联合建模的，导致这些客户的本地数据无法得到很好地利用。

技术实现思路

[0004]为了解决现有技术中存在的上述问题，本申请实施例中提供一种模型训练方法、装置、设备及存储介质，支持为不同客户的不同任务进行联合建模，拓宽了联邦学习的应用场景，可以充分利用各个客户本地的数据进行模型训练，提升模型效果。
[0005]第一方面，本申请提供了一种模型训练方法，用于第一客户端，该方法包括：将第一客户端中的第一任务对应的有标签数据输入第一模型中的第一骨干网络，得到第一特征，其中，第一骨干网络的第一网络权重参考了第一结果和第二结果，第一结果是第一客户端使用第一客户端中的无标签数据对第一骨干网络进行训练的训练结果，第二结果是第二客户端使用第二客户端中的无标签数据对第二模型中的第二骨干网络进行训练的训练结果，第一模型用于执行第一任务，第二模型用于执行第二任务，第一任务和第二任务...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，用于第一客户端，所述方法包括：将第一客户端中的第一任务对应的有标签数据输入第一模型中的第一骨干网络，得到第一特征，其中，所述第一骨干网络的第一网络权重参考了第一结果和第二结果，所述第一结果是所述第一客户端使用所述第一客户端中的无标签数据对所述第一骨干网络进行训练的训练结果，所述第二结果是第二客户端使用所述第二客户端中的无标签数据对第二模型中的第二骨干网络进行训练的训练结果，所述第一模型用于执行所述第一任务，所述第二模型用于执行第二任务，所述第一任务和所述第二任务是不同的任务；通过所述第一特征对所述第一模型中的第一任务网络进行训练。2.根据权利要求1所述的方法，其特征在于，所述第一客户端中的无标签数据包括所述第一任务对应的无标签数据，所述第二客户端中的无标签数据包括所述第二任务对应的无标签数据。3.根据权利要求1或2所述的方法，其特征在于，所述通过所述第一特征对所述第一模型中的第一任务网络进行训练，包括：将所述第一特征输入所述第一模型中的所述第一任务网络，得到预测值；根据所述预测值和所述第一客户端中的所述第一任务对应的有标签数据更新所述第一任务网络，得到第二网络权重。4.根据权利要求3所述的方法，其特征在于，在所述得到第二网络权重之后，所述方法还包括：将所述第二网络权重发送给服务端；接收所述服务端发送的第三网络权重，其中，所述第三网络权重参考了所述第二网络权重和第三结果，所述第三结果是第三客户端使用所述第三客户端中的所述第一任务对应的有标签数据对第三模型进行训练的训练结果，所述第三模型包括第三骨干网络和第二任务网络，所述第三模型用于执行所述第一任务；使用所述第三网络权重更新所述第一任务网络。5.一种模型训练方法，其特征在于，用于服务端，所述方法包括：将服务端中的第一任务对应的有标签数据输入第一模型中的第一骨干网络，得到第一特征，其中，所述第一骨干网络的第一网络权重参考了第一结果和第二结果，所述第一结果是第一客户端使用所述第一客户端中的无标签数据对第二模型中的第二骨干网络进行训练的训练结果，所述第二结果是第二客户端使用所述第二客户端中的无标签数据对第三模型中的第三骨干网络进行训练的训练结果，所述第二模型用于执行所述第一任务，所述第三模型用于执行第二任务，所述第一任务和所述第二任务是不同的任务；通过所述第一特征对所述第一模型中的第一任务网络进行训练。6.根据权利要求5所述的方法，其特征在于，所述第一客户端中的无标签数据包括所述第一任务对应的无标签数据，所述第二客户端中的无标签数据包括所述第二任务对应的无标签数据。7.根据权利要求5或6所述的方法，其特征在于，所述通过所述第一特征对所述第一模型中的第一任务网络进行训练，包括：将所述第一特征输入所述第一模型中的所述第一任务网络，得到预测值；根据所述预测值和所述服务端中的所述第一任务对应的有标签数据更新所述第一任
务网络，得到第二网络权重。8.根据权利要求7所述的方法，其特征在于，所述方法还包括：接收所述第一客户端发送的第三网络权重，其中，所述第三网络权重是所述第一客户端使用所述第一客户端中的所述第一任务对应的有标签数据对所述第二模型进行训练的训练结果，所述第二模型包括所述第二骨干网络和第二任务网络；根据所述第三网络权重和所述第二网络权重聚合得到第四网络权重，使用所述第四网络权重更新所述第一任务网络。9.一种装置，其特征在于，所述装置包括：处理模块，用于将所述装置中的第一任务对应的有标签数据输入第一模型中的第一骨干网络，得到第一特征，其中，所述第一骨干网络的第一网络权重参考了第一结果和第二结果，所述第一结果是所述装置使用所述装置中的无标签数据对所述第一骨干网络进行训练的训练结果，所述第二结果是第...

【专利技术属性】
技术研发人员：王小辉，张亚斌，吴学文，韩承志，唐强，陈安伟，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人