高效联邦大模型调节方法、系统及相关设备技术方案

技术编号：39405072 阅读：9 留言：0更新日期：2023-11-19 15:57

本申请实施例公开了一种高效联邦大模型调节方法、系统及相关设备，应用于多方计算系统，多方计算系统包括：服务端和N个客户端，N为正整数；方法包括：每一客户端向服务端上传各自的预设大模型的大模型脚本，配置相关的模型训练超参数以及数据资源；初始化本地模型的本地模型参数；利用本地数据训练各自的本地模型；将各自的微调模块的B参数加入DP噪声，再将加入DP噪声后的微调模块上传到服务端；服务端将各个客户端上传的模型参数进行安全聚合操作，得到全局参数，将全局参数下发给N个客户端中的每一客户端；每一客户端利用全局参数更新各自的本地模型的模型参数。采用本申请实施例可以提升大模型的训练效率。可以提升大模型的训练效率。可以提升大模型的训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
高效联邦大模型调节方法、系统及相关设备

[0001]本申请涉及隐私计算
以及计算机
，具体涉及一种高效联邦大模型调节方法、系统及相关设备。

技术介绍

[0002]随着聊天生成预训练转换器(chat generative pre
‑
trained transformer，ChatGPT)的出现，预示着人工智能也正在从感知理解走向生成创造，但是对于智能生成，只有认为它是积极的并且风险是可控的时候，才能开发出更强大的人工智能系统。目前公共领域中的高质量数据是有限的，大模型需要数量更多、质量更好的人工标注数据来提高模型的性能。如何合法的利用手机、物联网上的私有数据将是解决大模型训练数据不足问题的关键。数据隐私之忧已经成为全行业的共识。集中式训练需要把所有的数据上传在一起，存在用户数据泄漏的风险。联邦学习中需要传递模型的参数或梯度，这些数据可能被攻击从而泄漏数据。而除了数据隐私的忧虑之外，由于大模型通常需要消耗大量的算力和数据，而且只有少数大公司拥有足够的资源来训练大模型。因此，如何提升大模型的训练效率的问题亟待解决。

技术实现思路

[0003]本申请实施例提供了一种高效联邦大模型调节方法、系统及相关设备，可以提升大模型的训练效率。
[0004]第一方面，本申请实施例提供一种高效联邦大模型调节方法，应用于多方计算系统，所述多方计算系统包括：服务端和N个客户端，N为正整数；所述方法包括：
[0005]通过所述N个客户端中每一客户端向所述服务端上传各自的预设大模型的大模...

【技术保护点】

【技术特征摘要】
1.一种高效联邦大模型调节方法，其特征在于，应用于多方计算系统，所述多方计算系统包括：服务端和N个客户端，N为正整数；所述方法包括：通过所述N个客户端中每一客户端向所述服务端上传各自的预设大模型的大模型脚本，配置相关的模型训练超参数以及数据资源；通过所述N个客户端中的每一客户端初始化本地模型的本地模型参数；通过所述N个客户端中的每一客户端利用本地数据训练各自的本地模型；通过所述N个客户端中的每一客户端将各自的微调模块的B参数加入DP噪声，再将加入DP噪声后的微调模块上传到所述服务端；通过所述服务端将各个客户端上传的模型参数进行安全聚合操作，得到全局参数，将所述全局参数下发给所述N个客户端中的每一客户端；通过所述N个客户端中的每一客户端利用所述全局参数更新各自的本地模型的模型参数。2.根据权利要求1所述的方法，其特征在于，在所述通过所述N个客户端中的每一客户端初始化本地模型的本地模型参数方面，包括：通过所述N个客户端中的每一客户端使用Zero初始化方法初始化各自的本地模型的本地模型参数。3.根据权利要求2所述的方法，其特征在于，所述通过所述N个客户端中的每一客户端使用Zero初始化方法初始化各自的本地模型的本地模型参数，包括：通过所述N个客户端中的每一客户端对各自的微调模块的A参数执行预设初始化方法；对B参数执行所述Zero初始化方法，所述预设初始化方法为均值为0方差为1的初始化方法。4.根据权利要求1
‑
3任一项所述的方法，其特征在于，所述通过所述N个客户端中的每一客户端利用本地数据训练各自的本地模型，包括：通过客户端i利用本地数据训练本地模型达到设定次数，所述客户端i为所述N个客户端中的任一客户端；在本地损失优化函数的基础上加入t轮关于全局模型正则项，得到所述客户端i的本地优化损失函数，t为正整数。5.根据权利要求4所述的方法，其特征在于，所述在本地损失优化函数的基础上加入t轮关于全局模型正则项，得到所述客户端i的本地优化损失函数，包括：通过所述客户端i按照如下公式确定所述客户端i的本地优化损失函数：y
′
＝weight*X+BA*X其中，weight是所述预设大模型的权重参数；B...

【专利技术属性】
技术研发人员：李振飞，黄一珉，王湾湾，何浩，姚明，
申请(专利权)人：深圳市洞见智慧科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人