基于超网络的联邦学习方法、装置及计算机设备制造方法及图纸

技术编号：34982731 阅读：14 留言：0更新日期：2022-09-21 14:26

本申请涉及人工智能技术，提供了基于超网络的联邦学习方法、装置及计算机设备，是先通过采样获取参与客户端，以组成客户端集合；然后通过超网络获取客户端集合中各客户端的基模型本地层参数，将客户端集合中各客户端的基模型本地层参数发送至对应的客户端；之后接收客户端集合中各客户端发送的更新后模型参数，将各客户端的更新后模型参数进行加权求和，以更新基模型本地层参数；最后在服务端对基模型本地层参数进行判断是否满足收敛条件从而确定是否继续进行模型训练。实现了在服务端中针对各客户端参与联邦学习的梯度偏移基于超网络进行个性化输出，充分考虑到了客户端的数据分布差异，并引导并加速本地基模型训练，提升模型学习效率。模型学习效率。模型学习效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于超网络的联邦学习方法、装置及计算机设备

[0001]本申请涉及人工智能的联邦学习
，尤其涉及一种基于超网络的联邦学习方法、系统、计算机设备及存储介质。

技术介绍

[0002]目前，在供应链金融领域中风控模型的建立比较主流的做法是利用联邦学习技术，联邦学习能够在保持多方数据安全的前提下，打破数据壁垒，实现跨机构间的数据融合，协作训练一个共享模型，有助于提高企业本地模型的精度。联邦学习技术具体是通过企业（客户端）与服务端的参数迭代交互来实现，每一轮的交互过程如下：A1）客户端利用本地数据进行模型训练；A2）客户端将模型参数发送给服务端；A3）服务端对参数进行安全融合更新；A4）服务端将更新完的参数回传给本地客户端进行本地更新。
[0003]但是基于上述联邦学习训练的模型，因为是训练的通用模型，一方面，无法照顾到企业间的数据分布差异，当某个企业的数据分布与整体偏离较大时联邦学习的效果反而不如本地训练。
[0004]另一方面，在联邦学习的设定中，每一轮的通信并不是所有的客户端都会参与，某些客户端的采样间隔太长，导致本地模型的“灾难性遗忘”问题，无法进行连续的学习。

技术实现思路

[0005]本申请实施例提供了一种基于超网络的联邦学习方法、系统、计算机设备及存储介质，旨在解决现有技术中联邦学习训练的通用模型，无法照顾到参与方间的数据分布差异，导致有些参与方因数据分布与整体偏离较大时联邦学习的效果反而不如本地训练的问题。
[0006]第一方面，本申请实施例提供了一种基于超网络的联...

【技术保护点】

【技术特征摘要】
1.一种基于超网络的联邦学习方法，应用于服务端，其特征在于，包括：响应于联邦训练指令，通过采样获取参与客户端，以组成客户端集合；通过超网络获取所述客户端集合中各客户端的基模型本地层参数；将与所述客户端集合中各客户端分别对应的基模型本地层参数发送至对应的客户端；接收所述客户端集合中各客户端发送的更新后模型参数；将所述客户端集合中各客户端的更新后模型参数进行加权求和，以更新所述基模型本地层参数；若所述基模型本地层参数未满足预设的模型收敛条件，生成联邦训练指令，并返回执行所述响应于联邦训练指令，通过采样获取参与客户端，以组成客户端集合的步骤；若所述基模型本地层参数满足所述模型收敛条件，获取所述基模型本地层参数作为基模型的模型参数。2.根据权利要求1所述的基于超网络的联邦学习方法，其特征在于，所述响应于联邦训练指令，通过采样获取参与客户端，以组成客户端集合之前，还包括：对基模型进行初始化得到基模型初始化参数，将所述基模型初始化参数发送至与服务端连接的客户端；对超网络进行初始化得到超网络初始化参数。3.根据权利要求1所述的基于超网络的联邦学习方法，其特征在于，所述通过采样获取参与客户端，以组成客户端集合，包括：获取可用资源和通信效率，基于所述可用资源和通信效率确定采样比例；根据与服务端连接的客户端总数与所述采样比例确定本轮参与客户端总数；通过随机采样与具有所述本轮参与客户端总数的客户端建立连接，以获取所述客户端集合。4.根据权利要求1所述的基于超网络的联邦学习方法，其特征在于，所述通过超网络获取所述客户端集合中各客户端的基模型本地层参数，包括：获取所述客户端集合中的第i号客户端；其中，i的初始取值为1且i的取值范围是[1，N1]，N1表示所述客户端集合中所包括客户端的总个数；获取所述第i号客户端的客户端ID、客户端历史采样轮次和历史梯度偏移；将所述第i号客户端的客户端ID、客户端历史采样轮次和历史梯度偏移输出至所述超网络进行运算，得到所述第i号客户端的当前梯度偏移；将i自增1以更新i的取值；若i小于或等于N1，返回执行所述获取所述客户端集合中的第i号客户端的步骤；若i大于N1，获取第1号客户端的当前梯度偏移至第N1号客户端的当前梯度偏移，组成所述客户端集合中各客户端的基模型...

【专利技术属性】
技术研发人员：罗伟杰，
申请(专利权)人：深圳前海环融联易信息科技服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人