联邦学习模型训练方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：36965274 阅读：49 留言：0更新日期：2023-03-22 19:25

本发明专利技术实施例公开了联邦学习模型训练方法、装置、计算机设备及存储介质。所述方法包括：获取来自服务器端的全局模型梯度和部分全局模型参数，以得到初始参数；利用所述初始参数更新本地模型；随机选取部分样本数据迭代训练所述本地模型，以得到本地模型梯度和部分本地模型参数；发送本地模型梯度和部分本地模型参数至服务器端，以由服务器端更新全局模型，当全局模型未收敛时，发送所述全局模型梯度以及部分全局模型参数，并执行所述获取来自服务器端的全局模型梯度和部分全局模型参数，以得到初始参数。通过实施本发明专利技术实施例的方法可实现采用低时间成本获取性能良好的全局模型，缩短联邦学习整体训练时间。短联邦学习整体训练时间。短联邦学习整体训练时间。

全部详细技术资料下载

【技术实现步骤摘要】
联邦学习模型训练方法、装置、计算机设备及存储介质

[0001]本专利技术涉及计算机，更具体地说是指联邦学习模型训练方法、装置、计算机设备及存储介质。

技术介绍

[0002]近年来机器学习、深度学习技术在计算机视觉、自然语言处理等领域得到了迅猛发展。特别是深度学习往往需要大量的训练数据才可以得到性能良好的深度学习模型。联邦学习是一种新的机器学习范式，其目的是保护数据隐私安全的同时解决“数据孤岛”问题，旨在让多个参与方共同训练机器学习模型，同时确保各参与方的本地数据分散化，即各参与方之间的数据不可互相访问。其中FedAvg是最常用的联邦学习算法框架，首先参与训练的客户端从服务器下载全局模型用于本地训练，其次客户端让本地模型在本地数据上进行多次迭代训练，再将本地模型的信息，如模型梯度上传至服务器，然后服务器将接收到的模型梯度加权平均后用于更新全局模型，再将新的全局模型信息发送至各客户端，最后重复上述过程，直至全局模型收敛或达到期望性能。
[0003]传统的联邦学习算法框架如FedAvg等，在本地训练中本地模型遍历本地数据至少一次，通常会遍历本地数据多次，客户端才会与服务器通进行通信并传递模型信息，这种方式会造成本地训练时间长，进而造成联邦学习整体训练时间长。特别是面向非独立同分布的训练数据场景时，即客户端间的训练数据是非独立同分布，不同客户端的本地训练数据分布与全局分布存在差异，本地模型目标的最优解与全局模型目标的最优解不一致，这种情况会阻碍联邦学习模型收敛，使其需要更多的通信轮次才能获得最优的全局模型，这种情况导...

【技术保护点】

【技术特征摘要】
1.联邦学习模型训练方法，应用于一客户端，其特征在于，包括：获取来自服务器端的全局模型梯度和部分全局模型参数，以得到初始参数；利用所述初始参数更新本地模型；随机选取部分样本数据迭代训练所述本地模型，以得到本地模型梯度和部分本地模型参数；发送本地模型梯度和部分本地模型参数至服务器端，以由服务器端更新全局模型，当全局模型未收敛时，发送所述全局模型梯度以及部分全局模型参数，并执行所述获取来自服务器端的全局模型梯度和部分全局模型参数，以得到初始参数。2.根据权利要求1所述的联邦学习模型训练方法，其特征在于，所述随机选取部分样本数据迭代训练所述本地模型，以得到本地模型梯度和部分本地模型参数，包括：将样本数据划分为若干个部分样本数据，以得到若干组数据；随机选取一组数据迭代训练所述本地模型，以得到本地模型梯度和部分本地模型参数。3.根据权利要求1所述的联邦学习模型训练方法，其特征在于，所述发送本地模型梯度和部分本地模型参数至服务器，以由服务器更新全局模型，当全局模型未收敛时，发送所述全局模型梯度以及部分全局模型参数，并执行所述获取来自服务器的全局模型梯度和部分全局模型参数，以得到初始参数，包括：发送本地模型梯度和部分本地模型参数至服务器，以由服务器更新全局模型，当全局模型未收敛时，将不同客户端上传的本地模型梯度和部分本地模型参数分别实施加权平均，并利用加权平均后的模型梯度和少量模型参数更新全局模型，并执行所述获取来自服务器的全局模型梯度和部分全局模型参数，以得到初始参数。4.联邦学习模型训练方法，应用于一服务器端，其特征在于，包括：初始化全局模型；发送所述全局模型梯度和部分全局模型参数至客户端，以使得客户端根据所述全局模型梯度和部分全局模型参数更新本地模型，并随机选取部分样本数据迭代训练所述本地模型，以得到本地模型梯度和部分本地模型参数，上传本地模型梯度和部分本地模型参数至服务器端；接收各个客户端上传的本地模型梯度和部分本地模型参数；对各个客户端上传的本地模型梯度和部分本地模型参数分别进行...

【专利技术属性】
技术研发人员：杜杰，李炜，刘鹏，汪天富，
申请(专利权)人：深圳大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人