一种基于联邦学习模型的训练方法技术

技术编号：39420550 阅读：15 留言：0更新日期：2023-11-19 16:09

本发明专利技术属于联邦学习领域，提供了一种基于联邦学习模型的训练方法，包括以下步骤：S11，定义问题：确定需要解决的机器学习问题、本地数据的来源、以及参与联邦学习的设备或节点；S12，模型选择和初始化：选择相应的模型，并在所有的本地设备或节点上初始化相应的模型，并下发至所有用户端；S13，本地训练：每个本地设备或节点使用其本地数据集对初始化的模型进行训练，得到一个本地模型；S14，模型聚合：在中央服务器上聚合本地模型；本发明专利技术通过在每个本地设备或节点都可以进行本地模型的训练和更新，进一步分散计算负载，提高训练速度和效率；通过设定停止条件来控制模型更新的频率，进而避免过度拟合等问题。避免过度拟合等问题。避免过度拟合等问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于联邦学习模型的训练方法

[0001]本专利技术属于联邦学习领域，具体地说是一种基于联邦学习模型的训练方法。

技术介绍

[0002]联邦学习是一种新兴的机器学习技术，它使用节点(例如边缘服务器及终端设备)的本地数据集进行分布式模型训练。与传统的在远程云端服务器上上传节点原始数据的机器学习相比，联邦学习中的节点只共享模型参数而不上传原始数据，因此它能够为网络节点提供隐私保护。
[0003]中国专利CN112348199B公开了一种基于联邦学习与多任务学习的模型训练方法，通过对几个任务同时训练共同或相关的网络层，使得多个任务互相促进训练准确性，提高了模型收敛速率与泛化能力，获得目标神经网络高效训练的同时，能够保证基础数据的私密性与安全性，通过将目标神经网络模型进行了拆分更新、传输，本专利技术设计对用户隐私保护能力较传统联邦学习有所提高，目标神经网络模型中后部模型自适应的按照任务的相关性进行更新，整个模型拥有较好的个性化，并且模型加入异步的模型后半段参数共享，使得带宽富裕节点得到更有效地利用。
[0004]上述专利虽然通过对几个任务同时训练，可以达到高效训练的效果，但是上述专利在训练时只有中央服务器进行模型的聚合和更新，会增大计算负载，而且很难控制各个本地设备或节点的模型更新频率，容易出现模型过度拟合，并且在训练时直接计算所有本地数据，会增大内存的消耗等问题。
[0005]为此，本领域技术人员提出了一种基于联邦学习模型的训练方法来解决
技术介绍
提出的问题。

技术实现思路

[000...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习模型的训练方法，其特征在于，包括以下步骤：S11，定义问题：确定需要解决的机器学习问题、本地数据的来源、以及参与联邦学习的设备或节点；S12，模型选择和初始化：选择相应的模型，并在所有的本地设备或节点上初始化相应的模型，并下发至所有用户端；S13，本地训练：每个本地设备或节点使用其本地数据集对初始化的模型进行训练，得到一个本地模型；S14，模型聚合：在中央服务器上聚合本地模型；S15，循环迭代：重复进行本地训练和模型聚合直到满足预设的停止条件；S16，发布模型：停止训练后，将全局模型发布给所有本地设备或节点，使它们可以使用最新的模型进行推断或预测。2.如权利要求1所述一种基于联邦学习模型的训练方法，其特征在于：所述步骤S13中本地训练的方法包括以下步骤：S21，下载全局模型：从中央服务器下载共享的全局模型，作为本地训练的起点；S22，加载数据：将本地数据集加载到内存中，并将其拆分成多个小批次；S23，初始化模型：在本地设备上初始化全局模型并设置准确率P；S24，周期训练：使用本地数据集对初始化的模型进行训练，迭代执行多个小批次的训练，同时对模型参数进行更新并保存到本地磁盘上；S25，检查训练结果：检查当前客户端训练的准确率P
’
；S26，将本地模型上传到服务器：每个客户端将训练好的模型上传到服务端；S27，更新客户端模型：服务器将新的全局模型推送到各个客户端，用于更新本地模型；S28，重复迭代：重复以上步骤，直到模型收敛或达到预设的停止条件为止；S29，返回本地模型：训练完成后，返回训练得到的本地模型给中央联邦服务器进行模型聚合。3.如权利要求2所述一种基于联邦学习模型的训练方法，其特征在于：所述步骤S25中检查训练结果的方法包括以下步骤：S31，计算当前客户端的准确率P
’
；S32，判断前客户端的准确率P
’
是否大于等于预定准确率P；S33，若是，返回训练成功...

【专利技术属性】
技术研发人员：刘睿霖，程娇，杜金浩，张震，石瑾，高圣翔，刘发强，
申请(专利权)人：国家计算机网络与信息安全管理中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人