一种基于联邦学习的受控共享学习方法及系统技术方案

技术编号：27314063 阅读：26 留言：0更新日期：2021-02-10 09:42

本发明专利技术提供一种基于联邦学习的受控共享学习方法及系统，包括接收各客户端模型V

全部详细技术资料下载

【技术实现步骤摘要】
一种基于联邦学习的受控共享学习方法及系统

[0001]本专利技术涉及计算机软件领域，尤其涉及一种基于联邦学习的受控共享学习方法及系统。

技术介绍

[0002]数据作为人工智能技术的基石，随着人工智能技术的快速发展，数据安全隐私问题受到人们的广泛关注。由于数据隐私、通信安全等问题，导致深度学习模型无法充分利用这些数据。故人们为解决这类问题，提出了诸如联邦学习、共享学习等分布式机器学习方法。这些方法能够在不直接暴露本地数据的前提下，使得模型有效学习到各个客户端的本地数据。
[0003]联邦学习是指通过在多个相互独立的客户端上进行机器学习，并在服务端联合客户端模型梯度的一种方法。联邦学习是通过聚合各个客户端的模型，以此进行机器学习建模的方法。客户端无需向其他客户端暴露本地数据，只上传客户端训练好的模型相关参数即可。因而联邦学习可以在有效利用数据的前提下，保证客户端的数据不被泄露。
[0004]联邦学习的一轮完整流程是：客户端根据本地的数据来训练模型，客户端发送模型梯度至服务端，服务端对梯度参数进行加权平均后发送回客户端，客户端根据收到的梯度参数进行梯度下降，以此更新模型。联邦学习中的客户端之间是相互独立、阻断通信的，因此数据不会被直接泄露给外部，是一种能够很好地保护客户端数据隐私与安全的学习方法。
[0005]一般的联邦学习要求客户端模型架构一致，这对于客户端的数据与算力提出了一定的要求。并且当模型体积较大时，会提高客户端与服务端间的通信成本。更甚，现在已有技术可根据模型梯度还原客户端的本地数据，例...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的受控共享学习方法，适用于一服务端与若干客户端组成的网络系统，其步骤包括：1)接收各客户端模型V
i,t
的参数，并根据参数从各客户端中选取一或多个共享客户端，向共享的客户端发送共享指令，其中i为客户端序号，t为完成联邦学习次数，t≥0，模型V
i,0
通过各客户端的算力构建并依据相应私有数据集训练得到，且各模型V
i,0
的分类模块架构一致；2)获取共享客户端模型V
i,t
的分类模块参数S
t
，并将计算得到的分类模块参数S
t+1
发送至各客户端，以使各客户端依据私有数据集与分类模块参数S
t+1
得到模型V
i,t+1
。2.如权利要求1所述的方法，其特征在于，训练模型V
i,0
之前，对私有数据集进行预处理；所述预处理包括：数据清洗和数据加强。3.如权利要求1所述的方法，其特征在于，除分类模块之外，模型V
i,0
的其它模块架构可灵活设计。4.如权利要求1所述的方法，其特征在于，所述服务端设置一时间阈值；若发送指令后，超过该时间阈值，则不再接收客户端模型V
i,t
的分类模块参数S
t
。5.如权利要求1所述的方法，其特征在于，所述参数包括：梯度值之和。6.如权利要求1所述的方法，其特征在于，通过以下步骤选取若干共享客户端：1)将模型V
i,t
梯度值之和由小到大进行排序；2)选取...

【专利技术属性】
技术研发人员：葛仕明，卢江虎，王伟平，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人