联邦学习方法、装置、服务器、电子设备及可读存储介质制造方法及图纸

技术编号:37203908 阅读:10 留言:0更新日期:2023-04-20 22:58
本公开提供一种联邦学习方法、装置、服务器、电子设备及可读存储介质,涉及人工智能技术,尤其涉及深度学习、联邦学习领域。具体实现方案包括:接收来自每个电子设备的模型特征图。根据每个电子设备的模型特征图,获取每个电子设备对应的丢弃率。根据待训练的模型以及每个电子设备对应的丢弃率,生成每个电子设备对应的子模型。将子模型下发给对应的电子设备,以使得接收到子模型的电子设备根据本地数据更新子模型。接收来自电子设备的更新后的子模型,根据接受到的每个更新后的子模型进行汇总,对待训练的模型进行更新。由于在生成子模型时考虑了对应电子设备的数据特征,使得剪枝更精准。相应的,训练得到的模型精度也更高。训练得到的模型精度也更高。训练得到的模型精度也更高。

【技术实现步骤摘要】
联邦学习方法、装置、服务器、电子设备及可读存储介质


[0001]本公开涉及人工智能技术,尤其涉及深度学习、联邦学习领域。

技术介绍

[0002]联邦学习(Federated Learning,FL)可以在设备不传输原始数据的情况下,协同多个设备训练一个全局模型。
[0003]目前,联邦学习的训练过程通常对应多个回合,每个回个分别执行三个步骤,即服务器向选定的设备发送全局模型。选定的设备用本地数据更新全局模型,并将更新的模型上传到服务器。服务器用上传的模型进行模型聚合。其中,在联邦学习过程中,会通过剪枝(dropout)减少全局模型的大小,以减少通信和计算成本。
[0004]但是,现有技术中的剪枝技术不够智能,进而会导致全局模型的精度降低。

技术实现思路

[0005]本公开提供了一种联邦学习方法、装置、服务器、电子设备及可读存储介质,能够实现自适应随机剪枝,以改善现有技术中的剪枝技术不够智能而导致全局模型的精度降低的问题。
[0006]根据本公开的第一方面,提供了一种联邦学习方法,应用于联邦学习场景,联邦学习场景中包括N个电子设备和一个服务器,每个电子设备与服务器通信连接,N为正整数,该方法应用于服务器,包括:
[0007]接收来自每个电子设备的模型特征图,模型特征图是电子设备根据本地数据生成的。根据每个电子设备的模型特征图,获取每个电子设备对应的丢弃率。根据待训练的模型以及每个电子设备对应的丢弃率,生成每个电子设备对应的子模型。将子模型下发给对应的电子设备,以使得接收到子模型的电子设备根据本地数据更新子模型。接收来自电子设备的更新后的子模型,根据接受到的每个更新后的子模型进行汇总,对待训练的模型进行更新。
[0008]根据本公开的第二方面,提供了一种联邦学习方法,应用于联邦学习场景,联邦学习场景中包括N个电子设备和一个服务器,每个电子设备与服务器通信连接,N为正整数,该方法应用于电子设备,包括:根据电子设备的本地数据,生成模型特征图。将模型特征图发送给服务器。接收服务器下发的子模型,子模型是服务器根据模型特征图获取到的丢弃率和待训练的模型生成的。根据本地数据对子模型进行更新,得到更新后的子模型。将更新后的子模型发送给服务器。
[0009]根据本公开的第三方面,提供了一种联邦学习装置,应用于联邦学习场景,联邦学习场景中包括N个电子设备和一个服务器,每个电子设备与服务器通信连接,N为正整数,该装置应用于服务器,包括:接收模块,用于接收来自每个电子设备的模型特征图,模型特征图是电子设备根据本地数据生成的。获取模块,用于根据每个电子设备的模型特征图,获取每个电子设备对应的丢弃率。生成模块,用于根据待训练的模型以及每个电子设备对应的
丢弃率,生成每个电子设备对应的子模型。下发模块,用于将子模型下发给对应的电子设备,以使得接收到子模型的电子设备根据本地数据更新子模型。汇总模块,用于接收来自电子设备的更新后的子模型,根据接受到的每个更新后的子模型进行汇总,对待训练的模型进行更新。
[0010]根据本公开的第四方面,提供了一种联邦学习装置,应用于联邦学习场景,联邦学习场景中包括N个电子设备和一个服务器,每个电子设备与服务器通信连接,N为正整数,该装置应用于电子设备,包括:生成模块,用于根据电子设备的本地数据,生成模型特征图。发送模块,用于将模型特征图发送给服务器。接收模模块,用于接收服务器下发的子模型,子模型是服务器根据模型特征图获取到的丢弃率和待训练的模型生成的。更新模块,用于根据本地数据对子模型进行更新,得到更新后的子模型。发送模块,还用于将更新后的子模型发送给服务器。
[0011]根据本公开的第五方面,提供了一种服务器,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面提供的方法。
[0012]根据本公开的第六方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第二方面提供的方法。
[0013]根据本公开的第七方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行根据第一方面提供的方法。
[0014]根据本公开的第八方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行根据第二方面提供的方法。
[0015]根据本公开的第九方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据第一方面提供的方法。
[0016]根据本公开的第十方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据第二方面提供的方法。
[0017]本公开通过根据来自电子设备的模型特征图获取每个电子设备对应的丢弃率,根据丢弃率和待训练模型,生成每个电子设备对应的子模型。然后将生成的子模型下发给对应的电子设备进行更新,最后根据电子设备上传的更新后的子模型,汇总更新待训练模型。由于在生成子模型时考虑了对应电子设备的数据特征,使得剪枝更精准。相应的,训练得到的模型精度也更高。
[0018]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0019]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0020]图1示出了一种联邦学习方法的应用场景图;
[0021]图2为本公开实施例提供的一种应用于服务器的联邦学习方法的流程示意图;
[0022]图3为本公开实施例提供的一种联邦学习方法中更新电子设备对应的丢弃率的流程示意图;
[0023]图4为本公开实施例提供的一种联邦学习方法中获取全局丢弃率的流程示意图;
[0024]图5为本公开实施例提供的一种应用于电子设备的联邦学习方法的流程示意图;
[0025]图6为本公开实施例提供的一种应用于服务器的联邦学习装置的组成示意图;
[0026]图7为本公开实施例提供的一种应用于电子设备的联邦学习装置的组成示意图;
[0027]图8示出了可以用来实施本公开的实施例的示例服务器800的示意性框图;
[0028]图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。
具体实施方式
[0029]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0030]联邦学习(Federated Le本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种联邦学习方法,应用于联邦学习场景,所述联邦学习场景中包括N个电子设备和一个服务器,每个所述电子设备与所述服务器通信连接,N为正整数,其特征在于,所述方法应用于所述服务器,所述方法包括:接收来自每个所述电子设备的模型特征图,所述模型特征图是所述电子设备根据本地数据生成的;根据每个所述电子设备的模型特征图,获取每个所述电子设备对应的丢弃率;根据待训练的模型以及每个所述电子设备对应的丢弃率,生成每个所述电子设备对应的子模型;将所述子模型下发给对应的所述电子设备,以使得接收到所述子模型的所述电子设备根据本地数据更新所述子模型;接收来自所述电子设备的更新后的子模型,根据接受到的每个所述更新后的子模型进行汇总,对所述待训练的模型进行更新。2.根据权利要求1所述的方法,其特征在于,在所述根据每个所述电子设备的模型特征图,获取每个所述电子设备对应的丢弃率之后,所述方法还包括:当对所述待训练的模型更新预设次数后,更新每个所述电子设备对应的丢弃率。3.根据权利要求2所述的方法,其特征在于,所述更新每个所述电子设备对应的丢弃率,包括:接受来自每个所述电子设备的预期丢弃率;根据每个所述电子设备的所述预期丢弃率,获取全局丢弃率;根据所述全局丢弃率更新每个所述电子设备对应的丢弃率。4.根据权利要求3所述的方法,其特征在于,所述根据每个所述电子设备的所述预期丢弃率,获取全局丢弃率,包括:根据每个所述电子设备的所述预期丢弃率,获取每个所述电子设备更新所述子模型的预期执行时间;根据最长的预期执行时间,更新每个所述电子设备的丢弃率,以使得每个所述电子设备的预期执行时间与所述最长的预期执行时间相同或相近;根据每个电子设备更新后的丢弃率,获取全局丢弃率。5.根据权利要求1

4任一项所述的方法,其特征在于,所述将所述子模型下发给对应的所述电子设备,包括:根据预设的比例确定电子设备中的训练电子设备,所述训练电子设备为用于进行所述联邦学习的电子设备;下发每个所述训练电子设备对应的所述子模型,以使得接收到所述子模型的所述训练电子设备根据本地数据更新所述子模型。6.一种联邦学习方法,应用于联邦学习场景,所述联邦学习场景中包括N个电子设备和一个服务器,每个所述电子设备与所述服务器通信连接,N为正整数,其特征在于,所述方法应用于所述电子设备,所述方法包括:根据所述电子设备的本地数据,生成模型特征图;将所述模型特征图发送给所述服务器;接收所述服务器下发的子模型,所述子模型是所述服务器根据所述模型特征图获取到
的丢弃率和待训练的模型生成的;根据所述本地数据对所述子模型进行更新,得到更新后的子模型;将所述更新后的子模型发送给所述服务器。7.根据权利要求6所述的方法,其特征在于,所述根据所述电子设备的本地数据,生成模型特征图,包括:获取待训练模型;根据所述待训练模型和所述本地数据,生成所述模型特征图。8.根据权利要求6或7所述的方法,其特征在于,在所述得到更新后的子模型后,还包括:根据所述子模型的参数和所述更新后的子模型的参数,计算所述电子设备的预期丢弃率。9.一种联邦学习装置,应用于联邦学习场景,所述联邦学习场景中包括N个电子设备和一个服务器,每个所述电子设备与所述服务器通信连接,N为正整数,其特征在于,所述装置应用于所述服务器,所述装置包括:接收模块,用于接收来自每个所述电子设备的模型特征图,所述模型特征图是所述电子设备根据本地数据生成的;获取模块,用于根据每个所述电子设备的模型特征图,获取每个所述电子设备对应的丢弃率;生成模块,用于根据待训练的模型以及每个所述电子设备对应的丢弃率,生成每个所述电子设备对应的子模型;下发模块,用于将...

【专利技术属性】
技术研发人员:刘吉李铄窦德景
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1