System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于联邦学习的模型训练方法及相关装置制造方法及图纸_技高网

基于联邦学习的模型训练方法及相关装置制造方法及图纸

技术编号:40347688 阅读:4 留言:0更新日期:2024-02-09 14:32
本申请涉及人工智能技术领域,提供一种基于联邦学习的模型训练方法及相关装置,用以解决非独立同分布场景下的客户端漂移问题,该方法包括:服务器将初始全局模型发送给各在线客户端分别进行训练,并根据各在线客户端各自训练得到的本地化全局模型进行模型聚合,获得新全局模型,同时,基于各本地化全局模型,利用无数据知识蒸馏技术,训练得到目标样本生成器;然后,将目标样本生成器和新全局模型分发给在线客户端,将目标样本生成器和初始全局模型分发给再次上线的掉线客户端。通过目标样本生成器可以增强训练样本的数据多样性,从而帮助每个客户端生成相应的个性化模型,以减轻客户端漂移问题。

【技术实现步骤摘要】

所属的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。基于相同的专利技术构思,本申请实施例还提供一种电子设备。在一种实施例中,该电子设备可以是服务器,也可以是终端设备。参阅图15所示,其为本申请实施例中提供的一种可能的电子设备的结构示意图,图15中,电子设备1500包括:处理器1510和存储器1520。其中,存储器1520存储有可被处理器1510执行的计算机程序,处理器1510通过执行存储器1520存储的指令,可以执行上述基于联邦学习的模型训练方法的步骤。存储器1520可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,ram);存储器1520也可以是非易失性存储器(non-volatilememory),例如只读存储器(read-only memory,rom),快闪存储器(flash memory),硬盘(hard disk drive,hdd)或固态硬盘(solid-state drive,ssd);或者存储器1520是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器1520也可以是上述存储器的组合。处理器1510可以包括一个或多个中央处理单元(central processing unit,cpu)或者为数字处理单元等等。处理器1510,用于执行存储器1520中存储的计算机程序时实现上述基于联邦学习的模型训练方法。在一些实施例中,处理器1510和存储器1520可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。本申请实施例中不限定上述处理器1510和存储器1520之间的具体连接介质。本申请实施例中以处理器1510和存储器1520之间通过总线连接为例,总线在图15中以粗线描述,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线可以分为地址总线、数据总线、控制总线等。为便于描述,图15中仅用一条粗线描述,但并不描述仅有一根总线或一种类型的总线。基于同一专利技术构思,本申请实施例提供了一种计算机可读存储介质,其包括计算机程序,当计算机程序在电子设备上运行时,计算机程序用于使电子设备执行上述基于联邦学习的模型训练方法的步骤。在一些可能的实施方式中,本申请提供的基于联邦学习的模型训练方法的各个方面还可以实现为一种程序产品的形式,其包括计算机程序,当程序产品在电子设备上运行时,计算机程序用于使电子设备执行上述基于联邦学习的模型训练方法中的步骤,例如,电子设备可以执行如图4中所示的步骤。程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、ram、rom、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(compact disk read only memory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。本申请的实施方式的程序产品可以采用cd-rom并包括计算机程序,并可以在电子设备上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储计算机程序的有形介质,该计算机程序可以被命令执行系统、装置或者器件使用或者与其结合使用。可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由命令执行系统、装置或者器件使用或者与其结合使用的计算机程序。尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。


技术介绍

1、随着人工智能技术的不断发展,面对数据孤岛和数据隐私和安全问题,联邦学习作为一种分布式机器学习应运而生。联邦学习的目标是在保证数据隐私安全及合法合规的基础上,实现共同建模,提升模型效果。

2、相关技术中,服务器随机选择可用于训练的各客户端,并将全局模型发送到各客户端;各客户端将全局模型部署为本地模型,并使用本地数据集对本地模型进行训练,并将训练后的本地模型发送给服务器;服务器基于各客户端各自返回的训练后的本地模型,对全局模型进行更新。

3、然而,联邦学习中各客户端之间的样本数据分布可能是不一致的,各客户端的样本数据非独立同分布(non-iid,非iid),因此各客户端之间存在数据异构性,对非iid数据进行建模可能会导致客户端漂移,进而导致性能下降和全局模型收敛速度变慢。


技术实现思路

1、本申请实施例提供一种基于联邦学习的模型训练方法及相关装置,用以基于联邦学习的模型训练效果。

2、第一方面,本申请实施例提供一种基于联邦学习的模型训练方法,应用于服务器,包括:

3、分别向各在线客户端发送初始全局模型的初始模型参数,以使每个在线客户端对所述初始全局模型进行训练后,将训练获得的本地化全局模型的本地化模型参数返回给服务器;

4、基于获得的各本地化模型参数进行模型聚合,获得新全局模型,并基于所述各本地化模型参数,利用无数据知识蒸馏技术,对初始样本生成器进行训练,获得目标样本生成器;

5、分别向各在线客户端发送所述目标样本生成器的目标生成器参数和所述新全局模型的新模型参数,以使每个在线客户端采用所述目标样本生成器,结合所述新全局模型,生成符合相应的本地样本集的样本类别分布的个性化模型;

6、当至少一个掉线客户端上线时,分别向所述至少一个掉线客户端发送所述目标生成器参数和所述初始模型参数,以使所述至少一个掉线客户端分别采用所述目标样本生成器,结合所述初始全局模型,生成相应的个性化模型。

7、第二方面,本申请实施例提供一种基于联邦学习的模型训练方法,应用于客户端,包括:

8、接收服务器发送的初始全局模型的初始模型参数,并基于本地样本集,对所述初始全局模型进行训练,获得本地化全局模型;

9、将所述本地化全局模型的本地化模型参数返回给所述服务器,以使所述服务器基于获得的各在线客户端各自的本地化模型参数进行模型聚合,获得新全局模型,并基本文档来自技高网...

【技术保护点】

1.一种基于联邦学习的模型训练方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述基于所述各本地化模型参数,利用无数据知识蒸馏技术,对初始样本生成器进行训练,获得目标样本生成器,包括:

3.如权利要求2所述的方法,其特征在于,所述利用初始样本生成器,生成各全局样本类别各自对应的合成样本集,包括:

4.如权利要求2所述的方法,其特征在于,所述基于获得的各预测结果,获得生成模型损失,包括:

5.如权利要求4所述的方法,其特征在于,所述基于所述各本地化全局模型各自对应的局部损失和损失权重,获得生成模型损失,包括:

6.如权利要求1-4中任一项所述的方法,其特征在于,所述基于获得的各本地化模型参数进行模型聚合,获得新全局模型之前,还包括:

7.一种基于联邦学习的模型训练方法,其特征在于,包括:

8.如权利要求7所述的方法,其特征在于,接收所述服务器发送的所述目标样本生成器的目标生成器参数和所述新全局模型的新模型参数之前,还包括:

9.如权利要求7所述的方法,其特征在于,所述采用所述目标样本生成器,结合所述新全局模型,生成符合本地样本集的样本类别分布的个性化模型,包括:

10.如权利要求7、8或9所述的方法,其特征在于,还包括:

11.一种基于联邦学习的模型训练装置,其特征在于,包括:

12.一种基于联邦学习的模型训练装置,其特征在于,包括:

13.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~6中任一所述方法的步骤,或者执行权利要求7~10中任一所述方法的步骤。

14.一种计算机可读存储介质,其特征在于,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行权利要求1~6中任一所述方法的步骤,或者执行权利要求7~10中任一所述方法的步骤。

15.一种计算机程序产品,其特征在于,其包括计算机程序,所述计算机程序存储在计算机可读存储介质中,电子设备的处理器从所述计算机可读存储介质读取并执行所述计算机程序,使得所述电子设备执行权利要求1~6中任一所述方法的步骤,或者执行权利要求7~10中任一所述方法的步骤。

...

【技术特征摘要】

1.一种基于联邦学习的模型训练方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述基于所述各本地化模型参数,利用无数据知识蒸馏技术,对初始样本生成器进行训练,获得目标样本生成器,包括:

3.如权利要求2所述的方法,其特征在于,所述利用初始样本生成器,生成各全局样本类别各自对应的合成样本集,包括:

4.如权利要求2所述的方法,其特征在于,所述基于获得的各预测结果,获得生成模型损失,包括:

5.如权利要求4所述的方法,其特征在于,所述基于所述各本地化全局模型各自对应的局部损失和损失权重,获得生成模型损失,包括:

6.如权利要求1-4中任一项所述的方法,其特征在于,所述基于获得的各本地化模型参数进行模型聚合,获得新全局模型之前,还包括:

7.一种基于联邦学习的模型训练方法,其特征在于,包括:

8.如权利要求7所述的方法,其特征在于,接收所述服务器发送的所述目标样本生成器的目标生成器参数和所述新全局模型的新模型参数之前,还包括:

9.如权利要求7所述的方法,其特征在于,所述采用所述目标样本生成器,结合所述...

【专利技术属性】
技术研发人员:黄雅雯郑冶枫
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1