基于自适应分割联邦学习的模型训练方法和人脸识别方法技术

技术编号:34553076 阅读:27 留言:0更新日期:2022-08-17 12:38
本发明专利技术公开了一种基于自适应分割联邦学习的模型训练方法和人脸识别方法,前者包括:每个用户端将设备信息上传服务端,服务端基于所有设备信息向各用户端分配传播步长和聚集权重;在当前轮训练中,每个用户端从服务端获取当前轮全局模型,以自身作为所有用户端构成的环形拓扑结构的始端进行预设次本地联合处理,得到该始端针对当前轮训练的本地更新后模型参数;每个用户端将针对当前轮训练的本地更新后模型参数上传服务端聚合得到当前轮更新后全局模型;服务器判断当前轮更新后全局模型是否收敛;若否进行下一轮训练;若是将当前轮更新后全局模型确定为训练完成的人脸识别模型。本发明专利技术能解决异质性问题,保护隐私,提高收敛速度和人脸识别准确性。敛速度和人脸识别准确性。敛速度和人脸识别准确性。

【技术实现步骤摘要】
基于自适应分割联邦学习的模型训练方法和人脸识别方法


[0001]本专利技术属于机器学习领域,具体涉及一种基于自适应分割联邦学习的模型训练方法和人脸识别方法。

技术介绍

[0002]近年来,机器学习(ML)技术由于其出色的表示和学习能力,在许多任务(如计算机视觉、自然语言处理、语音识别等)中都取得了出色的表现。比如目前,在智能家居以及安防监控等领域内,基于机器学习的人脸识别技术被广泛应用。
[0003]但一般来说,机器学习都需要大量的数据和计算资源来训练一个具有良好泛化性能的模型,因此,人们广泛采用了集中式学习的方式。在集中式学习中,中央服务器拥有海量的数据,并以丰富的计算资源训练模型。然而,在人脸识别任务中,训练数据是由用户产生的,将这些原始数据提交给位于云端的中央服务器会损害用户的隐私。随着用户设备的计算和存储能力的指数级增长,利用本地资源进行学习任务成为可能。因此,在2016年,谷歌提出的联邦学习(Federated Learning,FL)受到了广泛关注,已被应用于一些人脸识别任务中。
[0004]在FL中,ML模型是在用户设备上训练的,并同时保持了模型数据的本地化。通过将本地梯度更新提交到服务器上进行聚合,而不是提交原始数据,能够在一定程度上保护用户隐私。然而,参与联邦学习训练的用户设备可能存在异质性问题,即在计算能力、电池电量和数据分布方面存在显著差异,会影响FL的效率。此外,由于用户数据仍然可以通过窃听传递的模型权重或梯度来进行重建,在人脸识别任务中采用传统FL仍然存在隐私泄露的风险。r/>[0005]面对上述问题,现有的解决方案中,如果每个用户设备的数据是非独立同分布(independent and identically distributed,IID)的,参训用户设备的异构性问题是无法得到解决的。在人脸识别任务中,如果由于计算资源或能量限制,没有调度掉队的用户设备,FL模型可能会出现偏差,导致训练出的模型在该掉队的用户设备(指网络带宽或访问受限等不能继续进行训练的用户设备)上表现不佳。此外,也有可能由于传感器部署位置等诸多原因,一些用户设备可能总是拥有“更重要”的数据。因此即使该用户设备计算能力很弱,将其数据纳入训练也是至关重要的,但现有的解决方案也无法有效解决这一问题。同时,为了增强人脸识别任务中的隐私保护性能,多数现有的解决方案都开发了额外的机制,但这些机制是以牺牲系统效率或模型性能为代价的。
[0006]因此,如何针对人脸识别任务,提出一种能够解决参训用户设备异质性问题并增强隐私保护性能的模型训练方法,继而利用训练得到的模型实现准确的人脸识别,是一个亟待解决的问题。

技术实现思路

[0007]为了解决现有技术中存在的上述问题,本专利技术提供了一种基于自适应分割联邦学
习的模型训练方法和人脸识别方法。本专利技术要解决的技术问题通过以下技术方案实现:
[0008]第一方面,本专利技术实施例提供了一种基于自适应分割联邦学习的模型训练方法,应用于由一个服务端和多个用户端构成的RingSFL系统,所述方法包括:
[0009]每个用户端将其设备信息上传至所述服务端,所述服务端基于所有设备信息向每个用户端分配传播步长和聚集权重;其中,所述传播步长表征传播的网络层数;
[0010]在当前轮训练中,每个用户端从所述服务端处获取当前轮全局模型,并以自身作为所有用户端构成的环形拓扑结构的始端进行该始端的预设次本地联合处理,得到该始端针对当前轮训练的本地更新后模型参数;其中,每个始端的一次本地联合处理过程包括:基于自身人脸图像训练集的一个批次,对所述当前轮训练中该始端的当前次本地模型进行前向传播和反向传播;并基于所有始端各自在该次本地联合处理过程中产生的加权梯度,对每个始端的当前次本地模型进行更新;当前轮训练中每个始端第一次本地联合处理所对应的当前次本地模型为当前轮全局模型;所述前向传播和所述反向传播均由所述环形拓扑结构中各用户端利用其传播步长进行的部分网络训练衔接完成;所述反向传播中,各用户端利用自身传播步长和对应始端的聚集权重得到对应的加权梯度并传递各自的输出层梯度;
[0011]每个用户端将各自针对当前轮训练的本地更新后模型参数上传至所述服务端进行聚合,得到当前轮更新后全局模型;
[0012]所述服务器判断所述当前轮更新后全局模型是否满足收敛条件;
[0013]若否,将所述当前轮更新后全局模型作为下一轮全局模型,返回所述在当前轮训练中,每个用户端同步从所述服务端处获取当前轮全局模型的步骤。
[0014]若是,将所述当前轮更新后全局模型确定为训练完成的人脸识别模型。
[0015]在本专利技术的一个实施例中,所述每个用户端将其设备信息上传至所述服务端,所述服务端基于所有设备信息向每个用户端分配传播步长和聚集权重,包括:
[0016]每个用户端将其计算能力值和自身人脸图像训练集对应的训练样本数上传至所述服务端;
[0017]所述服务端基于获得的各用户端的计算能力值,利用预先建立的传播步长计算公式,计算每个用户端的传播步长;其中,所述传播步长计算公式是根据预先构建的关于计算时间的优化问题确定的;
[0018]所述服务端计算所获得的所有用户端的训练样本总数,并将每个用户端的训练样本数与所述训练样本总数的比值确定为对应用户端的聚集权重;
[0019]所述服务端向每个用户端发送其传播步长和聚集权重。
[0020]在本专利技术的一个实施例中,所述预先构建的关于计算时间的优化问题,包括:
[0021][0022][0023][0024]其中,p
i
为切割比,表示分配给第i个用户端u
i
的计算负载率;N表示用户端总数;C
i
表示用户端u
i
的计算能力值;表示所有用户端的总计算能力值;c
i
表示用户端u
i
的计算能力值与总计算能力值的比率;M表示始端完成一次本地联合处理过程所需的总计算量;max{
·
}表示求最大值;表示最小化;
[0025]所述预先构建的关于计算时间的优化问题的求解结果,包括:
[0026][0027]其中,表示用户端u
i
的最优切割比;m
*
表示所述优化问题求解过程中引入的变量m的优化结果。
[0028]在本专利技术的一个实施例中,所述传播步长计算公式,包括:
[0029][0030]其中,L
i
表示用户端u
i
的传播步长;w表示各轮全局模型对应的原始网络的总层数。
[0031]在本专利技术的一个实施例中,针对每个始端,该始端的一次本地联合处理过程中,前向传播的过程包括:
[0032]该始端利用自身人脸图像训练集的一个当前批次,从当前次本地模型的首层开始向前传播该始端的传播步长所对应的层数,将其前向传播对应的局部网络所输出的特征图和其输出层序号,沿以该始端为起点的环形拓扑结本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于自适应分割联邦学习的模型训练方法,其特征在于,应用于由一个服务端和多个用户端构成的RingSFL系统,所述方法包括:每个用户端将其设备信息上传至所述服务端,所述服务端基于所有设备信息向每个用户端分配传播步长和聚集权重;其中,所述传播步长表征传播的网络层数;在当前轮训练中,每个用户端从所述服务端处获取当前轮全局模型,并以自身作为所有用户端构成的环形拓扑结构的始端进行该始端的预设次本地联合处理,得到该始端针对当前轮训练的本地更新后模型参数;其中,每个始端的一次本地联合处理过程包括:基于自身人脸图像训练集的一个批次,对所述当前轮训练中该始端的当前次本地模型进行前向传播和反向传播;并基于所有始端各自在该次本地联合处理过程中产生的加权梯度,对每个始端的当前次本地模型进行更新;当前轮训练中每个始端第一次本地联合处理所对应的当前次本地模型为当前轮全局模型;所述前向传播和所述反向传播均由所述环形拓扑结构中各用户端利用其传播步长进行的部分网络训练衔接完成;所述反向传播中,各用户端利用自身传播步长和对应始端的聚集权重得到对应的加权梯度并传递各自的输出层梯度;每个用户端将各自针对当前轮训练的本地更新后模型参数上传至所述服务端进行聚合,得到当前轮更新后全局模型;所述服务器判断所述当前轮更新后全局模型是否满足收敛条件;若否,将所述当前轮更新后全局模型作为下一轮全局模型,返回所述在当前轮训练中,每个用户端同步从所述服务端处获取当前轮全局模型的步骤。若是,将所述当前轮更新后全局模型确定为训练完成的人脸识别模型。2.根据权利要求1所述的基于自适应分割联邦学习的模型训练方法,其特征在于,所述每个用户端将其设备信息上传至所述服务端,所述服务端基于所有设备信息向每个用户端分配传播步长和聚集权重,包括:每个用户端将其计算能力值和自身人脸图像训练集对应的训练样本数上传至所述服务端;所述服务端基于获得的各用户端的计算能力值,利用预先建立的传播步长计算公式,计算每个用户端的传播步长;其中,所述传播步长计算公式是根据预先构建的关于计算时间的优化问题确定的;所述服务端计算所获得的所有用户端的训练样本总数,并将每个用户端的训练样本数与所述训练样本总数的比值确定为对应用户端的聚集权重;所述服务端向每个用户端发送其传播步长和聚集权重。3.根据权利要求2所述的基于自适应分割联邦学习的模型训练方法,其特征在于,所述预先构建的关于计算时间的优化问题,包括:预先构建的关于计算时间的优化问题,包括:0≤p
i
≤1,
其中,p
i
为切割比,表示分配给第i个用户端u
i
的计算负载率;N表示用户端总数;C
i
表示用户端u
i
的计算能力值;表示所有用户端的总计算能力值;c
i
表示用户端u
i
的计算能力值与总计算能力值的比率;M表示始端完成一次本地联合处理过程所需的总计算量;max{
·
}表示求最大值;表示最小化;所述预先构建的关于计算时间的优化问题的求解结果,包括:其中,表示用户端u
i
的最优切割比;m
*
表示所述优化问题求解过程中引入的变量m的优化结果。4.根据权利要求3所述的基于自适应分割联邦学习的模型训练方法,其特征在于,所述传播步长计算公式,包括:其中,L
i
表示用户端u
i
的传播步长;w表示各轮全局模型对应的原始网络的总层数。5.根据权利要求1或4所述的基于自适应分割联邦学习的模型训练方法,其特征在于,针对每个始端,该始端的一次本地联合处理过程中,前向传播的过程包括:该始端利用自身人脸图像训练集的一个当前批次,从当前次本地模型的首层开始向前传播该始端的传播步长所对应的层数,将其前向传播对应的局部网络所输出的特征图和其输出层序号,沿以该始端为起点的环形拓扑结构的顺向传递给下一个用户端;针对沿所述环形拓扑结构顺...

【专利技术属性】
技术研发人员:承楠沈京龙赫明泽李长乐
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1