数据处理方法、装置和电子设备制造方法及图纸

技术编号:43772449 阅读:16 留言:0更新日期:2024-12-24 16:11
本申请公开了一种数据处理方法、装置和电子设备,属于电子设备领域。所述数据处理方法,包括:获取各客户端发送的当前轮次下的第一参数,以及客户端的本地模型在当前轮次下输出的第一数据相对于服务端在上一轮次下输出的第二数据的KL散度以及重叠程度中的至少一种;基于KL散度和重叠程度中的至少一种对各客户端发送的当前轮次下的第一参数进行处理,得到服务端的全局模型在当前轮次下的第二参数;并基于第二参数和服务端对应的第二图像数据对全局模型进行训练,获取全局模型在当前轮次下输出的第二数据;将第二参数以及第二数据发送给各客户端。本申请的数据处理方法,实现了更高效、更准确的联邦学习,提高模型输出的精确性。

【技术实现步骤摘要】

本申请属于生物特征识别领域,尤其涉及一种数据处理方法、装置和电子设备


技术介绍

1、联邦学习(federated learning,fl)是一种新兴的机器学习范式,旨在通过协调多个客户端的本地数据协同训练全局模型,同时确保用户数据隐私的保护。然而,fl面临一个主要挑战,即客户端数据的非独立同分布(non-iid)问题。这一问题源于不同客户端数据受到用户习惯、行为特性等多重因素的差异影响,导致数据分布的不一致性和无法准确反映总体数据分布的特性。这种数据异质性会显著降低联邦学习的性能,不仅延长了模型训练的收敛周期,还加剧了训练过程的不稳定性。相关技术中,这些挑战主要通过简单地调整权重或增加训练轮次来应对,但这类方法忽视了数据分布差异的复杂性,因此效率低下,且无法显著提升模型准确率。此外,这些方法还导致计算资源和时间成本的显著增加。


技术实现思路

1、本申请旨在至少解决相关技术中存在的技术问题之一。为此,本申请提出一种数据处理方法、装置和电子设备,通过将客户端的数据分布抽象成概率分布并计算重叠面积,来精细控制客户本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,应用于服务端,所述方法包括:

2.根据权利要求1所述的数据处理方法,其特征在于,所述基于所述KL散度和所述重叠程度中的至少一种对各所述客户端发送的所述当前轮次下的第一参数进行处理,得到所述服务端的全局模型在所述当前轮次下的第二参数;并基于所述第二参数和所述服务端对应的第二图像数据对所述全局模型进行训练,获取所述全局模型在所述当前轮次下输出的第二数据,包括:

3.根据权利要求2所述的数据处理方法,其特征在于,所述基于所述KL散度和所述重叠程度中的至少一种处理各所述第一参数,得到所述当前轮次下的所述全局模型的第二参数,包括:

<...

【技术特征摘要】

1.一种数据处理方法,其特征在于,应用于服务端,所述方法包括:

2.根据权利要求1所述的数据处理方法,其特征在于,所述基于所述kl散度和所述重叠程度中的至少一种对各所述客户端发送的所述当前轮次下的第一参数进行处理,得到所述服务端的全局模型在所述当前轮次下的第二参数;并基于所述第二参数和所述服务端对应的第二图像数据对所述全局模型进行训练,获取所述全局模型在所述当前轮次下输出的第二数据,包括:

3.根据权利要求2所述的数据处理方法,其特征在于,所述基于所述kl散度和所述重叠程度中的至少一种处理各所述第一参数,得到所述当前轮次下的所述全局模型的第二参数,包括:

4.根据权利要求3所述的数据处理方法,其特征在于,所述基于所述重叠程度,对多个所述客户端对应的多个第一参数进行筛选,得到至少部分目标客户端对应的第一参数,包括:

5.根据权利要求3所述的数据处理方法,其特征在于,所述基于各所述目标客户端对应的kl散度,对各所述目标客户端发送的所述第一参数进行聚合处理,得到所述第二参数,包括:

6.根据权利要求1-5任一项所述的数据处理方法,其特征在于,所述第二图像数据包括多帧不同类别的生物特...

【专利技术属性】
技术研发人员:赵雁斌蓝飘张承业黄跃珍
申请(专利权)人:广州广电运通信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1