一种分组解决数据异构联邦学习方法技术

技术编号：39677464 阅读：17 留言：0更新日期：2023-12-11 18:54

本发明专利技术公开了一种分组解决数据异构联邦学习方法，属于人工智能机器学习领域，该方法首先数据预处理阶段，对数据进行特征提取，并聚类分组

全部详细技术资料下载

【技术实现步骤摘要】
一种分组解决数据异构联邦学习方法

[0001]本专利技术属于人工智能机器学习领域，涉及一种分组解决数据异构联邦学习方法
。

技术介绍

[0002]随着高新科技
、
人工智能
(Artificial Intelligence
，
AI)
和云计算的快速发展，联邦学习
(Federated Learning
，
FL)
从
2016
年谷歌团队提出以后，已经在近几年快速的发展，并广泛运用于物联网
(Internet of Things
，
IoT)
领域，医院
、
银行等行业数据分析
。
与传统的分布式机器学习将本地数据上传到中央服务器，再由中央服务器进行训练不同
。
联邦学习利用全局模型更新参数并将其分发到各数据源，在本地直接利用本地设备的数据资源训练，结束之后再上传训练的结果参数即可
。
[0003]在联邦学习模型的框架训练中，本地设备收到云端服务器下发的初始化之后的训练参数，在本地做梯度下降更新之后的模型参数再上传至中央服务器进行加权平均，重复迭代直至整个模型收敛
。
这种只交换模型参数不直接交换本地设备的数据资源的训练方法，不仅可以保障本地数据的隐私安全，还减少了本地设备和中央服务器之间的通信负载
。
保护数据隐私有很好的表现，但在面对数据异构时，模型的收敛速度和精度往往达不到想要的结...

【技术保护点】

【技术特征摘要】
1.
一种分组解决数据异构联邦学习方法，其特征在于，包括如下步骤：步骤
1、
数据预处理阶段，对数据进行特征提取，并聚类分组；步骤
2、
本地训练阶段，本地设备做梯度下降算法，并将结果上传云端服务器；步骤
3、
云端训练阶段
、
根据本地设备梯度下降结果，进行全局模型的聚合
。2.
根据权利要求1所述的一种分组解决数据异构联邦学习方法，其特征在于，步骤1具体过程如下：步骤
1.1、
提取数据的特征图和哈希值，用加权平均的方法计算出特征图和哈希值的平均数；步骤
1.2、
初始化数据结构，采用
CNN
神经网络模型对数据进行预处理，存储设备的平均特征值图和平均哈希值；步骤
1.3、
构造一个输出向量有维度的
|LSHF|
函数，使得
P
‑
stable LSH
函数族计算出的哈希值经过函数加密；步骤
1.4、
将
P
‑
stable LSH
函数族中每个
LSH
函数应用于各个设备的平均特征图，并对其进行哈希编码；步骤
1.5、
保存第
i
个设备的特征图和哈希值；步骤
1.6、
使用
K
‑
Means
算法，根据每个设备的特征图的哈希值，将所有的设备聚类成
K
组
。3.
根据权利要求1所述的一种分组解决数据异构联邦学习方法，其特征在于，步骤
1.6
中所述
K
‑
Means
算法具体过程如下：步骤
1.6.1、
定义
x
i
代表第
i
个样本，
c
i
是
x
i
所属的簇，代表簇对应的中心点，
M
是样本总数；步骤
1.6.2、
进行数据预处理，包括标准化和异常点过滤；步骤
1.6.3、
随机选择
K

【专利技术属性】
技术研发人员：魏贵义，毛德欢，
申请(专利权)人：浙江工商大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人