基于区块链和数据增强的联邦学习训练方法及系统技术方案

技术编号：38327234 阅读：13 留言：0更新日期：2023-07-29 09:09

本公开提供了基于区块链和数据增强的联邦学习训练方法及系统，涉及人工智能技术领域，包括利用原始训练集进行满足差分隐私的生成对抗网络的预训练；各客户端共同选择一个打包客户端，并将预训练完毕的生成器模型发送至打包客户端；打包客户端接收完所有客户端的生成器模型后，将接收到的生成器模型打包成一个区块上传至区块链中，客户端从区块链中下载包含所有参与方生成器模型的区块；客户端生成新的数据，将处理后的原始训练集与新生成的数据进行整合，构建新的数据集，用于联邦学习训练任务。区块链代替了原本需进行生成器模型存储的第三方机构，排除了第三方机构作恶的风险，保证了生成器模型的安全性。保证了生成器模型的安全性。保证了生成器模型的安全性。

全部详细技术资料下载

【技术实现步骤摘要】
基于区块链和数据增强的联邦学习训练方法及系统

[0001]本公开涉及人工智能
，具体涉及基于区块链和数据增强的联邦学习训练方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息，不必然构成在先技术。
[0003]随着人工智能相关技术的不断成熟，越来越多的机器学习算法应用于人们的实际生活中，计算机视觉、语音识别、自然语言处理、推荐系统等技术随处可见。机器学习为典型的数据驱动型任务，最终所得到的模型性能好坏与训练模型时所使用数据集的数量和质量密切相关，在进行模型训练时往往需要海量的高质量数据样本作为支撑。
[0004]为了减轻训练数据非独立同分布对最终的训练模型所带来的影响，研究者们进行一系列的研究，主要从数据共享和数据增强两个层面进行阐述，数据增强与数据共享均从数据源入手来解决FL中的Non
‑
IID问题。不同的是，数据增强方案只由客户端上传少量的标签或样本，并通过掺杂噪声或编码解码来保证数据的隐私性。此外，上述方案虽然能够一定程度上缓解数据Non
‑
IID问题，但相关方案仍存在部分缺陷：
[0005]1、直接进行训练数据共享的方式存在较为严重的隐私威胁，极容易造成数据泄露问题，对数据拥有者及数据本身所涉及的相关人员造成极大影响。此外，相关法律法规的颁布实施对该方法也提出了限制和制约，方法面临违法违规的风险。2、数据混合的方式虽能保证数据隐私，但混合后的数据可用性会大幅降低，寻求数据隐私性和数据可用性之间的平衡仍是现阶段的...

【技术保护点】

【技术特征摘要】
1.基于区块链和联邦学习的对抗生成网络的训练方法，其特征在于，包括：步骤1：将参与联邦学习的各客户端对本地数据集进行处理，得到原始训练集，利用原始训练集进行满足差分隐私的生成对抗网络的预训练；步骤2：各客户端共同选择一个打包客户端，并将预训练完毕的生成器模型发送至打包客户端；步骤3：打包客户端接收完所有客户端的生成器模型后，将接收到的生成器模型打包成一个区块上传至区块链中，客户端从区块链中下载包含所有参与方生成器模型的区块；步骤4：客户端生成新的数据，将处理后的原始训练集与新生成的数据进行整合，构建新的数据集，用于联邦学习训练任务。2.如权利要求1所述的基于区块链和联邦学习的对抗生成网络的训练方法，其特征在于，所述生成对抗网络包括生成器和判别其两部分。3.如权利要求1所述的基于区块链和联邦学习的对抗生成网络的训练方法，其特征在于，所述预训练的方式为：各客户端使用本地数据集进行模型的训练，并在模型训练梯度上添加噪声，得到满足差分隐私性质的生成对抗网络模型。4.如权利要求1所述的基于区块链和联邦学习的对抗生成网络的训练方法，其特征在于，在客户端生成数据之前，客户端对下载完毕的生成器模型进行模型相似度检测操作，分别计算客户端生成器模型与其他客户端模型之间的欧几里得距离。5.如权利要求4所述的基于区块链和联邦学习的对抗生成网络的训练方法，其特征在于，所述计算客户端生成器模型与其他客户端生成器模型之间的欧几里得距离，若距离值大于最大阈值则将判断为恶意模型，若距离值小于最小阈值则将判断为相似模型。6.如权利要求5所述的基于区块链和联邦学习的对抗生成网络的训练方法，其特征在于，所述恶意模型与相似模型均无法通过检测，无法进行数据生成任务。7.如权利要求1所述的基于区块链和联邦学习的对...

【专利技术属性】
技术研发人员：赵川，吴昊，荆山，赵圣楠，陈贞翔，
申请(专利权)人：济南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人