基于去噪扩散模型数据生成的多中心隐私计算方法及系统技术方案

技术编号:41573455 阅读:18 留言:0更新日期:2024-06-06 23:52
本发明专利技术提供的基于去噪扩散模型数据生成的多中心隐私计算系统,包括服务器和若干个可与服务器互传数据的客户端,基于去噪扩散模型数据生成的多中心隐私计算系统还包括分布式DDPM生成模块和集成学习模块,分布式DDPM生成模块用于在每个客户端根据自身数据集训练条件扩散模型,并将其统一发送给服务器,然后通过服务器再传送至其他客户端,集成学习模块用于融合各客户端利用本地原始数据和其他客户端合成数据共同训练的分类器,构建并结合多个学习器。

【技术实现步骤摘要】

本专利技术涉及数据处理和隐私保护,尤其是涉及一种基于去噪扩散模型数据生成的多中心隐私计算方法及系统


技术介绍

1、在过去的十多年中,机器学习,特别是以深度学习为代表的人工智能方法,已成功应用于多项任务。

2、深度学习模型通常需要大规模、多样化的样本来训练高性能模型,收集大规模标签数据集既具有挑战性又成本高昂。在某些领域,如金融和医疗,建立一个集中式的多中心数据集可能会面临法律、隐私、技术和数据所有权等多方面的限制,尤其需要符合国际法律法规。

3、克服上述障碍的一种方法是采用联邦学习训练方式,该方法在拥有本地数据的多个参与方之间进行分布式模型训练。典型的联邦学习架构由一个聚合服务器和多个客户端组成。在每个客户端上使用本地数据训练模型,然后在服务器上聚合多个客户端模型(例如参数、梯度),并更新全局模型,最后将更新的全局模型返回给所有客户端以进行下一轮联邦学习训练。训练过程中,联邦学习的各参与方无需交换本地数据,仅需交换模型参数或中间结果,有效地解耦了对中心化数据集的需求。

4、然而,联邦学习需要多个客户端参与多轮参数或梯度本文档来自技高网...

【技术保护点】

1.一种基于去噪扩散模型数据生成的多中心隐私计算系统,包括服务器和若干个可与所述服务器互传数据的客户端,其特征在于,所述基于去噪扩散模型数据生成的多中心隐私计算系统还包括分布式DDPM生成模块和集成学习模块,所述分布式DDPM生成模块用于在每个所述客户端根据自身数据集训练条件扩散模型,并将其发送至所述服务器后通过所述服务器发送至其他客户端,所述集成学习模块用于融合各客户端利用本地原始数据和其他客户端合成数据共同训练的分类器,构建并结合多个学习器。

2.根据权利要求1所述的基于去噪扩散模型数据生成的多中心隐私计算系统,其特征在于,所述分布式DDPM生成模块由客户端根据自身数据集...

【技术特征摘要】

1.一种基于去噪扩散模型数据生成的多中心隐私计算系统,包括服务器和若干个可与所述服务器互传数据的客户端,其特征在于,所述基于去噪扩散模型数据生成的多中心隐私计算系统还包括分布式ddpm生成模块和集成学习模块,所述分布式ddpm生成模块用于在每个所述客户端根据自身数据集训练条件扩散模型,并将其发送至所述服务器后通过所述服务器发送至其他客户端,所述集成学习模块用于融合各客户端利用本地原始数据和其他客户端合成数据共同训练的分类器,构建并结合多个学习器。

2.根据权利要求1所述的基于去噪扩散模型数据生成的多中心隐私计算系统,其特征在于,所述分布式ddpm生成模块由客户端根据自身数据集训练得到,每个所述客户端将自身的ddpm模型上传至所述服务器,并从所述服务器下载其他客户端的ddpm模型。

3.根据权利要求2所述的基于去噪扩散模型数据生成的多中心隐私计算系统,其特征在于,所述每个客户端将预测模型传输给所述服务器。

4.根据权利要求2所述的基于去噪扩散模型数据生成的多中心隐私计算系统,其特征在于,所述每个客户端使用本地原始数据与其他客户端的ddpm模型合成的数据共同训练分类模型。

5.一种基于去噪扩散模型数据生成的多中心隐私计算系统,包括若干个客户端,其特征在于,所述基于去噪扩散模型数据生成的多中心隐私...

【专利技术属性】
技术研发人员:罗桂波张瀚文陈明智朱跃生
申请(专利权)人:北京大学深圳研究生院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1