【技术实现步骤摘要】
一种区块链架构下的联邦学习混合聚合机制
[0001]本专利技术涉及一种基于区块链和差分隐私放大机制的联邦学习混合聚合机制,属于机器学习安全域隐私
技术介绍
[0002]机器学习可以通过集中收集大量的数据和训练多个预测模型来为用户提供个性化的服务。然而,在实际应用中,数据通常分布在不同的组织中。联邦学习在本地训练后聚合用户的模型更新,而不是原始数据来更新全局模型,这解决了传统机器学习中的数据隔离问题,提供了更好的数据隐私,但仍然面临多种隐私攻击。
[0003]在联邦学习任务模型中,本地用户经过训练后将梯度作为模型的更新上传,梯度的维度会随着训练数据维度的增加而增加。为了提高更新效率,联邦学习的每次更新都会选择部分梯度上传,但这可能会泄露用户隐私,因为攻击者可以通过监听和基于背景知识的推断,对本地模型更新的内容及其上传者的身份进行隐私攻击,以获取用户更新的内容或定位用户记录。一般来说,用户隐私仍然面临来自用户身份、梯度指数和梯度内容的隐私威胁。
[0004]用户身份隐私指的是攻击者可以基于监听或推理攻击 ...
【技术保护点】
【技术特征摘要】
1.一种区块链架构下的联邦学习混合聚合机制,其特征在于,步骤如下:(1)首先在用户收集本地训练数据后,基于网络内发布的联邦学习任务模型进行本地训练,得到模型更新梯度;为了提升数据隐私性和可用性,基于满足本地差分隐私的梯度选择编码算法进行梯度选取,并使用满足本地差分隐私的扰动算法进行梯度扰动,然后使用本地服务器的公钥对梯度进行加密后发送给洗牌服务器;使选取后的梯度防御梯度指数攻击,扰动后的梯度防御梯度推测攻击,加密后的梯度防御来自本地服务器外的内容攻击;基于本地差分隐私和梯度选取的隐私保护和放大机制的构建,具体过程如下:(1.1)首先,用户在本地训练要上传的梯度更新;本地用户获取存储在本地服务器的联邦学习任务模型和全局参数,以本地存储的数据作为训练数据对联邦学习任务模型进行训练,并提取训练后的梯度;(1.2)选取上传梯度;获取梯度选取的隐私预算ε
k
,基于满足本地差分隐私的梯度选择编码算法对要上传的梯度进行选取,防御针对梯度指数的隐私攻击;首先梯度按绝对值大小分为k个更新率高的梯度和d
‑
k个更新率低的梯度,为防御针对梯度指数的隐私攻击,对于梯度选取的隐私预算ε
k
,攻击者判断两个相邻数据集中某梯度属于高更新率梯度的概率差异应小于差异应小于其中,x和x
′
表示相差一个梯度的相邻本地用户梯度更新;表示满足本地差分隐私的梯度选择编码算法;topk表示高更新率梯度的集合;和分别表示对x和x
′
进行梯度选取后梯度属于高更新梯度的概率;因此基于隐私预算ε
k
分别构建高更新率梯度和低更新率梯度的选取概率公式,使梯度选取满足ε
k
本地差分隐私:其中,表示x中第i个梯度x
i
被随机梯度选取算法选中的概率,ε
k
为梯度选取的隐私预算;(1.3)对选取的梯度进行隐私扰动;获取梯度扰动的隐私预算ε
l
,将ε
l
平均分配给满足本地差分隐私的扰动算法,每个梯度的扰动预算为其中k为梯度选取的个数,对选中的梯度进行满足本地化差分隐私的扰动,防御针对梯度内容的隐私攻击;(1.4)计算和比较隐私放大约束;对于隐私放大前的本地差分隐私约束(ε
l
,δ
l
),ε
l
平均分配给每个梯度扰动后为基于差分隐私的组合原理和子采样的放大原理,基于梯度选取的隐私放大约束(ε
dk
,δ
dk
)为:
其中,表示本地扰动的隐私组合约束;表示梯度子采样...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。