【技术实现步骤摘要】
一种跨域异质场景下的联邦学习隐私性评估方法
[0001]本专利技术涉及联邦学习隐私评测
,特别涉及一种跨域异质场景下的联邦学习隐私性评估方法。
技术介绍
[0002]现有的联邦学习隐私评测指标大多都是通过计算客户端私人原始数据和模型梯度的互信息量来实现,这种方法并不适用于跨域异质场景下的联邦学习,首先异质下的Non
‑
IID数据无法在统计模型中得到降维处理,无法实现多维下的互信息计算;同时统计模型的效能会直接影响互信息计算的准确性,对于跨域场景下拥有不同学习任务、不同数据集和不同算力的客户端来说需要在评测过程中训练多个统计模型进行评测这很显然并不现实;最后由于客户端的本地任务不同对应数据集也有差异,不能只通过一个指标来对所有数据集进行隐私性评测,数据集的复杂程度会直接和攻击难易挂钩。
技术实现思路
[0003]本专利技术提供了一种跨域异质场景下的联邦学习隐私性评估方法,通过在客户端模拟攻击,计算攻击结果来判断隐私性的安全程度,对联邦学习模型和数据都没有要求,适用于大部分实际情况。 />[0004]本专本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种跨域异质场景下的联邦学习隐私性评估方法,其特征在于,包括:确定联邦学习在跨域异质场景下的任务和数据集,并根据算法确定潜在攻击风险;根据任务对数据集进行关联度筛选;将客户端发送给联邦学习中央服务器的数据采用设定的隐私加强技术进行加密处理;根据具有代表性的攻击模型计算客户端的隐私性指标;根据设置的阈值判定客户端参与联邦学习时所上传数据的隐私泄露风险。2.根据权利要求1所述的跨域异质场景下的联邦学习隐私性评估方法,其特征在于,所述确定联邦学习在跨域异质场景下的任务和数据集,去除本地数据冗余并根据算法确定潜在攻击风险的步骤,包括:在跨域异质场景下客户端在设定数据集和全局梯度的基础上进行局部数据预训练并上传至客户端聚合,通过不断迭代以实现本地模型的训练;其中,所述设定数据集包括手写体数字数据库MNIST、用于识别普适物体的小型彩色数据库CIFAR10、人脸数据库LFW;将每个样本的类别标签归纳在一个矩阵中以实现数据集的划分,并对分划好的每一个客户端数据中,使用第一设定量的数据作为训练样本,第二设定量的数据作为测试样本;其中,N为参与联邦学习的客户端个数,K表示所有样本标签得的类别个数,矩阵中的行向量表示每个类别划分到不同的客户端上的比例,行向量采样来自Dirichlet分布;Dirichlet分布的概率密度函数为:x=(x1,x2,...,x
K
),x
i
>0,α=(α1,α2,...,α
K
),α
i
>0其中,x为符合要求的随机向量,而α为分布参数,其越大分布越接近均匀分布,越小则分布越聚集。采用FedSGD算法,客户端和中央服务器进行迭代通信优化每个对应数据集下任务k的全局任务模型在第t次迭代过程中,客户端i从中央服务器下载得到当前全局模型参数并计算出参数梯度其中B为批量大小,为客户端在第k个数据集中经过批量采样和注意力机制筛选过的数据量,将计算得到的参数梯度发送到中央服务器;确定恶意窃听者通过获取目标客户端发送的梯度参数和联邦学习模型对客户端的原始数据进行估计和还原,其攻击行为包括成员推理攻击、属性推理攻击、数据重构攻击。3.根据权利要求2的跨域异质场景下的联邦学习隐私性评估方法,其特征在于,所述根据任务对数据集进行关联度筛选的步骤,包括:以批量大小B对每个客户端的数据集进行采样,使得第i个客户端进行训练的数据为引入查询向量q,通过评分函数计算每个输入向量和查询向量之间的相关性,在给定一个和任务相关的查询向量q,在给定q和X
B
下,选择第i个输入向量的概率α
i
:
其中,α
i
为输入的第i个数据的受注意程度,对信息进行整合汇总为X
B
=[x1α1,x2α1...,x
B
α
B
]=[x1,x2,...,x
B
]。4.根据权利要求3的跨域异质场景下的联邦学习隐私性评估方法,其特征在于,所述根据具有代表性的攻击模型计算客户端的隐私性指标的步骤,包括:通过计算每个客户端的模型的准确率,即分类正确的样本占比作...
【专利技术属性】
技术研发人员:赵海涛,潘晨悦,郭亮,李洁,王少鹏,杨洁,刘淼,徐波,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。