【技术实现步骤摘要】
一种纵向联邦学习场景中高效的特征贡献评估方法
[0001]本专利技术涉及的纵向联邦学习场景中高效的特征贡献评估方法,属于特征选择和模型可解释性领域。
技术介绍
[0002]数据是人工智能发展的“土壤”。能否获得大规模、高质量的数据集已经成为制约AI相关研究发展的重要因素。隐私、制度等限制了数据共享,而联邦学习在数据保存在本地的情况下实现共同建模,是数据共享的新趋势和机遇。而在联邦学习场景下,模型预测过程中参与方的特征贡献评估及后续的收益分配,是一个重要的问题。本专利技术针对特征分布在不同拥有方的纵向联邦学习场景,旨在模型预测过程中,公平地评估每个参与方提供的特征值的贡献,同时降低评估过程中的计算开销和通信开销。
[0003]现有的特征贡献评估方法主要基于Shapley value(SV)。SV具有很好的公平性,但SV基于边际增益的期望计算导致计算复杂度很高。现有方法从两个角度降低计算开销:1)蒙特卡洛(MC)采样近似。根据中心极限定理,随着采样次数的增加,采样均值趋于期望。通过调整采样次数来调节计算开销与计算精度之前 ...
【技术保护点】
【技术特征摘要】
1.一种纵向联邦学习场景中高效的特征贡献评估方法,其特征在于所述该方法包括三个模块:1)运算拆分;2)MC采样近似;3)通信聚合。2.根据权利要求1所述的所述纵向联邦学习场景中高效的特征贡献评估方法,其特征在于所述运算拆分为根据SV,将特征i的贡献用边际增益期望的表示:E(i)=E
x
[f(x∪i)
‑
f(i)]。基于SV的评估满足公平性的需求。为了降低在线采样计算的通信开销,将f的运算拆分成只与参与方A(x
A
)有关和只与参与方B(x
B
)有关的两部分。该模块分为两步:一、交换运算顺序。首先根据期望运算的性质,和的期望等于期望的和:E(i)=E
x
[f(x∪i)
‑
f(x)]=E
x
[f(x∪i)]
‑
E
x
[f(x)].然后,对f进行线性近似,得到交换运算顺序:二、线性近似由于逻辑回归模型f中包含非线性函数:sigmoid函数。对sigmoid函数在评估点x附近求导,作为泰勒近似的系数。当x=0时,其中z=θ
A
x
A
+θ
B
x
B
.然后将A、B的特征x
A
,x
B
带入展开式,得到模型近似结果和A,B双方特征的关系:带入展开式,得到模型近似结果和A,B双方特征的关系:将模型...
【专利技术属性】
技术研发人员:张兰,李向阳,刘梦境,
申请(专利权)人:德清阿尔法创新研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。