一种纵向联邦学习场景中高效的特征贡献评估方法技术

技术编号：28055816 阅读：31 留言：0更新日期：2021-04-14 13:25

一种纵向联邦学习场景中高效的特征贡献评估方法，所述该方法包括三个模块：1)运算拆分2)MC采样近似3)通信聚合，本发明专利技术设计了一个面向纵向联邦学习预测过程的公平的特征贡献评估方法。基于shapley value评估，保证了评估结果的公平性。同时通过MC采样近似，降低双方的计算开销。通过泰勒展开和运算拆分，降低通信开销。信开销。信开销。

全部详细技术资料下载

【技术实现步骤摘要】
一种纵向联邦学习场景中高效的特征贡献评估方法

[0001]本专利技术涉及的纵向联邦学习场景中高效的特征贡献评估方法，属于特征选择和模型可解释性领域。

技术介绍

[0002]数据是人工智能发展的“土壤”。能否获得大规模、高质量的数据集已经成为制约AI相关研究发展的重要因素。隐私、制度等限制了数据共享，而联邦学习在数据保存在本地的情况下实现共同建模，是数据共享的新趋势和机遇。而在联邦学习场景下，模型预测过程中参与方的特征贡献评估及后续的收益分配，是一个重要的问题。本专利技术针对特征分布在不同拥有方的纵向联邦学习场景，旨在模型预测过程中，公平地评估每个参与方提供的特征值的贡献，同时降低评估过程中的计算开销和通信开销。
[0003]现有的特征贡献评估方法主要基于Shapley value(SV)。SV具有很好的公平性，但SV基于边际增益的期望计算导致计算复杂度很高。现有方法从两个角度降低计算开销：1)蒙特卡洛(MC)采样近似。根据中心极限定理，随着采样次数的增加，采样均值趋于期望。通过调整采样次数来调节计算开销与计算精度之前...

【技术保护点】

【技术特征摘要】
1.一种纵向联邦学习场景中高效的特征贡献评估方法，其特征在于所述该方法包括三个模块：1)运算拆分；2)MC采样近似；3)通信聚合。2.根据权利要求1所述的所述纵向联邦学习场景中高效的特征贡献评估方法，其特征在于所述运算拆分为根据SV，将特征i的贡献用边际增益期望的表示：E(i)＝E
x
[f(x∪i)
‑
f(i)]。基于SV的评估满足公平性的需求。为了降低在线采样计算的通信开销，将f的运算拆分成只与参与方A(x
A
)有关和只与参与方B(x
B
)有关的两部分。该模块分为两步：一、交换运算顺序。首先根据期望运算的性质，和的期望等于期望的和：E(i)＝E
x
[f(x∪i)
‑
f(x)]＝E
x
[f(x∪i)]
‑
E
x
[f(x)].然后，对f进行线性近似，得到交换运算顺序：二、线性近似由于逻辑回归模型f中包含非线性函数：sigmoid函数。对sigmoid函数在评估点x附近求导，作为泰勒近似的系数。当x＝0时，其中z＝θ
A
x
A
+θ
B
x
B
.然后将A、B的特征x
A
，x
B
带入展开式，得到模型近似结果和A，B双方特征的关系：带入展开式，得到模型近似结果和A，B双方特征的关系：将模型...

【专利技术属性】
技术研发人员：张兰，李向阳，刘梦境，
申请(专利权)人：德清阿尔法创新研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人