【技术实现步骤摘要】
本申请涉及机器学习,具体涉及一种纵向联邦学习参与方选择方法、装置、设备及存储介质。
技术介绍
1、联邦学习是一种分布式机器学习方法。在联邦学习中,不同参与方(数据所有者)通过合作来训练机器学习模型,而无需共享原始数据,从而保护了数据的隐私性。在这一领域,纵向联邦学习引入了更为复杂的数据结构,其中每个参与方仅持有数据样本的部分特征。
2、尽管联邦学习在解决隐私问题、分布式构建机器学习模型方面取得了显著进展,参与方之间的数据贡献仍可能存在明显差异,这对于构建高性能模型是一个挑战。
3、相关技术中,传统的参与方选择方法侧重于对模型性能进行改善,却忽略了参与方间数据贡献的差异性及其对计算和通信效率的影响。同时,传统的参与方选择方法常使用夏普利值进行参与方的贡献评估,但此类方法在效率方面存在一定的不足。
4、因此,有必要设计一种新的纵向联邦学习参与方选择方法,以克服上述问题。
技术实现思路
1、本申请提供一种纵向联邦学习参与方选择方法、装置、设备及存储介质,可以解
...【技术保护点】
1.一种纵向联邦学习参与方选择方法,其特征在于,所述纵向联邦学习参与方选择方法包括:
2.如权利要求1所述的纵向联邦学习参与方选择方法,其特征在于,所述对于每个参与方,选择一查询实例xq,并基于伪标签找出每个参与方中距离查询实例xq最近的前C个数据作为候选数据实例,包括:
3.如权利要求2所述的纵向联邦学习参与方选择方法,其特征在于,所有参与方存在一个对齐的数据集,该数据集包含N个数据样本,记为D={X,Y},其中F是联合特征空间的维度;参与方pj上持有的数据用表示,
4.如权利要求1所述的纵向联邦学习参与方选择方法,其特征在于,所
...【技术特征摘要】
1.一种纵向联邦学习参与方选择方法,其特征在于,所述纵向联邦学习参与方选择方法包括:
2.如权利要求1所述的纵向联邦学习参与方选择方法,其特征在于,所述对于每个参与方,选择一查询实例xq,并基于伪标签找出每个参与方中距离查询实例xq最近的前c个数据作为候选数据实例,包括:
3.如权利要求2所述的纵向联邦学习参与方选择方法,其特征在于,所有参与方存在一个对齐的数据集,该数据集包含n个数据样本,记为d={x,y},其中f是联合特征空间的维度;参与方pj上持有的数据用表示,
4.如权利要求1所述的纵向联邦学习参与方选择方法,其特征在于,所述从候选数据实例中选择k个最近邻的数据实例集合t,包括:
5.如权利要求1所述的纵向联邦学习参与方选择方法,其特征在于,所述基于数据实例集合t计算不同参与方的相似度,并采用贪婪算法最大化子模块似然函数选择具有最大边际增益的参与方作为参与者,包括:
6.如权利要求5所述的纵向联邦学习参...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。