当前位置: 首页 > 专利查询>武汉大学专利>正文

纵向联邦学习参与方选择方法、装置、设备及存储介质制造方法及图纸

技术编号:42324719 阅读:12 留言:0更新日期:2024-08-14 16:04
一种纵向联邦学习参与方选择方法、装置、设备及存储介质,所述纵向联邦学习参与方选择方法包括:使用相同的种子对各参与方持有的数据进行混洗,生成这些数据的伪标签;对于每个参与方,选择一查询实例x<subgt;q</subgt;,并基于伪标签找出每个参与方中距离查询实例x<subgt;q</subgt;最近的前C个数据作为候选数据实例;从候选数据实例中选择k个最近邻的数据实例集合T;基于数据实例集合T计算不同参与方的相似度,并采用贪婪算法最大化子模块似然函数选择具有最大边际增益的参与方作为参与者。本申请从数据中心的角度出发考虑参与方的数据特征,选出具有最大增益的参与方,从而在降低计算和通信成本的同时保持高准确性,提高选择效果和计算效率,解决了计算和效率不足的问题。

【技术实现步骤摘要】

本申请涉及机器学习,具体涉及一种纵向联邦学习参与方选择方法、装置、设备及存储介质


技术介绍

1、联邦学习是一种分布式机器学习方法。在联邦学习中,不同参与方(数据所有者)通过合作来训练机器学习模型,而无需共享原始数据,从而保护了数据的隐私性。在这一领域,纵向联邦学习引入了更为复杂的数据结构,其中每个参与方仅持有数据样本的部分特征。

2、尽管联邦学习在解决隐私问题、分布式构建机器学习模型方面取得了显著进展,参与方之间的数据贡献仍可能存在明显差异,这对于构建高性能模型是一个挑战。

3、相关技术中,传统的参与方选择方法侧重于对模型性能进行改善,却忽略了参与方间数据贡献的差异性及其对计算和通信效率的影响。同时,传统的参与方选择方法常使用夏普利值进行参与方的贡献评估,但此类方法在效率方面存在一定的不足。

4、因此,有必要设计一种新的纵向联邦学习参与方选择方法,以克服上述问题。


技术实现思路

1、本申请提供一种纵向联邦学习参与方选择方法、装置、设备及存储介质,可以解决相关技术中存在的计本文档来自技高网...

【技术保护点】

1.一种纵向联邦学习参与方选择方法,其特征在于,所述纵向联邦学习参与方选择方法包括:

2.如权利要求1所述的纵向联邦学习参与方选择方法,其特征在于,所述对于每个参与方,选择一查询实例xq,并基于伪标签找出每个参与方中距离查询实例xq最近的前C个数据作为候选数据实例,包括:

3.如权利要求2所述的纵向联邦学习参与方选择方法,其特征在于,所有参与方存在一个对齐的数据集,该数据集包含N个数据样本,记为D={X,Y},其中F是联合特征空间的维度;参与方pj上持有的数据用表示,

4.如权利要求1所述的纵向联邦学习参与方选择方法,其特征在于,所述从候选数据实例中选...

【技术特征摘要】

1.一种纵向联邦学习参与方选择方法,其特征在于,所述纵向联邦学习参与方选择方法包括:

2.如权利要求1所述的纵向联邦学习参与方选择方法,其特征在于,所述对于每个参与方,选择一查询实例xq,并基于伪标签找出每个参与方中距离查询实例xq最近的前c个数据作为候选数据实例,包括:

3.如权利要求2所述的纵向联邦学习参与方选择方法,其特征在于,所有参与方存在一个对齐的数据集,该数据集包含n个数据样本,记为d={x,y},其中f是联合特征空间的维度;参与方pj上持有的数据用表示,

4.如权利要求1所述的纵向联邦学习参与方选择方法,其特征在于,所述从候选数据实例中选择k个最近邻的数据实例集合t,包括:

5.如权利要求1所述的纵向联邦学习参与方选择方法,其特征在于,所述基于数据实例集合t计算不同参与方的相似度,并采用贪婪算法最大化子模块似然函数选择具有最大边际增益的参与方作为参与者,包括:

6.如权利要求5所述的纵向联邦学习参...

【专利技术属性】
技术研发人员:江佳伟周小凯李鑫彦黄浩
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1