System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,尤其涉及一种参与方确定方法、装置、电子设备及可读存储介质。
技术介绍
1、为保护用户隐私以及数据安全,目前可使用联邦学习算法构建多个参与方共享的高性能模型,具体方法包括使用多方的数据联合建模,建模过程中各方数据不离开本地,不暴露给其他参与建模方,以达到保护用户隐私和数据安全的目的,同时利用各方数据建立高性能模型。
2、由于联邦学习过程中,各参与方利用本地数据训练局部模型,即各方本地数据保密,若参与方的数据与需求方所需数据的差异较大,易导致建模效果较差。
技术实现思路
1、本申请提供一种参与方确定方法、装置、电子设备及可读存储介质,以解决建模效果较差的问题。
2、第一方面,本申请实施例提供了一种参与方确定方法,应用于需求方设备,包括:
3、获取需求方数据集;
4、基于所述需求方数据集,获取与所述需求方数据集参与联邦学习的m个候选数据集的数据分布信息,所述m个候选数据集中的第n个候选数据集对应第n个候选参与方设备,所述m个候选数据集的数据分布信息用于表征所述m个候选数据集在所述需求方数据集上的数据分布情况;
5、基于所述数据分布信息确定与所述需求方目标参与方设备,所述目标参与方设备包括与所述m个候选数据集对应的m个候选参与方设备中的至少一个参与方设备;
6、其中,m为正整数,n为小于或等于m的正整数。
7、第二方面,本申请实施例还提供一种参与方确定装置,包括:
8、第一获
9、第二获取模块,用于基于所述需求方数据集,获取与所述需求方数据集参与联邦学习的m个候选数据集的数据分布信息,所述m个候选数据集中的第n个候选数据集对应第n个候选参与方设备,所述m个候选数据集的数据分布信息用于表征所述m个候选数据集在所述需求方数据集上的数据分布情况;
10、确定模块,用于基于所述数据分布信息确定与所述需求方设备进行联邦学习的目标参与方设备,所述目标参与方设备包括与所述m个候选数据集对应的m个候选参与方设备中的至少一个参与方设备;
11、其中,m为正整数,n为小于或等于m的正整数。
12、第三方面,本申请实施例还提供了一种电子设备,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的参与方确定方法的步骤。
13、第四方面,本申请实施例还提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的参与方确定方法的步骤。
14、本申请实施例中,基于所述需求方数据集,获取m个候选数据集的数据分布信息,可以确保联邦学习中各参与方数据的私密性,并且基于获取的m个候选数据集的数据分布信息,确定目标参与方设备,所述目标参与方设备包括与所述m个候选数据集对应的m个候选参与方设备中的至少一个参与方设备,可以基于每一候选数据集在所述需求方数据集上的数据分布情况,对所述m个候选数据集进行选择,从而确定与所述需求方设备进行联邦学习的目标参与方,也即确定与所述需求方数据集的数据分布更相似的候选数据集,使得参与联邦学习的各参与方之间的数据分布差异减小,所述目标参与方参与联邦学习过程中可提供更符合需求方设备需求的数据,从而提升建模效果。
本文档来自技高网...【技术保护点】
1.一种参与方确定方法,应用于需求方设备,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述数据分布信息包括如下至少一项信息:
3.如权利要求1所述的方法,其特征在于,所述数据分布信息包括数据分布相似性;
4.如权利要求3所述的方法,其特征在于,所述获取所述需求方数据集的第一数据分布向量,包括:
5.如权利要求1所述的方法,其特征在于,所述数据分布信息包括数据特征匹配度;
6.如权利要求1所述的方法,其特征在于,所述数据分布信息包括数据标签的均衡度;
7.如权利要求1所述的方法,其特征在于,所述数据分布信息包括数据特征匹配度、数据标签的均衡度和数据分布相似性中的至少两项信息;
8.一种参与方确定装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至7中任一项所述的参与方确定方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存
...【技术特征摘要】
1.一种参与方确定方法,应用于需求方设备,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述数据分布信息包括如下至少一项信息:
3.如权利要求1所述的方法,其特征在于,所述数据分布信息包括数据分布相似性;
4.如权利要求3所述的方法,其特征在于,所述获取所述需求方数据集的第一数据分布向量,包括:
5.如权利要求1所述的方法,其特征在于,所述数据分布信息包括数据特征匹配度;
6.如权利要求1所述的方法,其特征在于,所述数据分布信息包括数据标签的均衡度;
7....
【专利技术属性】
技术研发人员:于路,信伦,
申请(专利权)人:中国移动通信有限公司研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。