【技术实现步骤摘要】
数据处理方法、装置、联邦学习系统和电子设备
本公开涉及计算机
,尤其涉及深度学习和大数据处理等人工智能领域。
技术介绍
机器学习已经普遍应用到金融、医疗等各个领域。机器学习之所以能在各个领域取得良好效果,与相关技术的飞跃发展、硬件计算能力的快速提升以及数据的爆炸式增长有关。联邦学习是在满足用户隐私保护、数据安全和相关规则的情况下,利用多个机构的数据进行联合分析或者联合建模。在联邦学习之前多个机构即联邦学习的参与方,往往需要进行数据对齐。数据对齐是指对多个参与方的数据集中具有相同用户标识的数据进行对齐,其中包含确定多个参与方的数据集中相同的用户标识的过程。
技术实现思路
本公开提供了一种数据处理方法、装置、联邦学习系统和电子设备。根据本公开的一方面,提供了一种数据处理方法,包括:联邦学习系统中的第一参与方基于不经意传输OT协议,与联邦学习系统中的第二参与方交互,得到不经意伪随机函数OPRF种子;第一参与方基于OPRF种子和第一参与方的数据标识集合,确定第一参与方的OPRF输出信 ...
【技术保护点】
1.一种数据处理方法,包括:/n联邦学习系统中的第一参与方基于不经意传输OT协议,与联邦学习系统中的第二参与方交互,得到不经意伪随机函数OPRF种子;/n所述第一参与方基于所述OPRF种子和所述第一参与方的数据标识集合,确定所述第一参与方的OPRF输出信息;/n所述第一参与方发送所述第一参与方的OPRF输出信息;其中,所述第一参与方的OPRF输出信息用于确定所述联邦学习系统的数据标识集合的交集。/n
【技术特征摘要】
1.一种数据处理方法,包括:
联邦学习系统中的第一参与方基于不经意传输OT协议,与联邦学习系统中的第二参与方交互,得到不经意伪随机函数OPRF种子;
所述第一参与方基于所述OPRF种子和所述第一参与方的数据标识集合,确定所述第一参与方的OPRF输出信息;
所述第一参与方发送所述第一参与方的OPRF输出信息;其中,所述第一参与方的OPRF输出信息用于确定所述联邦学习系统的数据标识集合的交集。
2.根据权利要求1所述的方法,所述第一参与方发送所述第一参与方的OPRF输出信息,包括:
所述第一参与方将所述第一参与方的OPRF输出信息发送至所述第二参与方;其中,所述第二参与方用于根据所述第一参与方的OPRF输出信息和所述第二参与方的OPRF输出信息,确定所述联邦学习系统的数据标识集合的交集。
3.根据权利要求1所述的方法,还包括:
所述第一参与方将所述OPRF种子发送至所述联邦学习系统中的第三参与方;其中,所述第三参与方用于基于所述OPRF种子和所述第三参与方的数据标识集合,得到所述第三参与方的OPRF输出信息,并将所述第三参与方的OPRF输出信息发送至中间方;
相应的,所述第一参与方发送所述第一参与方的OPRF输出信息,包括:
所述第一参与方将所述第一参与方的OPRF输出信息发送至所述中间方;其中,所述中间方用于基于所述第一参与方和所述第三参与方的OPRF输出信息,确定OPRF输出信息交集,所述OPRF输出信息交集用于确定所述联邦学习系统的数据标识集合的交集。
4.根据权利要求3所述的方法,还包括:
所述第一参与方接收所述第二参与方发送的所述联邦学习系统的数据标识集合的交集;其中,所述第二参与方用于接收所述中间方发送的OPRF输出信息交集,基于所述OPRF输出信息交集与所述第二参与方的OPRF输出信息,确定所述联邦学习系统的数据标识集合的交集。
5.根据权利要求1-4中任一项所述的方法,还包括:
所述第一参与方接收所述第二参与方的集合尺寸;
相应的,所述第一参与方基于所述OPRF种子和所述第一参与方的数据标识集合,确定所述第一参与方的OPRF输出信息,包括:
所述第一参与方基于所述OPRF种子、所述第一参与方的数据标识集合和所述第二参与方的集合尺寸,确定所述第一参与方的OPRF输出信息。
6.一种数据处理装置,应用于联邦学习系统中的第一参与方,所述装置包括:
交互模块,用于基于不经意传输OT协议,与联邦学习系统中的第二参与方交互,得到不经意伪随机函数OPRF种子;
第一确定模块,用于所述第一参与方基于所述OPRF种子和所述第一参与方的数据标识集合,确定所述第一参与方的OPRF输出信息;
第一发送模块,用于发送所述第一参与方的OPRF输出信息;其中,所述第一参与方的OPRF输出信息用于确定所述联邦学习系统的数据标识集合的交集。
7.根据权利要求6所述的装置,所述第一发送模块用于:
将所述第一参与方的OPRF输出信息发送至所述第二参与方;其中,所述第二参与方用于根据所述第一参与方的OPRF输出信息和所述第二参与方的OPRF输出信息确定所述联邦学习系统的数据标识集合的交集。
8.根据权利要求6所述的装置,还包括:
第二发送模块,用于将所述OPRF种子发送至所述联邦学习系统中的第三参与方;其中,所述第三参与方用于基于所述OPRF种子和所述第三参与方的数据标识集合,得到所述第三参与方的OPRF输出信息,并将所述第三参与方的OPRF输出信息发送至中间方;
相应的,所述第一发送模块用于:
将所述第一参与方的OPRF输出信息发送至所述中间方;其中,所述中间方用于基于所述第一参与方和所述第三参与方的OPRF输出信息,确定OPRF...
【专利技术属性】
技术研发人员:何恺,蒋精华,杨青友,洪爵,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。