【技术实现步骤摘要】
基于交集保护的数据处理装置
[0001]本专利技术涉及数据处理
,尤其涉及一种基于交集保护的数据处理装置
。
技术介绍
[0002]随着人工智能及大数据技术的发展,人们对相关技术所涉及隐私问题逐步关心,法律法规也对数据流通过程的隐私保护具有明确规范
。
因此,机构之间由于数据流通合规性问题导致大量数据孤岛存在
。
联邦学习是一种解决数据孤岛的关键技术,它通过密码学和分布式机器学习进行结合,使多方数据能安全完成联合的模型训练,提升模型性能
。
另外,数据分析在业务中具有重要作用,安全联合分析也是数据安全流通
、
数据可用不可见的关键技术
。
它通过安全多方计算
MPC
和数据分析技术结合,是多方数据能共同完成数据分析,提升智能决策
、
智能分析能力
。
[0003]联邦学习的模型训练中,按照数据的划分方式可分为横向联邦学习和纵向联邦学习
。
横向联邦学习是多个参与方具有相同维度特征,但具有不同样本的联合学习模型
。
纵向联邦学习是多个参与方具有相同样本,但各自有相同样本的不同特征的联合学习模型
。
[0004]在纵向联邦学习中,通常首先需要将参与方之间的数据进行安全求交(隐私集合求交),得到待学习的共同样本,再进行后续的联合学习
。
一般的安全求交通常是在保护双方非交集样本情况下得到共有交集样本,且存在多种实现方案, ...
【技术保护点】
【技术特征摘要】
1.
一种基于交集保护的数据处理装置,其特征在于,所述装置至少包括第一参与设备与第二参与设备,所述第一参与设备用于对持有的各样本
ID
进行可交换加密计算,得到各第一可交换加密
ID
,并对持有的各样本对应的特征进行同态加密,得到各第一同态加密特征;所述第一参与设备将各第一可交换加密
ID
与各第一同态加密特征发送至第二参与设备,并接收所述第二参与设备发送的第二参与设备的各第二可交换加密
ID
和各第二同态加密特征;所述第一参与设备还用于对所述第二参与设备的各第二可交换加密
ID
进行二次可交换加密,得到各第二二次可交换加密
ID
,并基于各第二同态加密特征确定各第二二次可交换加密
ID
对应的独有第二特征秘密份额;所述第一参与设备将各第二二次可交换加密
ID
以及各第二二次可交换加密
ID
对应的目标第二特征秘密份额作为元祖发送至所述第二参与设备,并接收所述第二参与设备发送的各第一二次可交换加密
ID
和各第一二次可交换加密
ID
对应的目标第一特征秘密份额所构成的元祖;所述第一参与设备根据计算任务对接收到的各元祖进行处理,得到所述第一参与设备与所述第二参与设备的整体秘密分享
。2.
根据权利要求1所述的基于交集保护的数据处理装置,其特征在于,所述第一参与设备还用于生成各第二同态加密特征对应的随机向量,并分别与对应的各第二同态加密特征进行相减,得到各第二二次可交换加密
ID
对应的目标第二特征秘密份额
。3.
根据权利要求2所述的基于交集保护的数据处理装置,其特征在于,所述第一参与设备还用于将各第二二次可交换加密
ID
以及各第二二次可交换加密
ID
对应的目标第二特征秘密份额作为元祖;所述第一参与设备将各第二二次可交换加密
ID
对应的元祖组成的列表进行随机排序后发送至所述第二参与设备,并确定各第二同态加密特征对应的随机向量的元祖
。4.
根据权利要求3所述的基于交集保护的数据处理装置,其特征在于,所述计算任务为纵向联邦学习,所述第一参与设备还用于对接收到的各元祖中的各第一二次可交换加密
ID
对应的目标第一特征秘密份额进行解密,并按照各样本
ID
与各第二同态加密特征对应的随机向量的元祖进行求交,得到第一交集;...
【专利技术属性】
技术研发人员:张黎,
申请(专利权)人:闪捷信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。