基于交集保护的数据处理装置制造方法及图纸

技术编号:39680283 阅读:11 留言:0更新日期:2023-12-11 18:58
本发明专利技术提供一种基于交集保护的数据处理装置,属于数据处理技术领域,所述装置包括第一参与设备和第二参与设备

【技术实现步骤摘要】
基于交集保护的数据处理装置


[0001]本专利技术涉及数据处理
,尤其涉及一种基于交集保护的数据处理装置


技术介绍

[0002]随着人工智能及大数据技术的发展,人们对相关技术所涉及隐私问题逐步关心,法律法规也对数据流通过程的隐私保护具有明确规范

因此,机构之间由于数据流通合规性问题导致大量数据孤岛存在

联邦学习是一种解决数据孤岛的关键技术,它通过密码学和分布式机器学习进行结合,使多方数据能安全完成联合的模型训练,提升模型性能

另外,数据分析在业务中具有重要作用,安全联合分析也是数据安全流通

数据可用不可见的关键技术

它通过安全多方计算
MPC
和数据分析技术结合,是多方数据能共同完成数据分析,提升智能决策

智能分析能力

[0003]联邦学习的模型训练中,按照数据的划分方式可分为横向联邦学习和纵向联邦学习

横向联邦学习是多个参与方具有相同维度特征,但具有不同样本的联合学习模型

纵向联邦学习是多个参与方具有相同样本,但各自有相同样本的不同特征的联合学习模型

[0004]在纵向联邦学习中,通常首先需要将参与方之间的数据进行安全求交(隐私集合求交),得到待学习的共同样本,再进行后续的联合学习

一般的安全求交通常是在保护双方非交集样本情况下得到共有交集样本,且存在多种实现方案,
RSA
盲签名
、Diffie

Hellman
密钥协商

混淆布隆过滤器

不经意伪随机函数(
OPRF


不经意可编程伪随机函数
OPPRF、
向量不经意线性评估
VOLE


一般安全求交之后会透露共有交集样本信息,然而在部分场景或参与方限制下,需要同时保护交集样本前提下进行纵向联邦学习训练

因此,一般的安全求交方案不能达到要求

同样,安全联合分析也存在类似问题

在联合分析中,通常需要对多方数据进行
JOIN
计算,而
JOIN
计算需要指定
JOIN
联表的特定字段

为了保护参与方的所有数据不被泄漏,需要对联表字段的数据在密态下进行表对齐


技术实现思路

[0005]本专利技术提供一种基于交集保护的数据处理装置,用以解决现有技术中求交集会泄露共有信息且处理效率低的缺陷,实现对交集数据的保护并提高数据处理效率的效果

[0006]本专利技术提供一种基于交集保护的数据处理装置,所述装置至少包括第一参与设备与第二参与设备,所述第一参与设备用于对持有的各样本
ID
进行可交换加密计算,得到各第一可交换加密
ID
,并对持有的各样本对应的特征进行同态加密,得到各第一同态加密特征;所述第一参与设备将各第一可交换加密
ID
与各第一同态加密特征发送至第二参与设备,并接收所述第二参与设备发送的第二参与设备的各第二可交换加密
ID
和各第二同态加密特征;所述第一参与设备还用于对所述第二参与设备的各第二可交换加密
ID
进行二次可交换加密,得到各第二二次可交换加密
ID
,并基于各第二同态加密特征确定各第二二次可交换加密
ID
对应的独有第二特征秘密份额;所述第一参与设备将各第二二次可交换加密
ID
以及各第二二次可交换加密
ID
对应的目标第二特征秘密份额作为元祖发送至所述第二参与设备,并接收所述第二参与设备发送的各第一二次可交换加密
ID
和各第一二次可交换加密
ID
对应的目标第一特征秘密份额所构成的元祖;所述第一参与设备根据计算任务对接收到的各元祖进行处理,得到所述第一参与设备与所述第二参与设备的整体秘密分享

[0007]根据本专利技术提供的一种基于交集保护的数据处理装置,所述第一参与设备还用于生成各第二同态加密特征对应的随机向量,并分别与对应的各第二同态加密特征进行相减,得到各第二二次可交换加密
ID
对应的目标第二特征秘密份额

[0008]根据本专利技术提供的一种基于交集保护的数据处理装置,所述第一参与设备还用于将各第二二次可交换加密
ID
以及各第二二次可交换加密
ID
对应的目标第二特征秘密份额作为元祖;所述第一参与设备将各第二二次可交换加密
ID
对应的元祖组成的列表进行随机排序后发送至所述第二参与设备,并确定各第二同态加密特征对应的随机向量的元祖

[0009]根据本专利技术提供的一种基于交集保护的数据处理装置,所述计算任务为纵向联邦学习,所述第一参与设备还用于对接收到的各元祖中的各第一二次可交换加密
ID
对应的目标第一特征秘密份额进行解密,并按照各样本
ID
与各第二同态加密特征对应的随机向量的元祖进行求交,得到第一交集;在所述第一交集正确性验证通过的情况下,所述第一参与设备将所述第一交集对应的元祖进行纵向拼接,得到所述第一交集的整体秘密分享

[0010]根据本专利技术提供的一种基于交集保护的数据处理装置,所述计算任务为安全联合分析的
JOIN
计算,所述第一参与设备还用于对接收到的各元祖中的各第一二次可交换加密
ID
对应的目标第一特征秘密份额进行解密,并按照各样本
ID
与各第二同态加密特征对应的随机向量的元祖进行双层循环遍历,确定与所述第一二次可交换加密
ID
匹配的特征,得到匹配特征集;所述第一参与设备用于基于所述匹配特征集,将对应样本的元祖按特征列进行纵向拼接,得到所述
JOIN
计算的整体秘密分享

[0011]根据本专利技术提供的一种基于交集保护的数据处理装置,所述
JOIN
计算为目标类型的
JOIN
计算,在未确定出与所述第一二次可交换加密
ID
匹配的特征的情况下,所述第一参与设备还用于生成与所述第一参与设备对应的特征相同数据列大小的零向量的特征秘密份额

[0012]根据本专利技术提供的一种基于交集保护的数据处理装置,所述目标类型的
JOIN
计算为左连接

右连接或者全连接

[0013]根据本专利技术提供的一种基于交集保护的数据处理装置,所述第一参与设备还用于确定安全素数
q
以及所述安全素数对应的欧拉函数;所述安全素数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于交集保护的数据处理装置,其特征在于,所述装置至少包括第一参与设备与第二参与设备,所述第一参与设备用于对持有的各样本
ID
进行可交换加密计算,得到各第一可交换加密
ID
,并对持有的各样本对应的特征进行同态加密,得到各第一同态加密特征;所述第一参与设备将各第一可交换加密
ID
与各第一同态加密特征发送至第二参与设备,并接收所述第二参与设备发送的第二参与设备的各第二可交换加密
ID
和各第二同态加密特征;所述第一参与设备还用于对所述第二参与设备的各第二可交换加密
ID
进行二次可交换加密,得到各第二二次可交换加密
ID
,并基于各第二同态加密特征确定各第二二次可交换加密
ID
对应的独有第二特征秘密份额;所述第一参与设备将各第二二次可交换加密
ID
以及各第二二次可交换加密
ID
对应的目标第二特征秘密份额作为元祖发送至所述第二参与设备,并接收所述第二参与设备发送的各第一二次可交换加密
ID
和各第一二次可交换加密
ID
对应的目标第一特征秘密份额所构成的元祖;所述第一参与设备根据计算任务对接收到的各元祖进行处理,得到所述第一参与设备与所述第二参与设备的整体秘密分享
。2.
根据权利要求1所述的基于交集保护的数据处理装置,其特征在于,所述第一参与设备还用于生成各第二同态加密特征对应的随机向量,并分别与对应的各第二同态加密特征进行相减,得到各第二二次可交换加密
ID
对应的目标第二特征秘密份额
。3.
根据权利要求2所述的基于交集保护的数据处理装置,其特征在于,所述第一参与设备还用于将各第二二次可交换加密
ID
以及各第二二次可交换加密
ID
对应的目标第二特征秘密份额作为元祖;所述第一参与设备将各第二二次可交换加密
ID
对应的元祖组成的列表进行随机排序后发送至所述第二参与设备,并确定各第二同态加密特征对应的随机向量的元祖
。4.
根据权利要求3所述的基于交集保护的数据处理装置,其特征在于,所述计算任务为纵向联邦学习,所述第一参与设备还用于对接收到的各元祖中的各第一二次可交换加密
ID
对应的目标第一特征秘密份额进行解密,并按照各样本
ID
与各第二同态加密特征对应的随机向量的元祖进行求交,得到第一交集;...

【专利技术属性】
技术研发人员:张黎
申请(专利权)人:闪捷信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1