用于进行数据安全匹配的方法、装置和系统制造方法及图纸

技术编号:21777364 阅读:31 留言:0更新日期:2019-08-03 23:14
本公开的一方面涉及一种进行数据安全匹配的方法,包括接收用于对具有异质标识的至少两个数据集进行安全匹配的最优安全路由的请求;确定安全多方计算环境中能够进行所述异质标识之间的映射的最优安全路由;以及提供所确定的最优安全路由,以供基于所述最优安全路由通过安全求交集来进行所述至少两个数据集的安全匹配。本发明专利技术还涉及相应的设备、装置和计算机可读介质。本公开的其他方面涉及其他相应的方法、装置和系统。

Methods, devices and systems for data security matching

【技术实现步骤摘要】
用于进行数据安全匹配的方法、装置和系统
本申请涉及安全多方计算(SMC/SMPC),尤其涉及用于异质标识数据安全匹配的方法和设备。
技术介绍
近年来,数据呈现出急剧增长的态势。尤其在大数据的背景下,要使得大量互不信任的参与方能够在不泄露各自的信息的前提下进行安全有效且高效率的多方合作的需求尤为迫切。安全求交集(PSI)是针对安全多方计算中的一个子问题的技术。此技术在保护各参与方各自数据集的明细不不泄露的前提下,求出各参与方的数据交集。PSI在社交、军事、商业、金融、政府等领域均有极大的价值和前景。在最简单的场景中,PSI可包括互不信任的两个参与方,称发送方A和接收方B。发送方A可具有数据集X,而接收方B可具有数据集Y。发送方A允许接收方B计算/获得它们各种的集合X和Y的交集X∩Y,而不会向对方/第三方泄露此交集中未包含的元素。一般而言,接收方B将能知道X∩Y以及X的大小|X|,但不能获悉X和/或任何其他关于X的信息,而发送方A将仅能知道Y的大小|Y|(以及在有些方案中也被允许知道X∩Y),但不能获悉Y和/或任何其他关于Y的信息。在更为复杂的场景中,可以涉及互不信任的多个参与方,其中可包括一个或多个发送方、一个或多个接收方、以及可以包括一个或多个中间方在内的其他各方等等,而PSI可包括计算其中多方的交集而不将其中任一方的信息泄漏给其他任何一方。常用的PSI算法/协议包括但不限于基于哈希的PSI、基于OT(ObliviousTransfer,不经意传输)的PSI、基于公钥的PSI(诸如基于DH(Diffie-Hellman))、基于同态加密(HomomorphicEncryption)的PSI、基于第三方的PSI等等。传统方案中,当两个数据集的标识列一致时,称之为同质标识数据,可以直接通过PSI进行匹配。而当两个数据集的标识列不一致即具有异质标识时,则称这两个数据集为异质标识数据。当需要匹配异质标识数据时,通常先将其中一个数据集的标识列通过一个或多个中间表映射到与另一个数据集相同的标识列上,然后再通过相同的标识列匹配。图1示出了此类情形的示图。例如,匹配数据方A的数据集中的标识列为KEYA,而匹配数据方B的数据集中的标识列为KEYB。KEYA与KEYB不一致,从而它们是异质标识数据。在现有技术中,一般可通过一个或多个中间表C来例如将用户A的数据集的标识列KEYA中的各个标识映射到用户B的数据集Y中的标识列KEYB中对应的标识。在经映射的标识列的基础上求得用户A的数据集与B的数据集的交集。然而,由于依赖于中间表映射,和/或在映射和/或匹配过程中采用集中式处理,因此待匹配数据表明细和中间表明细均有数据泄露的风险。即使采用散列(Hash)后的标识列进行匹配,也存在遭到例如“彩虹表攻击”的潜在风险。因此,本领域中需要改进的异质标识数据安全匹配策略,以至少解决现有技术的上述问题中的一个或多个问题。
技术实现思路
为解决上述问题中的一个或多个问题,本公开提供了用于异质标识数据安全匹配的方法、装置和系统。本公开的一方面涉及一种进行数据安全匹配的方法,包括接收用于对具有异质标识的至少两个数据集进行安全匹配的最优安全路由的请求;确定安全多方计算环境中能够进行所述异质标识之间的映射的最优安全路由;以及提供所确定的最优安全路由,以供基于所述最优安全路由通过安全求交集来进行所述至少两个数据集的安全匹配。根据一示例性实施例,所述最优安全路由包括所述安全多方计算环境中的一个或多个成员节点,每一个成员节点包括多个标识及其之间的映射关系,其中所述异质标识之间的映射依次经由所述最优安全路由中的每一个成员节点来进行。根据一替换性实施例,所述最优安全路由包括存储大数据集的成员节点,所述大数据集包括多个标识及其之间的映射关系,从而足以确定所述异质标识之间的映射。根据一示例性实施例,该方法进一步包括比较所述至少两个数据集的数据量;以及将所述至少两个数据集中数据量少的一方作为所述最优安全路由的起点,并且其中提供所确定的最优安全路由包括将所确定的最优安全路由通知所述最优安全路由的起点。根据进一步的示例性实施例,该方法进一步包括接收作为所述最优安全路由的起点的一方的数据集中还有部分数据的标识经由所述安全路由未得到映射的指示;确定所述安全多方计算环境中能够进行所述异质标识之间的映射的下一最优安全路由;以及提供所确定的下一最优安全路由,以供基于所述下一最优安全路由通过安全求交集来进行所述部分数据的安全匹配。根据进一步的示例性实施例,该方法重复直至作为所述最优安全路由的起点的一方的数据集中所有数据的标识均得到映射并且所述至少两个数据集的安全匹配完成。根据又一示例性实施例,所述至少两个数据集各自属于相应的数据方,并且所述请求从所述相应的数据方之一接收。本公开的一方面涉及一种进行数据安全匹配的方法,包括接收用于对具有异质标识的至少两个数据集进行安全匹配的最优安全路由的通知,所述最优安全路由包括安全多方计算环境中能够进行所述异质标识之间的映射的安全路由;以及基于所述最优安全路由通过安全求交集来进行所述至少两个数据集的安全匹配。根据一示例性实施例,所述最优安全路由包括所述安全多方计算环境中的一个或多个成员节点,每一个成员节点包括多个标识及其之间的映射关系,其中所述异质标识之间的映射依次经由所述最优安全路由中的每一个成员节点来进行。根据另一示例性实施例,所述最优安全路由包括存储大数据集的成员节点,所述大数据集包括多个标识及其之间的映射关系,从而足以确定所述异质标识之间的映射。根据又一示例性实施例,该方法还包括传送用于对所述具有异质标识的至少两个数据集进行安全匹配的最优安全路由的请求。根据再一示例性实施例,所述最优安全路由的起点包括所述至少两个数据集中数据量少的一方。根据进一步的示例性实施例,该方法进一步包括如果作为所述最优安全路由的起点的一方的数据集中还有部分数据的标识经由所述安全路由未得到映射,则接收下一最优安全路由的通知,所述下一最优安全路由包括所述安全多方计算环境中能够进行所述异质标识之间的映射的安全路由;以及基于所述下一最优安全路由通过安全求交集来进行所述部分数据的安全匹配。根据进一步的示例性实施例,该方法重复直至作为所述最优安全路由的起点的一方的数据集中所有数据的标识均得到映射并且所述至少两个数据集的安全匹配完成。根据又一示例性实施例,所述至少两个数据集各自属于相应的数据方,并且所述方法在数据方之一实现。本公开的又一方面涉及一种安全多方计算系统,包括至少两个数据方,所述至少两个数据方包括具有异质标识的至少两个数据集;一个或多个成员节点,每一个成员节点包括多个标识及其之间的映射关系;路由发现设备,其中所述路由发现设备:接收用于对具有异质标识的至少两个数据集进行安全匹配的最优安全路由的请求;确定安全多方计算环境中能够进行所述异质标识之间的映射的最优安全路由;以及向所述至少两个数据方中的至少一个数据方提供所确定的最优安全路由;其中所述至少一个数据方接收用于对具有异质标识的至少两个数据集进行安全匹配的最优安全路由的通知;以及基于所述最优安全路由通过安全求交集来进行所述至少两个数据集的安全匹配。本公开还包括相应的装置。本公开的实施例在对异质标识数据进行匹配时本文档来自技高网
...

【技术保护点】
1.一种进行数据安全匹配的方法,包括:接收用于对具有异质标识的至少两个数据集进行安全匹配的最优安全路由的请求;确定安全多方计算环境中能够进行所述异质标识之间的映射的最优安全路由;以及提供所确定的最优安全路由,以供基于所述最优安全路由通过安全求交集来进行所述至少两个数据集的安全匹配。

【技术特征摘要】
1.一种进行数据安全匹配的方法,包括:接收用于对具有异质标识的至少两个数据集进行安全匹配的最优安全路由的请求;确定安全多方计算环境中能够进行所述异质标识之间的映射的最优安全路由;以及提供所确定的最优安全路由,以供基于所述最优安全路由通过安全求交集来进行所述至少两个数据集的安全匹配。2.如权利要求1所述的方法,其特征在于,所述最优安全路由包括所述安全多方计算环境中的一个或多个成员节点,每一个成员节点包括多个标识及其之间的映射关系,其中:所述异质标识之间的映射依次经由所述最优安全路由中的每一个成员节点来进行。3.如权利要求1所述的方法,其特征在于,所述最优安全路由包括存储大数据集的成员节点,所述大数据集包括多个标识及其之间的映射关系,从而足以确定所述异质标识之间的映射。4.如权利要求1所述的方法,其特征在于,进一步包括:比较所述至少两个数据集的数据量;以及将所述至少两个数据集中数据量少的一方作为所述最优安全路由的起点,并且其中,提供所确定的最优安全路由包括将所确定的最优安全路由通知所述最优安全路由的起点。5.如权利要求4所述的方法,其特征在于,进一步包括:接收作为所述最优安全路由的起点的一方的数据集中还有部分数据的标识经由所述安全路由未得到映射的指示;确定所述安全多方计算环境中能够进行所述异质标识之间的映射的下一最优安全路由;以及提供所确定的下一最优安全路由,以供基于所述下一最优安全路由通过安全求交集来进行所述部分数据的安全匹配。6.如权利要求5所述的方法,其特征在于,所述方法重复直至作为所述最优安全路由的起点的一方的数据集中所有数据的标识均得到映射并且所述至少两个数据集的安全匹配完成。7.如权利要求1所述的方法,其特征在于,所述至少两个数据集各自属于相应的数据方,并且所述请求从所述相应的数据方之一接收。8.一种进行数据安全匹配的方法,包括:接收用于对具有异质标识的至少两个数据集进行安全匹配的最优安全路由的通知,所述最优安全路由包括安全多方计算环境中能够进行所述异质标识之间的映射的安全路由;以及基于所述最优安全路由通过安全求交集来进行所述至少两个数据集的安全匹配。9.如权利要求8所述的方法,其特征在于,所述最优安全路由包括所述安全多方计算环境中的一个或多个成员节点,每一个成员节点包括多个标识及其之间的映射关系,其中:所述异质标识之间的映射依次经由所述最优安全路由中的每一个成员节点来进行。10.如权利要求8所述的方法,其特征在于,所述最优安全路由包括存储大数据集的成员节点,...

【专利技术属性】
技术研发人员:阮方圆
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1