两方数据安全碰撞方法和系统技术方案

技术编号:22167712 阅读:30 留言:0更新日期:2019-09-21 10:55
本申请涉及一种两方数据安全碰撞方法和系统,该方法包括:获取初始参数;根据所述初始参数确定数组的长度和映射函数的个数;根据映射函数将所述第一数据集映射为第一数组;将所述第一数组发送到第二计算设备,以使第二计算设备根据所述第一数组筛选出所述第一数据集与第二数据集的公共集合。本申请的方案保证了数据碰撞过程中,双方都不能获取对方的原始数据;在不泄露原始数据的情况下,双方可以且仅仅可以识别公有数据,双方的非公有数据都不会泄露给对方,保证了数据安全。

Two-party Data Security Collision Method and System

【技术实现步骤摘要】
两方数据安全碰撞方法和系统
本申请属于数据交换
,具体涉及一种两方数据安全碰撞方法和系统。
技术介绍
企业通常都拥有大量的数据,比如提供互联网服务的各种社交软件的开发公司,会拥有大量的用户数据。各公司都将自己的数据作为核心资产进行保护,防止泄露。但是在很多业务场景下,两个公司可能需要对相同类型的数据求交集,比如寻找双方共同用户、共同IP黑名单等。相关技术中,有两种方案来求数据交集:1、通过第三方平台进行,由第三方接收双方的数据,求数据交集后,再分别发给双方。此方案的问题在于,需要对第三方有足够的信任,信任其不会泄露双方的数据;同时要签订相关的合同,流程较长,对于业务推进不利。2、双方直接进行数据交换。具体做法是,双方将数据进行hash后,相互交换hash值,相同hash值对应的原始数据作为公共数据。此方案的问题在于不够安全,如果数据集的取值范围不够大,比如都是手机号码,那么很容易根据hash值倒推出原始的数据,因此会泄露非公共数据给对方。
技术实现思路
基于相关技术中存在的缺陷,本申请提供一种两方数据安全碰撞方法和系统。根据本申请的第一方面,提供一种两方数据安全碰撞方法,该方法应用于能够访问第一数据集的第一计算设备,包括:获取初始参数;根据所述初始参数确定数组的长度和映射函数的个数;根据映射函数将所述第一数据集映射为第一数组;将所述第一数组发送到第二计算设备,以使第二计算设备根据所述第一数组筛选出所述第一数据集与第二数据集的公共集合。进一步地,所述初始参数包括:数据量和错误率;相应地,所述获取初始参数,包括:访问第一数据集,获取第一数据集的第一数据量;接收第二计算设备发送的第二数据集的第二数据量;根据所述第一数据量和所述第二数据量确定所述数据量。进一步地,所述根据所述第一数据量和所述第二数据量确定所述数据量,包括:将所述第一数据量和所述第二数据量中的较大值确定为所述数据量。进一步地,所述根据所述初始参数确定数组的长度和映射函数的个数,包括:根据所述数据量和所述错误率确定数组的长度;根据所述错误率确定映射函数的个数。进一步地,所述根据所述数据量和所述错误率确定数组的长度,包括:数组的长度其中,n为所述数据量,err为所述错误率。进一步地,所述根据所述错误率确定映射函数的个数,包括:映射函数的个数其中,err为所述错误率。进一步地,所述映射函数为hash函数;相应地,所述根据映射函数将所述第一数据集映射为第一数组,包括:采用布隆滤波器算法将所述第一数据集映射为第一数组。根据本申请的第二方面,提供一种两方数据安全碰撞方法,该方法应用于能够访问第二数据集的第二计算设备,包括:获取第一数组,所述第一数组是第一计算设备根据映射函数将第一数据集映射为所述第一数组后发送的;根据所述第一数组筛选出所述第一数据集与所述第二数据集的公共集合;将所述公共集合发送到所述第一计算设备。进一步地,所述根据所述第一数组筛选出所述第一数据集与所述第二数据集的公共集合,包括:依次将所述第二数据集中的每一个数据映射为一个第二数组;将第二数组与所述第一数组进行比较,判断该第二数组对应的数据是否存在于所述第一数据集中;根据判断结果筛选出所述公共集合。进一步地,所述判断该第二数组对应的数据是否存在于所述第一数据集中,包括:根据布隆滤波器算法判断该第二数组对应的数据是否存在于所述第一数据集中。进一步地,所述根据判断结果筛选出所述公共集合,包括:将所述公共集合初始化为空集;将判断结果为存在于所述第一数据集中的数据加入到所述公共集合中。根据本申请的第三方面,提供一种计算设备,该计算设备是能够访问第一数据集的第一计算设备,包括:第一获取模块,用于获取初始参数;确定模块,用于根据所述初始参数确定数组的长度和映射函数的个数;映射模块,用于根据映射函数将所述第一数据集映射为第一数组;第一发送模块,用于将所述第一数组发送到第二计算设备,以使第二计算设备根据所述第一数组筛选出所述第一数据集与第二数据集的公共集合。根据本申请的第四方面,提供一种计算设备,该计算设备是能够访问第二数据集的第二计算设备,包括:第二获取模块,用于获取第一数组,所述第一数组是第一计算设备根据映射函数将第一数据集映射为所述第一数组后发送的;筛选模块,用于根据所述第一数组筛选出所述第一数据集与所述第二数据集的公共集合;第二发送模块,用于将所述公共集合发送到所述第一计算设备。根据本申请的第五方面,提供一种两方数据安全碰撞系统,包括:能够访问第一数据集的第一计算设备,和,能够访问第二数据集的第二计算设备;所述第一计算设备用于:获取初始参数;根据所述初始参数确定数组的长度和映射函数的个数;根据映射函数将所述第一数据集映射为第一数组;将所述第一数组发送到所述第二计算设备;所述第二计算设备用于:获取第一数组;根据所述第一数组筛选出所述第一数据集与所述第二数据集的公共集合;将所述公共集合发送到所述第一计算设备。与现有技术相比,本申请的技术方案具备以下有益技术效果:本申请的方案保证了数据碰撞过程中,双方都不能获取对方的原始数据;在不泄露原始数据的情况下,双方可以且仅仅可以识别公有数据,双方的非公有数据都不会泄露给对方,保证了数据安全。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图进行简单地介绍。显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据一示例性实施例所示出的一种两方数据安全碰撞方法的流程图。图2是根据一示例性实施例所示出的一种两方数据安全碰撞方法的流程图。图3是根据一示例性实施例所示出的两方进行数据碰撞的交互流程图。具体实施方式为使本领域技术人员更好地理解本专利技术的技术方案,下面结合附图和具体实施方式对本专利技术作进一步详细描述。参照图1,本申请提供一种两方数据安全碰撞方法,该方法应用于能够访问第一数据集的第一计算设备,包括:步骤101:获取初始参数;步骤102:根据所述初始参数确定数组的长度和映射函数的个数;步骤103:根据映射函数将所述第一数据集映射为第一数组;步骤104:将所述第一数组发送到第二计算设备,以使第二计算设备根据所述第一数组筛选出所述第一数据集与第二数据集的公共集合。本申请的方案保证了数据碰撞过程中,双方都不能获取对方的原始数据;在不泄露原始数据的情况下,双方可以且仅仅可以识别公有数据,双方的非公有数据都不会泄露给对方,保证了数据安全。一些实施例中,所述初始参数包括:数据量和错误率;相应地,所述获取初始参数,包括:访问第一数据集,获取第一数据集的第一数据量;接收第二计算设备发送的第二数据集的第二数据量;根据所述第一数据量和所述第二数据量确定所述数据量。一些实施例中,所述根据所述第一数据量和所述第二数据量确定所述数据量,包括:将所述第一数据量和所述第二数据量中的较大值确定为所述数据量。一些实施例中,所述根据所述初始参数确定数组的长度和映射函数的个数,包括:根据所述数据量和所述错误率确定数组的长度;根据所述错误率确定映射函数的个数。一些实施例中,所述根据所述数据量和所述错误率确定数组的长度,包括:数组的长度其中,n为所本文档来自技高网...

【技术保护点】
1.一种两方数据安全碰撞方法,其特征在于,该方法应用于能够访问第一数据集的第一计算设备,包括:获取初始参数;根据所述初始参数确定数组的长度和映射函数的个数;根据映射函数将所述第一数据集映射为第一数组;将所述第一数组发送到第二计算设备,以使第二计算设备根据所述第一数组筛选出所述第一数据集与第二数据集的公共集合。

【技术特征摘要】
1.一种两方数据安全碰撞方法,其特征在于,该方法应用于能够访问第一数据集的第一计算设备,包括:获取初始参数;根据所述初始参数确定数组的长度和映射函数的个数;根据映射函数将所述第一数据集映射为第一数组;将所述第一数组发送到第二计算设备,以使第二计算设备根据所述第一数组筛选出所述第一数据集与第二数据集的公共集合。2.根据权利要求1所述的方法,其特征在于,所述初始参数包括:数据量和错误率;相应地,所述获取初始参数,包括:访问第一数据集,获取第一数据集的第一数据量;接收第二计算设备发送的第二数据集的第二数据量;根据所述第一数据量和所述第二数据量确定所述数据量。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一数据量和所述第二数据量确定所述数据量,包括:将所述第一数据量和所述第二数据量中的较大值确定为所述数据量。4.根据权利要求2所述的方法,其特征在于,所述根据所述初始参数确定数组的长度和映射函数的个数,包括:根据所述数据量和所述错误率确定数组的长度;根据所述错误率确定映射函数的个数。5.根据权利要求4所述的方法,其特征在于,所述根据所述数据量和所述错误率确定数组的长度,包括:数组的长度其中,n为所述数据量,err为所述错误率。6.根据权利要求4所述的方法,其特征在于,所述根据所述错误率确定映射函数的个数,包括:映射函数的个数其中,err为所述错误率。7.根据权利要求1-6任一项所述的方法,其特征在于,所述映射函数为hash函数;相应地,所述根据映射函数将所述第一数据集映射为第一数组,包括:采用布隆滤波器算法将所述第一数据集映射为第一数组。8.一种两方数据安全碰撞方法,其特征在于,该方法应用于能够访问第二数据集的第二计算设备,包括:获取第一数组,所述第一数组是第一计算设备根据映射函数将第一数据集映射为所述第一数组后发送的;根据所述第一数组筛选出所述第一数据集与所述第二数据集的公共集合;将所述公共集合发送到所述第一计算设备。9.根据权利要求8所述的方法,其特征在于,所述根据所述第一...

【专利技术属性】
技术研发人员:姚平徐杰姚雷牛宝梅
申请(专利权)人:苏宁易购集团股份有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1