【技术实现步骤摘要】
数据集的处理方法、装置和服务器
本说明书属于互联网
,尤其涉及数据集的处理方法、装置和服务器。
技术介绍
在许多应用场景中,不同的数据方往往拥有不同的数据集。有时需要双方合作,先利用各自所拥有的数据集进行联合求交处理,得到对应的交集;再利用上述交集进行具体的数据处理。目前,亟需一种能降低求交过程中的数据处理量和数据传输量,能在保护数据隐私的前提下,高效、安全地完成数据集的求交处理的方法。
技术实现思路
本说明书提供了一种数据集的处理方法、装置和服务器,以降低求交过程的数据处理量和数据传输量,提高数据处理效率,能在保护数据隐私的前提下,高效、安全地完成数据集的求交处理。本说明书提供的一种数据集的处理方法、装置和服务器是这样实现的:一种数据集的处理方法,包括:响应数据处理请求,利用第一秘钥加密所持有的第一数据集中的第一数据元素,得到第一密文数据集;并将所述第一密文数据集发送至第二服务器;接收第二密文数据集,并利用所述第一秘钥加密第二密文数据集,得到第三密文数据集;其中,所述第二密 ...
【技术保护点】
1.一种数据集的处理方法,包括:/n响应数据处理请求,利用第一秘钥加密所持有的第一数据集中的第一数据元素,得到第一密文数据集;并将所述第一密文数据集发送至第二服务器;/n接收第二密文数据集,并利用所述第一秘钥加密第二密文数据集,得到第三密文数据集;其中,所述第二密文数据集为第二服务器利用第二秘钥加密所持有的第二数据集中的第二数据元素得到的,所述第三密文数据集包括二次加密后的第二数据元素的密文数据;/n根据所述第三密文数据集中的第二数据元素的密文数据,构建对应的布隆过滤器;并将所述布隆过滤器发送至第二服务器;其中,所述第二服务器用于利用第二秘钥加密第一密文数据集,得到第四密文 ...
【技术特征摘要】
1.一种数据集的处理方法,包括:
响应数据处理请求,利用第一秘钥加密所持有的第一数据集中的第一数据元素,得到第一密文数据集;并将所述第一密文数据集发送至第二服务器;
接收第二密文数据集,并利用所述第一秘钥加密第二密文数据集,得到第三密文数据集;其中,所述第二密文数据集为第二服务器利用第二秘钥加密所持有的第二数据集中的第二数据元素得到的,所述第三密文数据集包括二次加密后的第二数据元素的密文数据;
根据所述第三密文数据集中的第二数据元素的密文数据,构建对应的布隆过滤器;并将所述布隆过滤器发送至第二服务器;其中,所述第二服务器用于利用第二秘钥加密第一密文数据集,得到第四密文数据集;根据所述第四密文数据集和所述布隆过滤器,确定出第三密文数据集和第四密文数据集的密文数据的交集;并利用所述第二秘钥解密所述密文数据的交集得到第五密文数据集;
接收所述第五密文数据集,并利用第一秘钥解密所述第五密文数据集,得到所述第一数据集和所述第二数据集的明文数据的交集。
2.根据权利要求1所述的方法,所述根据所述第三密文数据集中的第二数据元素的密文数据,构建对应的布隆过滤器,包括:
根据所述第三密文数据集中的第二数据元素的密文数据,计算第二数据元素的密文数据的哈希值;
对所述第二数据元素的密文数据的哈希值进行编码处理,并根据编码结果,构建对应的预设数组;
合并所述预设数组,得到目标数组,以建立与所述第三密文数据集对应的布隆过滤器。
3.根据权利要求2所述的方法,所述第二数据元素的密文数据的哈希值包括基于多个预设的哈希函数所得到的与第二数据元素的密文数据对应的多个哈希值。
4.根据权利要求1所述的方法,在根据所述第三密文数据集中的第二数据元素的密文数据,构建对应的布隆过滤器之前,所述方法还包括:
比较所述第一数据集的数据量和所述第二数据集的数据量;
在确定所述第二数据集的数据量大于或等于第一数据集的数据量的情况下,根据所述第三密文数据集中的第二数据元素的密文数据,构建对应的布隆过滤器。
5.根据权利要求4所述的方法,在确定所述第二数据集的数据量小于第一数据集的数据量的情况下,所述方法还包括:
生成并向第二服务器发送触发指示,以触发第二服务器根据第四密文数据集中的二次加密后的第一数据元素的密文数据,构建对应的布隆过滤器。
6.根据权利要求1所述的方法,所述第一数据集为包含有待检测的用户对象的身份标识的数据集,所述第二数据集为包含有风险对象的身份标识的数据集。
7.根据权利要求6所述的方法,在得到所述第一数据集和所述第二数据集的明文数据的交集之后,所述方法还包括:
根据所述第一数据集和所述第二数据集的明文数据的交集,从待检测的用户对象中筛选出存在风险的用户对象。
8.一种数据集的处理方法,包括:
响应数据处理请求,利用第二秘钥加密所持有的第二数据集中的第二数据元素,得到第二密文数据集;并将所述第二密文数据集发送至第一服务器;
接收第一密文数据集,并利用所述第二秘钥加密第一密文数据集,得到第四密文数据集;其中,所述第一密文数据集为第一服务器利用第一秘钥加密所持有的第一数据集中的第一数据元素得到的,所述第四密文数据集包括二次加密后的第一数据元素的密文数据;
接收布隆过滤器,并根据所述布隆过滤器和所述第四密文数据集,确定出第三密文数据集和第四密文数据集的密文数据的交集;其中,所述布隆过滤器为第一服务器根据所述第三密文数据集中的第二数据元素的密文数据构建得到的,所述第三密文数据集为第一服务器利用所述第一秘钥加密第二密文数据集得到的;
利用所述第二秘钥解密所述密文数据的交集得到第五密文数据集;并将所述第五密文数据集发送至第一服务器,以使得第一服务器根据所述第五密文数据集得到所述第一数据集和所述第二数据集的明文数据的交集。
9.根据权利要求8所述的方法,根据所述布隆过滤器和所述第四密文数据集,确定出第三密文数据集和第四密文数据集的密文数据的交集,包括:
根据所述第四密文数据集中的第一数据元素的密文数据,计算得到第一数据元素的密文数据的哈希值;
利用所述布隆滤波器处理所述第一数据元素的密文数据的哈希值,得到对应各个第一数据元素的密文数据的处理结果;
根据所述处理结果,从所述第一数据元素的密文数据中筛选出符合要求的第一数据元素的密文数据,以构建第三密文数据集和第四密文数据集的密文数据的交集;其中,所述符合要求的第一数据元素的密文数据为第一数据集与第二数据集共有的,且二次加密后的数据元素。
10.根据权利要求9所述的方法,利用所述布隆滤波器处理所述第一数据...
【专利技术属性】
技术研发人员:李翰林,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。