用于样本对齐的方法和装置制造方法及图纸

技术编号:32786233 阅读:9 留言:0更新日期:2022-03-23 19:46
本申请提供了一种用于样本对齐的方法和用于样本对齐的装置,涉及信息安全领域,有利于提高样本对齐的安全性。该方法包括:第一设备接收来自第二设备的X个哈希值中每个哈希值的前M位元素,X为大于或等于1的整数,M小于N,N为预设哈希算法的输出长度,且N为大于1的整数;第一设备在已有的Y个样本数据的基础之上,生成S个混淆样本数据,并按照上述预设哈希算法,对S个混淆样本数据进行哈希运算,获得S个哈希值,Y和S为大于或等于1的整数;在该S个哈希值的前M位元素与上述X个哈希值中每个哈希值的前M位元素均不相同的情况下,第一设备采用上述Y个样本数据和上述S个混淆样本数据与第二设备进行样本对齐。第二设备进行样本对齐。第二设备进行样本对齐。

【技术实现步骤摘要】
用于样本对齐的方法和装置


[0001]本申请涉及信息安全领域,尤其涉及一种用于样本对齐的方法和装置。

技术介绍

[0002]随着大数据的发展,重视数据隐私和安全已经成为了世界性的趋势。企业之间为达成合作,可以通过将双方的样本数据进行加密对齐,使得双方的数据特征可以结合在一起,并通过机器学习来提高各自产品购买的转化率。
[0003]但是,在上述样本对齐过程中,存在参与方数据泄露的风险,即样本对齐的安全性较低。

技术实现思路

[0004]本申请提供一种用于样本对齐的方法和装置,有利于提高样本对齐的安全性。
[0005]第一方面,提供了一种用于样本对齐的方法,包括:第一设备接收来自第二设备的X个哈希值中每个哈希值的前M位元素,X为大于或等于1的整数,M小于N,N为预设哈希算法的输出长度,且N为大于1的整数;第一设备在已有的Y个样本数据的基础之上,生成S个混淆样本数据,并按照上述预设哈希算法,对上述S个混淆样本数据进行哈希运算,获得S个哈希值,Y和S为大于或等于1的整数;在上述S个哈希值的前M位元素与上述X个哈希值中每个哈希值的前M位元素均不相同的情况下,第一设备采用上述Y个样本数据和上述S个混淆样本数据与第二设备进行样本对齐。
[0006]在本申请中,第一设备可以在已有的Y个样本数据的基础之上,生成S个混淆样本数据和该S个混淆样本对应的哈希值,并基于该已有的样本数据和混淆样本数据与第二设备进行样本对齐,降低了在后续样本对齐过程中第二设备或者第三方推出私钥,导致第一设备的真实样本数据(即上述已有的Y个样本数据)被泄露的风险。此外,在第一设备生成上述S个混淆样本之前,第二设备向第一设备发送了其样本数据的哈希值前M位元素,使得第一设备生成的S个混淆样本数据的哈希值的前M位可以与第二设备的样本数据的哈希值的前M为元素不同。换句话说,上述S个混淆样本数据为第二设备的样本数据之外的样本数据,避免了在后续样本对齐过程中,由于混淆样本数据和第二设备的样本数据相同,导致的样本对齐结果有误的问题。
[0007]结合第一方面,在第一方面的某些实现方式中,上述第一设备采用上述Y个样本数据和上述S个混淆样本数据与所上述第二设备进行样本对齐,包括:第一设备按照预设哈希算法,分别对上述Y个样本数据和上述S个混淆样本数据进行哈希运算,获得Y+S个哈希值;第一设备采用私钥对上述Y+S个哈希值进行加密,获得第一加密数据,并向上述第二设备发送上述第一加密数据;第一设备接收来自所上述第二设备的样本对齐结果,该样本对齐结果是基于上述第一加密数据确定的。
[0008]结合第一方面,在第一方面的某些实现方式中,上述样本对齐结果是基于上述第一加密数据和第二加密数据的交集确定的;在上述第一设备采用私钥对上述Y+S个哈希值
进行加密,并向上述第二设备发送加密后的结果之前,上述方法还包括:上述第一设备接收来自上述第二设备的所述X个哈希值;上述第一设备采用私钥对上述X个哈希值进行加密,获得上述第二加密数据,并向上述第二设备发送上述第二加密数据。
[0009]结合第一方面,在第一方面的某些实现方式中,上述方法还包括:上述第一设备判断上述S个哈希值的前M位元素与上述X个哈希值中每个哈希值的前M位元素是否相同;在上述S个哈希值中存在第一哈希值的前M位元素与上述X个哈希值中第二哈希值的前M位元素相同的情况下,上述第一设备重新生成混淆样本数据。
[0010]第二方面,提供了又一用于样本对齐的方法,包括:第二设备按照预设哈希算法,对X个样本数据进行哈希运算,获得X个哈希值,X为大于或等于1的整数,N为上述预设哈希算法的输出长度,且N为大于1的整数;上述第二设备向第一设备发送上述X个哈希值中每个哈希值的前M位元素,M小于N。
[0011]在本申请中,第二设备向第一设备发送了其样本数据的哈希值前M位元素,使得后续第一设备生成的S个混淆样本数据的哈希值的前M位可以与第二设备的样本数据的哈希值的前M为元素不同。换句话说,上述S个混淆样本数据为第二设备的样本数据之外的样本数据,避免了在后续样本对齐过程中,由于混淆样本数据和第二设备的样本数据相同,导致的样本对齐结果有误的问题。
[0012]结合第二方面,在第一方面的某些实现方式中,上述方法还包括:上述第二设备接收来自上述第一设备的第一加密数据,上述第一加密数据是上述第一设备按照预设哈希算法分别对Y+S个样本数据进行哈希运算,获得Y+S个哈希值,并采用私钥对上述Y+S个哈希值进行加密得到的,Y和S为大于或等于1的整数;上述第二设备基于上述第一加密数据,确定样本对齐结果;上述第二设备向上述第一设备发送上述样本对齐结果。
[0013]结合第二方面,在第一方面的某些实现方式中,在上述第二设备接收来自上述第一设备的第一加密数据之前,上述方法还包括:
[0014]上述第二设备向上述第一设备发送上述X个哈希值;上述第二设备接收第二加密数据,上述第二加密数据是上述第一设备采用私钥对上述X个哈希值进行加密得到的;上述第二设备基于上述第一加密数据,确定样本对齐结果,包括:上述第二设备基于上述第一加密数据和第二加密数据的交集,确定上述样本对齐结果。
[0015]第三方面,提供了一种用于样本对齐的装置,包括收发模块和处理模块,其中收发模块用于:接收来自第二设备的X个哈希值中每个哈希值的前M位元素,X为大于或等于1的整数,M小于N,N为预设哈希算法的输出长度,且N为大于1的整数;处理模块用于:在已有的Y个样本数据的基础之上,生成S个混淆样本数据,并按照上述预设哈希算法,对该S个混淆样本数据进行哈希运算,获得S个哈希值,Y和S为大于或等于1的整数;以及,在上述S个哈希值的前M位元素与上述X个哈希值中每个哈希值的前M位元素均不相同的情况下,采用上述Y个样本数据和上述S个混淆样本数据与上述第二设备进行样本对齐。
[0016]结合第三方面,在第三方面的某些实现方式中,上述处理模块用于:按照预设哈希算法,分别对上述Y个样本数据和上述S个混淆样本数据进行哈希运算,获得Y+S个哈希值;采用私钥对所述Y+S个哈希值进行加密,获得第一加密数据,并向上述第二设备发送上述第一加密数据;上述收发模块用于:接收来自上述第二设备的样本对齐结果,该样本对齐结果是基于上述第一加密数据确定的。
[0017]结合第三方面,在第三方面的某些实现方式中,上述样本对齐结果是基于上述第一加密数据和第二加密数据的交集确定的;上述收发模块用于:接收来自上述第二设备的所述X个哈希值;上述处理模块用于:采用私钥对所述X个哈希值进行加密,获得上述第二加密数据,并向上述第二设备发送上述第二加密数据。
[0018]结合第三方面,在第三方面的某些实现方式中,上述处理模块用于:判断上述S个哈希值的前M位元素与上述X个哈希值中每个哈希值的前M位元素是否相同;在上述S个哈希值中存在第一哈希值的前M位元素与上述X个哈希值中第二哈希值的前M位元素相同的情况下,重新生成混淆样本数据。
[0019]第四方面,提供了一种用于样本对齐本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于样本对齐的方法,其特征在于,包括:第一设备接收来自第二设备的X个哈希值中每个哈希值的前M位元素,X为大于或等于1的整数,M小于N,N为预设哈希算法的输出长度,且N为大于1的整数;所述第一设备在已有的Y个样本数据的基础之上,生成S个混淆样本数据,并按照所述预设哈希算法,对所述S个混淆样本数据进行哈希运算,获得S个哈希值,Y和S为大于或等于1的整数;在所述S个哈希值的前M位元素与所述X个哈希值中每个哈希值的前M位元素均不相同的情况下,所述第一设备采用所述Y个样本数据和所述S个混淆样本数据与所述第二设备进行样本对齐。2.根据权利要求1所述的方法,其特征在于,所述第一设备采用所述Y个样本数据和所述S个混淆样本数据与所述第二设备进行样本对齐,包括:所述第一设备按照预设哈希算法,分别对所述Y个样本数据和所述S个混淆样本数据进行哈希运算,获得Y+S个哈希值;所述第一设备采用私钥对所述Y+S个哈希值进行加密,获得第一加密数据,并向所述第二设备发送所述第一加密数据;所述第一设备接收来自所述第二设备的样本对齐结果,所述样本对齐结果是基于所述第一加密数据确定的。3.根据权利要求2所述的方法,其特征在于,所述样本对齐结果是基于所述第一加密数据和第二加密数据的交集确定的;在所述第一设备采用私钥对所述Y+S个哈希值进行加密,并向所述第二设备发送加密后的结果之前,所述方法还包括:所述第一设备接收来自所述第二设备的所述X个哈希值;所述第一设备采用私钥对所述X个哈希值进行加密,获得所述第二加密数据,并向所述第二设备发送所述第二加密数据。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:所述第一设备判断所述S个哈希值的前M位元素与所述X个哈希值中每个哈希值的前M位元素是否相同;在所述S个哈希值中存在第一哈希值的前M位元素与所述X个哈希值中第二哈希值的前M位元素相同的情况下,所述第一设备重新生成混淆样本数据。5.一种用于样本对齐的方法,其特征在于,包括:第二设备按照预设哈希算法,对X个样本数据进行哈希运算,获得X个哈希值,X为大于或等于1的整数,N为所述预设哈希算法的输出长度,且N为大于1的整数;所述第二设备向第一设备发送所述X个哈希值中每个哈希值的前M位元素,M小于N。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:所述第二设备接收来自所述第一设备的第一加密数据,所述第一加密数据是所述第一设备按照预设哈希算法分别对Y+S个样本数据进行哈希运算,获得Y+S个哈希值,并采用私钥对所述Y+S个哈希值进行加密得到的,Y和S为大于或等于1的整数;所述第二设备基于所述第一加密数据,确定样本对齐结果;所述第二设备向所述第一设备发送所述样本对齐结果。
7.根据权利要6所述的方法,其特征在于,在所述第二设备接收来自所述第一设备的第一加密数据之前,所述方法还包括:所述第二设备向所述第一设备发送所述X个哈希值;所述第二设备接收第二加密数据,所述第二加密数据是所述第一设备采用私钥对所述X个哈希值进行加密得到的;所述第二设备基于所述第一加密数据,确定样本对齐结果,包括:所述第二设备基于所述第一加密数据和第二加密数据的交集,确定所述样本对齐结果。8.一种用于样本对齐的装置,其特征在于,包括:收发模块,用于接收来自第二设备的X个哈希值中每个哈希值的前M位元素,X为大于或等于1的整数,M小于N,N为预设哈希算法的输出长度,且N为大于1...

【专利技术属性】
技术研发人员:张二毛孙曼孙超李鑫吴磊谢丹力
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1