【技术实现步骤摘要】
数据相关度计算方法、装置、电子设备和存储介质
本申请涉及数据处理
,具体为数据安全技术,具体涉及一种数据相关度计算方法、装置、电子设备和存储介质。
技术介绍
在进行数据调研时,不同数据方之间需要交换相关数据,并计算不同数据方之间的数据相关度。然而,由于需要将数据暴露给其他数据方,存在隐私泄露的风险。
技术实现思路
本申请提供了一种数据相关度计算方法、装置、电子设备、存储介质和计算机程序产品。根据第一方面,本申请提供了一种数据相关度计算方法,包括:第一数据方根据第一向量,随机生成第一随机向量,并得到第二向量;所述第一向量为所述第一数据方的数据,所述第一随机向量与所述第二向量的和等于所述第一向量;所述第一数据方向第二数据方发送所述第一随机向量,并接收所述第二数据方发送的第二随机向量;所述第二随机向量为所述第二数据方根据第三向量随机生成的向量,所述第三向量为所述第二数据方的数据;所述第一数据方根据相关度计算公式进行计算,得到第一相关度;其中,对于所述相关度计算公式中的交叉因子,所述第一数据方使用所述第二向量和所述第二随机向量,并根据密文计算协议进行计算;所述交叉因子为使用所述第一数据方的数据和所述第二数据方的数据进行联合计算的因子;所述第一数据方接收所述第二数据方发送的第二相关度;其中,所述第二相关度为所述第二数据方根据所述相关度计算公式进行计算得到的结果,对于所述相关度计算公式中的交叉因子,所述第二数据方使用所述第一随机向量和第四向量,并根据所述密文计算协 ...
【技术保护点】
1.一种数据相关度计算方法,包括:/n第一数据方根据第一向量,随机生成第一随机向量,并得到第二向量;所述第一向量为所述第一数据方的数据,所述第一随机向量与所述第二向量的和等于所述第一向量;/n所述第一数据方向第二数据方发送所述第一随机向量,并接收所述第二数据方发送的第二随机向量;所述第二随机向量为所述第二数据方根据第三向量随机生成的向量,所述第三向量为所述第二数据方的数据;/n所述第一数据方根据相关度计算公式进行计算,得到第一相关度;其中,对于所述相关度计算公式中的交叉因子,所述第一数据方使用所述第二向量和所述第二随机向量,并根据密文计算协议进行计算;所述交叉因子为使用所述第一数据方的数据和所述第二数据方的数据进行联合计算的因子;/n所述第一数据方接收所述第二数据方发送的第二相关度;其中,所述第二相关度为所述第二数据方根据所述相关度计算公式进行计算得到的结果,对于所述相关度计算公式中的交叉因子,所述第二数据方使用所述第一随机向量和第四向量,并根据所述密文计算协议进行计算,所述第四向量与所述第二随机向量的和等于所述第三向量;/n所述第一数据方根据所述第一相关度和所述第二相关度,计算所述第 ...
【技术特征摘要】
1.一种数据相关度计算方法,包括:
第一数据方根据第一向量,随机生成第一随机向量,并得到第二向量;所述第一向量为所述第一数据方的数据,所述第一随机向量与所述第二向量的和等于所述第一向量;
所述第一数据方向第二数据方发送所述第一随机向量,并接收所述第二数据方发送的第二随机向量;所述第二随机向量为所述第二数据方根据第三向量随机生成的向量,所述第三向量为所述第二数据方的数据;
所述第一数据方根据相关度计算公式进行计算,得到第一相关度;其中,对于所述相关度计算公式中的交叉因子,所述第一数据方使用所述第二向量和所述第二随机向量,并根据密文计算协议进行计算;所述交叉因子为使用所述第一数据方的数据和所述第二数据方的数据进行联合计算的因子;
所述第一数据方接收所述第二数据方发送的第二相关度;其中,所述第二相关度为所述第二数据方根据所述相关度计算公式进行计算得到的结果,对于所述相关度计算公式中的交叉因子,所述第二数据方使用所述第一随机向量和第四向量,并根据所述密文计算协议进行计算,所述第四向量与所述第二随机向量的和等于所述第三向量;
所述第一数据方根据所述第一相关度和所述第二相关度,计算所述第一向量和所述第三向量之间的相关度。
2.根据权利要求1所述的方法,其中,所述第一向量为X=(x1,…,xn),所述第三向量为Y=(y1,…,yn),所述相关度计算公式为:
其中,r表示相关度,为所述相关度计算公式中的第一因子,为所述相关度计算公式中的第二因子,为所述相关度计算公式中的交叉因子。
3.根据权利要求2所述的方法,其中,对于所述相关度计算公式中的第一因子,所述第一数据方使用所述第一向量进行计算。
4.根据权利要求2所述的方法,其中,所述第三向量中包括至少两个数据;
对于所述相关度计算公式中的第二因子,所述第一数据方将所述第二数据方根据所述第三向量计算得到的结果作为所述第二因子。
5.根据权利要求2所述的方法,所述方法还包括:
所述第一数据方随机生成第一随机数,并得到第一参数,所述第一随机数与所述第一参数的和等于所述第一数据方使用所述第一向量计算得到的第一因子;
所述第一数据方向所述第二数据方发送所述第一随机数,并接收所述第二数据方发送的第二随机数;
其中,所述第一相关度为所述第一数据方根据相关度计算公式和所述密文计算协议,使用所述第一参数、所述第二随机数、所述第二向量和所述第二随机向量,计算得到的结果;
所述第二相关度为所述第二数据方根据相关度计算公式和所述密文计算协议,使用第二参数、所述第一随机数、所述第四向量和所述第一随机向量,计算得到的结果;所述第二参数与所述第二随机数的和等于所述第二数据方使用所述第三向量计算得到的第二因子。
6.根据权利要求1所述的方法,其中,所述第一数据方根据所述第一相关度和所述第二相关度,计算所述第一向量和所述第三向量之间的相关度,包括:
所述第一数据方计算所述第一相关度与所述第二相关度的和,作为所述第一向量和所述第三向量之间的相关度。
7.根据权利要求1所述的方法,其中,所述密文计算协议为算术分享密码学的密文计算协议。
8.一种数据相关度计算装置,应用于第一数据方,所述装置包括:
第一随机生成模块,用于根据第一向量,随机生成第一随机向量,并得到第二向量;所述第一向量为所述第一数据方的数据,所述第一随机向量与所述第二向量的和等于所述第一向量;
第一交换模块,用于向第二数据方发送所述第一随机向量,并接收所述第二数据方发送的第二随机向量;所述第二随机向量为所述第二数据方根据第三向量随机生成的向量,所述第三向量为所述第二数据方的数据;
第一计算模块,用于根据相关度计算公式进行计算,得到第一相关度;其中,对于所述相关度计算公式中的交叉因子,使用所述第二向量和所述第二随机向量,并根据密文计算协议进行计算;所述交叉因子为使用所述第一数据方的数据和所述第二数据方的数据进行联合计算的因子;
接收模块,用于接收所述第二数据方发送的第二相关度;其中,所述第二相关度为所述第二数据方根据所述相关度计算公式进行计算得到的结果,对于所述相关度计算公式中的交叉因子,所述第二数据方使用所述第一随机向量和第四向量,并根据所述密文计算协议进行计算,所述第四向量与所述第二随机向量的和等于所述第三向量;
第二计算模块,用于根据所述第一相关度和所述第二相关度,计算所述第一向量和所述第三向量之间的相关度。
9.根据权利要求8所述的装置,其中,所述第一向量为X=(x1,…,xn),所述第三向量为Y=(y1,…,yn),所述相关度计算公式为:
其中,r表示相关度,为所述相关度计算公式中的第一因子,为所述相关度计算公式中的第二因子,为所述相关度计算公式中的交叉因子。
10.根据权利要求9所述的装置,其中,所述第一计算模块还用于:
对于所述相关度计算公式中的第一因子,使用所述第一向量进行计算。
11.根据权利要求9所述的装置,其中,所述第三向量中包括至少两个数据;
所述第一计算模块还用于:
对于所述相关度计算公式中的第二因子,将所述第二数据方根据所述第三向量计算得到的结果作为所述第二因子。
12.根据权利要求9所述的装置,还包括:
第二随机生成模块,用于随机生成第一随机数,并得到第一参数,所述第一随机数与所述第一参数的和等于所述第一数据方使用所述第一向量计算得到的第一因子;
第二交换模块,用于向所述第二数据方发送所述第一随机数,并接收所述第二数据方发送的第二随机数;
其中,所述第一相关度为所述第一数据方根据相关度计算公式和所述密文计算协议,使用所述第一参数、所述第二随机数、所述第二向量和所述第二随机向量,计算得到的结果;
所述第二相关度为所述第二数据方根据相关度计...
【专利技术属性】
技术研发人员:蒋精华,洪爵,何恺,杨青友,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。