数据相关度计算方法、装置、电子设备和存储介质制造方法及图纸

技术编号:28045978 阅读:34 留言:0更新日期:2021-04-09 23:31
本申请公开了一种数据相关度计算方法、装置、电子设备和存储介质,涉及数据安全技术领域,其中方法包括:第一数据方根据第一向量,随机生成第一随机向量,并得到第二向量;第一数据方向第二数据方发送第一随机向量,并接收第二数据方发送的第二随机向量;第一数据方根据相关度计算公式进行计算,得到第一相关度;对于相关度计算公式中的交叉因子,第一数据方使用第二向量和第二随机向量,并根据密文计算协议进行计算;第一数据方接收第二数据方发送的第二相关度;对于相关度计算公式中的交叉因子,第二数据方使用第一随机向量和第四向量,并根据密文计算协议进行计算;第一数据方根据第一相关度和第二相关度,计算第一向量和第三向量之间的相关度。本申请能够保护各数据方的数据隐私,避免数据泄漏或被滥用的风险。

【技术实现步骤摘要】
数据相关度计算方法、装置、电子设备和存储介质
本申请涉及数据处理
,具体为数据安全技术,具体涉及一种数据相关度计算方法、装置、电子设备和存储介质。
技术介绍
在进行数据调研时,不同数据方之间需要交换相关数据,并计算不同数据方之间的数据相关度。然而,由于需要将数据暴露给其他数据方,存在隐私泄露的风险。
技术实现思路
本申请提供了一种数据相关度计算方法、装置、电子设备、存储介质和计算机程序产品。根据第一方面,本申请提供了一种数据相关度计算方法,包括:第一数据方根据第一向量,随机生成第一随机向量,并得到第二向量;所述第一向量为所述第一数据方的数据,所述第一随机向量与所述第二向量的和等于所述第一向量;所述第一数据方向第二数据方发送所述第一随机向量,并接收所述第二数据方发送的第二随机向量;所述第二随机向量为所述第二数据方根据第三向量随机生成的向量,所述第三向量为所述第二数据方的数据;所述第一数据方根据相关度计算公式进行计算,得到第一相关度;其中,对于所述相关度计算公式中的交叉因子,所述第一数据方使用所述第二向量和所述第二随机向量,并根据密文计算协议进行计算;所述交叉因子为使用所述第一数据方的数据和所述第二数据方的数据进行联合计算的因子;所述第一数据方接收所述第二数据方发送的第二相关度;其中,所述第二相关度为所述第二数据方根据所述相关度计算公式进行计算得到的结果,对于所述相关度计算公式中的交叉因子,所述第二数据方使用所述第一随机向量和第四向量,并根据所述密文计算协议进行计算,所述第四向量与所述第二随机向量的和等于所述第三向量;所述第一数据方根据所述第一相关度和所述第二相关度,计算所述第一向量和所述第三向量之间的相关度。根据第二方面,本申请提供了一种数据相关度计算装置,应用于第一数据方,所述装置包括:第一随机生成模块,用于根据第一向量,随机生成第一随机向量,并得到第二向量;所述第一向量为所述第一数据方的数据,所述第一随机向量与所述第二向量的和等于所述第一向量;第一交换模块,用于向第二数据方发送所述第一随机向量,并接收所述第二数据方发送的第二随机向量;所述第二随机向量为所述第二数据方根据第三向量随机生成的向量,所述第三向量为所述第二数据方的数据;第一计算模块,用于根据相关度计算公式进行计算,得到第一相关度;其中,对于所述相关度计算公式中的交叉因子,使用所述第二向量和所述第二随机向量,并根据密文计算协议进行计算;所述交叉因子为使用所述第一数据方的数据和所述第二数据方的数据进行联合计算的因子;接收模块,用于接收所述第二数据方发送的第二相关度;其中,所述第二相关度为所述第二数据方根据所述相关度计算公式进行计算得到的结果,对于所述相关度计算公式中的交叉因子,所述第二数据方使用所述第一随机向量和第四向量,并根据所述密文计算协议进行计算,所述第四向量与所述第二随机向量的和等于所述第三向量;第二计算模块,用于根据所述第一相关度和所述第二相关度,计算所述第一向量和所述第三向量之间的相关度。根据第三方面,本申请提供了另一种数据相关度计算方法,包括:第一数据方根据第一向量,随机生成第一随机向量,并得到第二向量;所述第一向量为所述第一数据方的数据,所述第一随机向量与所述第二向量的和等于所述第一向量;所述第一数据方向第二数据方发送所述第一随机向量,并接收所述第二数据方发送的第二随机向量;所述第二随机向量为所述第二数据方根据第三向量随机生成的向量,所述第三向量为所述第二数据方的数据;所述第一数据方根据相关度计算公式进行计算,得到第一相关度;其中,对于所述相关度计算公式中的交叉因子,所述第一数据方使用所述第二向量和所述第二随机向量,并根据密文计算协议进行计算;所述交叉因子为使用所述第一数据方的数据和所述第二数据方的数据进行联合计算的因子;所述第一数据方向所述第二数据方发送所述第一相关度。根据第四方面,本申请提供了另一种数据相关度计算装置,应用于第一数据方,包括:第一随机生成模块,用于根据第一向量,随机生成第一随机向量,并得到第二向量;所述第一向量为所述第一数据方的数据,所述第一随机向量与所述第二向量的和等于所述第一向量;第一交换模块,用于向第二数据方发送所述第一随机向量,并接收所述第二数据方发送的第二随机向量;所述第二随机向量为所述第二数据方根据第三向量随机生成的向量,所述第三向量为所述第二数据方的数据;计算模块,用于根据相关度计算公式进行计算,得到第一相关度;其中,对于所述相关度计算公式中的交叉因子,所述第一数据方使用所述第二向量和所述第二随机向量,并根据密文计算协议进行计算;所述交叉因子为使用所述第一数据方的数据和所述第二数据方的数据进行联合计算的因子;发送模块,用于向所述第二数据方发送所述第一相关度。根据第五方面,本申请提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面和第三方面中的任一项方法。根据第六方面,本申请提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行第一方面和第三方面中的任一项方法。根据第七方面,本申请提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现第一方面和第三方面中的任一项方法。根据本申请的技术,通过各数据方对各自的数据进行分片并相互交换,这样,各数据方可以使用交换后的数据,并根据密文计算协议来进行相关度的计算。本申请将密码学技术应用于数据相关度分析中,能够实现在不暴露数据给对方的情况下,完成相关度计算,从而,能够保护各数据方的数据隐私,避免数据泄漏或被滥用的风险。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请第一实施例的数据相关度计算方法的流程示意图;图2是根据本申请第一实施例的密文乘法协议的示意图;图3是根据本申请第一实施例的数据相关度计算过程示意图;图4是根据本申请第二实施例的数据相关度计算装置的结构示意图;图5是根据本申请第三实施例的数据相关度计算方法的流程示意图;图6是根据本申请第四实施例的数据相关度计算装置的结构示意图;图7是用来实现本申请实施例的数据相关度计算方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了本文档来自技高网...

【技术保护点】
1.一种数据相关度计算方法,包括:/n第一数据方根据第一向量,随机生成第一随机向量,并得到第二向量;所述第一向量为所述第一数据方的数据,所述第一随机向量与所述第二向量的和等于所述第一向量;/n所述第一数据方向第二数据方发送所述第一随机向量,并接收所述第二数据方发送的第二随机向量;所述第二随机向量为所述第二数据方根据第三向量随机生成的向量,所述第三向量为所述第二数据方的数据;/n所述第一数据方根据相关度计算公式进行计算,得到第一相关度;其中,对于所述相关度计算公式中的交叉因子,所述第一数据方使用所述第二向量和所述第二随机向量,并根据密文计算协议进行计算;所述交叉因子为使用所述第一数据方的数据和所述第二数据方的数据进行联合计算的因子;/n所述第一数据方接收所述第二数据方发送的第二相关度;其中,所述第二相关度为所述第二数据方根据所述相关度计算公式进行计算得到的结果,对于所述相关度计算公式中的交叉因子,所述第二数据方使用所述第一随机向量和第四向量,并根据所述密文计算协议进行计算,所述第四向量与所述第二随机向量的和等于所述第三向量;/n所述第一数据方根据所述第一相关度和所述第二相关度,计算所述第一向量和所述第三向量之间的相关度。/n...

【技术特征摘要】
1.一种数据相关度计算方法,包括:
第一数据方根据第一向量,随机生成第一随机向量,并得到第二向量;所述第一向量为所述第一数据方的数据,所述第一随机向量与所述第二向量的和等于所述第一向量;
所述第一数据方向第二数据方发送所述第一随机向量,并接收所述第二数据方发送的第二随机向量;所述第二随机向量为所述第二数据方根据第三向量随机生成的向量,所述第三向量为所述第二数据方的数据;
所述第一数据方根据相关度计算公式进行计算,得到第一相关度;其中,对于所述相关度计算公式中的交叉因子,所述第一数据方使用所述第二向量和所述第二随机向量,并根据密文计算协议进行计算;所述交叉因子为使用所述第一数据方的数据和所述第二数据方的数据进行联合计算的因子;
所述第一数据方接收所述第二数据方发送的第二相关度;其中,所述第二相关度为所述第二数据方根据所述相关度计算公式进行计算得到的结果,对于所述相关度计算公式中的交叉因子,所述第二数据方使用所述第一随机向量和第四向量,并根据所述密文计算协议进行计算,所述第四向量与所述第二随机向量的和等于所述第三向量;
所述第一数据方根据所述第一相关度和所述第二相关度,计算所述第一向量和所述第三向量之间的相关度。


2.根据权利要求1所述的方法,其中,所述第一向量为X=(x1,…,xn),所述第三向量为Y=(y1,…,yn),所述相关度计算公式为:



其中,r表示相关度,为所述相关度计算公式中的第一因子,为所述相关度计算公式中的第二因子,为所述相关度计算公式中的交叉因子。


3.根据权利要求2所述的方法,其中,对于所述相关度计算公式中的第一因子,所述第一数据方使用所述第一向量进行计算。


4.根据权利要求2所述的方法,其中,所述第三向量中包括至少两个数据;
对于所述相关度计算公式中的第二因子,所述第一数据方将所述第二数据方根据所述第三向量计算得到的结果作为所述第二因子。


5.根据权利要求2所述的方法,所述方法还包括:
所述第一数据方随机生成第一随机数,并得到第一参数,所述第一随机数与所述第一参数的和等于所述第一数据方使用所述第一向量计算得到的第一因子;
所述第一数据方向所述第二数据方发送所述第一随机数,并接收所述第二数据方发送的第二随机数;
其中,所述第一相关度为所述第一数据方根据相关度计算公式和所述密文计算协议,使用所述第一参数、所述第二随机数、所述第二向量和所述第二随机向量,计算得到的结果;
所述第二相关度为所述第二数据方根据相关度计算公式和所述密文计算协议,使用第二参数、所述第一随机数、所述第四向量和所述第一随机向量,计算得到的结果;所述第二参数与所述第二随机数的和等于所述第二数据方使用所述第三向量计算得到的第二因子。


6.根据权利要求1所述的方法,其中,所述第一数据方根据所述第一相关度和所述第二相关度,计算所述第一向量和所述第三向量之间的相关度,包括:
所述第一数据方计算所述第一相关度与所述第二相关度的和,作为所述第一向量和所述第三向量之间的相关度。


7.根据权利要求1所述的方法,其中,所述密文计算协议为算术分享密码学的密文计算协议。


8.一种数据相关度计算装置,应用于第一数据方,所述装置包括:
第一随机生成模块,用于根据第一向量,随机生成第一随机向量,并得到第二向量;所述第一向量为所述第一数据方的数据,所述第一随机向量与所述第二向量的和等于所述第一向量;
第一交换模块,用于向第二数据方发送所述第一随机向量,并接收所述第二数据方发送的第二随机向量;所述第二随机向量为所述第二数据方根据第三向量随机生成的向量,所述第三向量为所述第二数据方的数据;
第一计算模块,用于根据相关度计算公式进行计算,得到第一相关度;其中,对于所述相关度计算公式中的交叉因子,使用所述第二向量和所述第二随机向量,并根据密文计算协议进行计算;所述交叉因子为使用所述第一数据方的数据和所述第二数据方的数据进行联合计算的因子;
接收模块,用于接收所述第二数据方发送的第二相关度;其中,所述第二相关度为所述第二数据方根据所述相关度计算公式进行计算得到的结果,对于所述相关度计算公式中的交叉因子,所述第二数据方使用所述第一随机向量和第四向量,并根据所述密文计算协议进行计算,所述第四向量与所述第二随机向量的和等于所述第三向量;
第二计算模块,用于根据所述第一相关度和所述第二相关度,计算所述第一向量和所述第三向量之间的相关度。


9.根据权利要求8所述的装置,其中,所述第一向量为X=(x1,…,xn),所述第三向量为Y=(y1,…,yn),所述相关度计算公式为:



其中,r表示相关度,为所述相关度计算公式中的第一因子,为所述相关度计算公式中的第二因子,为所述相关度计算公式中的交叉因子。


10.根据权利要求9所述的装置,其中,所述第一计算模块还用于:
对于所述相关度计算公式中的第一因子,使用所述第一向量进行计算。


11.根据权利要求9所述的装置,其中,所述第三向量中包括至少两个数据;
所述第一计算模块还用于:
对于所述相关度计算公式中的第二因子,将所述第二数据方根据所述第三向量计算得到的结果作为所述第二因子。


12.根据权利要求9所述的装置,还包括:
第二随机生成模块,用于随机生成第一随机数,并得到第一参数,所述第一随机数与所述第一参数的和等于所述第一数据方使用所述第一向量计算得到的第一因子;
第二交换模块,用于向所述第二数据方发送所述第一随机数,并接收所述第二数据方发送的第二随机数;
其中,所述第一相关度为所述第一数据方根据相关度计算公式和所述密文计算协议,使用所述第一参数、所述第二随机数、所述第二向量和所述第二随机向量,计算得到的结果;
所述第二相关度为所述第二数据方根据相关度计...

【专利技术属性】
技术研发人员:蒋精华洪爵何恺杨青友
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1