基于多方集合求交集的垂直分区数据PPARM方法技术

技术编号:28872090 阅读:23 留言:0更新日期:2021-06-15 23:05
本发明专利技术公开了一种基于多方集合求交集的垂直分区数据PPARM方法,主要解决现有技术通信量代价大、隐私保护不足的技术问题。其方案包括:1)发送方对数据进行预处理;2)协议一执行阶段:首先,发送方加密随机矩阵,接收方利用同态加密算法计算加密中间值;然后,发送方利用散列函数的抗碰撞性进行结果验证;最后,接收方解密,得到支持度;3)协议二执行阶段:此阶段与协议一的区别在于将验证结果先进行盲化处理,以掩盖真实支持度,最后进行安全比较。本发明专利技术能够实现随着参与站点的增多,在达到隐私级别一时,具有较小的通信轮数,并在达到隐私级别二时,无需引入完全可信的第三方服务器;从而有效降低通信代价、提高信息私密性。

【技术实现步骤摘要】
基于多方集合求交集的垂直分区数据PPARM方法
本专利技术属于电子
,进一步涉及集合求交集技术,具体为一种基于多方集合求交集的垂直分区数据隐私保护关联规则挖掘PPARM方法。可用于在垂直分区上通过对各个站点的信息进行加密,实现对站点信息的隐私保护。
技术介绍
随着数据采集和存储技术的迅速发展,以及数据生成与传播便捷性的提升,致使数据爆炸性增长,最终形成了当前的大数据时代。在商业和工业、科学和工程、以及政府和个人等各个社会领域,通过对这些数据集进行可行的深入分析,从而做出决策,已经变得越来越重要。然而,数据的数量、多样性以及收集和处理的速度对于人类来说都太大了,无法进行独立分析。因此,数据挖掘DM作为一种将传统的数据分析方法与用于处理大量数据的复杂算法相结合的技术,也变得越来越流行,并被广泛的应用于一些应用程序中,例如超市预测、天气预报、网络流量管理、电子医疗系统、风险管理、入侵检测等。关联规则挖掘ARM是最常用的数据挖掘算法之一,主要目的是提取频繁项目组合的规则,并从中推断出有价值的结果。ARM经常被用于简化销售、优化电子商务广告、减轻软件开发障碍等诸多应用程序。近年来,不同领域的组织或者机构被要求进行合作来创造出新的价值。在数据合并和挖掘阶段,很容易暴露各个参与方的机密信息,如果这些信息被不法分子利用,可能会造成严重的商业信息泄露或者社会不良影响。如何在保护参与方数据的隐私性前提下,安全的进行关联规则挖掘这一问题,逐渐成为人们关注的重点。因此,隐私保护关联规则挖掘PPARM的概念被人们提出来,并且吸引越来越多的人参与研究。目前,基于分布式数据环境下的隐私保护关联规则挖掘PPARM主要分为两类:1)基于加密的方法,这种方法多应用于外包云服务器的场景中。2)基于安全多方计算的方法,这种方法旨在通过联合数据库的协作,挖掘出全局关联规则而不向其他参与方透漏自己的数据。JaideepVaidya和ChrisClifton在文献“Securesetintersectioncardinalitywithapplicationtoassociationrulemining”(DepartmentofComputerSciences,PurdueUniversity,2004)中首次给出了在关联规则挖掘方案中使用集合交集,但在该方案中,通信轮数随着参与站点的个数线性增长,具有较大的通信代价,且在交互的最终结果中会暴露备选项集的支持度。BorisRozenberg和EhudGudes在文献“Associationrulesmininginverticallypartitioneddatabases”(DepartmentofComputerScience,Ben-GurionUniversity,2006)中同样使用集合交集来进行关联规则挖掘,该方案的通信轮数依旧随着参与站点的个数呈线性增长,具有较大的通信代价,虽然同时支持最终交互结果只暴露备选项集支持度和支持度是否超过阈值这一信息,但在隐私级别二中需要引入一个完全可信的第三方服务器。K.Nomura在文献“SecureAssociationRuleMiningonVerticallyPartitionedDataUsingPrivateSetIntersection”(IEEEAccess,KobeUniversity,2020)中提出了一个两方的使用集合交集的关联规则挖掘方案,但在实际应用场景中,存在多个参与方,其互相协作去挖掘全局关联规则,导致该方法具有很大局限性。Michael等人在文献“EfficientPrivateMatchingandSetIntersection”(EUROCRYPT,NewYorkUniversity,2004)中提出了一个多方集合求交集的方案,但该方案最终的交互结果会暴露交集中各个项的信息。综上,现有技术存在交互阶段通信量较大、对隐私保护不够完善以及局限性的技术问题。
技术实现思路
本专利技术的目的是针对上述现有技术的缺陷与不足,提出一种在多个站点参与下使用集合求交集来进行关联规则挖掘的更安全和高效的方案,用于解决现有技术中存在的通信代价较大和泄露隐私信息的技术问题。为实现上述目的,本专利技术的思路是使用集合求交集的技术,利用哈希函数的抗碰撞性,同时使用Paillier同态密码对参与方的信息进行加解密,利用同态Paillier密码的同态特性计算中间数据和支持度信息,通过向支持度添加噪声进行盲化,并与指定阈值信息进行安全比较,最终每一个参与方在较少通信轮数条件下,只知道支持度信息或者支持度是否超过指定阈值这一信息,从而有效降低通信代价、提高信息私密性。本专利技术采取的技术方案包括如下步骤:(1)参与方Ai生成加密公私钥对(pki,ski)和哈希函数Hi(·),其中i=1,2,…,n表示参与方编号,n表示参与方的总个数;在n个参与方中,令前n-1个为发送方Al、第n个为接收方An;发送方Al中包含主发送方Aq和辅发送方An-1,其中q=1,2,…,n-2;(2)数据预处理:(2.1)对发送方Al输入s维向量数据发送方Al利用哈希分配桶思想对该向量数据进行处理,得到处理后的数据其中l=1,2,…,n-1表示发送方编号;(2.2)接收方An利用哈希函数Hn(·)加密自身数据得到加密数据(3)发送方Al生成随机矩阵并将该矩阵加密:(3.1)构建剩余类环其中N表示Paillier同态加密算法的公开参数,在剩余类环中均匀且随机的选取一个s×(n-1)随机矩阵Bl,且该矩阵满足每一行的异或和为0;(3.2)发送方Al将矩阵Bl的每一列元素均使用相应公钥进行加密,得到第一加密矩阵并将和发送给接收方An;(4)接收方An根据Paillier同态加密算法的性质,利用计算中间加密值,得到元组Ψ,采用置换函数τ对元组进行置换处理,得到置换结果Ψ*,并将该结果发送给发送方Al;(5)发送方执行解密操作:(5.1)发送方Al从Ψ*中的每一列提取第(l-1)F+1行和第lF之间的元素,记为Njl,并将Njl在垂直方向上进行拼接得到矩阵Nl;其中,F表示数据预处理阶段哈希桶的个数,j=1,2,…,s;(5.2)发送方Al收到来自其他发送方的加密矩阵之后,首先构造一个sF×(n-1)维的矩阵Wl:其中,表示用公钥pkl执行加密操作,βs,ln-1表示矩阵Bl中的元素;(5.3)将Nl与Wl在水平方向上进行拼接得到拼接矩阵Nl||Wl,其中||表示水平方向上的拼接操作;利用私钥skl解密拼接矩阵Nl||Wl,得到第一解密矩阵V。(5.4)发送方Al对V的每一行进行异或运算,得到结果Dil。(6)构建隐私级别一:(6.1)发送方Al利用哈希函数的抗碰撞性进行结果验证:其中:表示异或运算;如果验证成功,则发送方Al用接收方An的公钥pkn加密值1后得到加密数据,并发送给参与方An-1;反之,发送方Al用接收方An本文档来自技高网
...

【技术保护点】
1.一种基于多方集合求交集的垂直分区数据隐私保护关联规则挖掘PPARM方法,其特征在于,包括如下步骤:/n(1)参与方A

【技术特征摘要】
1.一种基于多方集合求交集的垂直分区数据隐私保护关联规则挖掘PPARM方法,其特征在于,包括如下步骤:
(1)参与方Ai生成加密公私钥对(pki,ski)和哈希函数Hi(·),其中i=1,2,…,n表示参与方编号,n表示参与方的总个数;在n个参与方中,令前n-1个为发送方Al、第n个为接收方An;发送方Al中包含主发送方Aq和辅发送方An-1,其中q=1,2,…,n-2;
(2)数据预处理:
(2.1)对发送方Al输入s维向量数据发送方Al利用哈希分配桶思想对该向量数据进行处理,得到处理后的数据其中l=1,2,…,n-1表示发送方编号;
(2.2)接收方An利用哈希函数Hn(·)加密自身数据得到加密数据
(3)发送方Al生成随机矩阵并将该矩阵加密:
(3.1)构建剩余类环其中N表示Paillier同态加密算法的公开参数,在剩余类环中均匀且随机的选取一个s×(n-1)随机矩阵Bl,且该矩阵满足每一行的异或和为0;
(3.2)发送方Al将矩阵Bl的每一列元素均使用相应公钥进行加密,得到第一加密矩阵并将和发送给接收方An;
(4)接收方An根据Paillier同态加密算法的性质,利用计算中间加密值,得到元组Ψ,采用置换函数τ对元组进行置换处理,得到置换结果Ψ*,并将该结果发送给发送方Al;
(5)发送方执行解密操作:
(5.1)发送方Al从Ψ*中的每一列提取第(l-1)F+1行和第lF之间的元素,记为Njl,并将Njl在垂直方向上进行拼接得到矩阵Nl;其中,F表示数据预处理阶段哈希桶的个数,j=1,2,…,s;
(5.2)发送方Al收到来自其他发送方的加密矩阵之后,首先构造一个sF×(n-1)维的矩阵Wl:



其中,表示用公钥pkl执行加密操作,βs,ln-1表示矩阵Bl中的元素;
(5.3)将Nl与Wl在水平方向上进行拼接得到拼接矩阵Nl||Wl,其中||表示水平方向上的拼接操作;利用私钥skl解密拼接矩阵Nl||Wl,得到第一解密矩阵V。
(5.4)发送方Al对V的每一行进行异或运算,得到结果Dil。
(6)构建隐私级别一:
(6.1)发送方Al利用哈希函数的抗碰撞性进行结果验证:



其中:表示异或运算;
如果验证成功,则发送方Al用接收方An的公钥pkn加密值1后得到加密数据,并发送给参与方An-1;反之,发送方Al用接收方An的公钥pkn加密值0后得到加密数据,并发送给参与方An-1;
参与方An-1利用随机置换函数π将收到的加密数据顺序扰乱,得到置换后的第一加密数据δ*,并将δ*发送给接收方An;
(6.2)接收方An利用Paillier同态加密算法的性质进行解密,得到多方集合交集的大小,即第一解密结果d:



其中,δ*z表示δ*的分量,且z=1,2,…,(n-1)F;
(7)构建隐私级别二:
(7.1)发送方中的主发送方Aq在剩余类环上产生一个随机数,记为第一随机数αq;接收方An在剩余类环上产生一个随机数,记为第二随机数α,并将其发送给辅发送方An-1;
(7.2)发送方Al利用散列函数的抗碰撞性进行结果验证,验证公式如下:



主发送方验证:如果主发送方Aq验证成功,则Aq用接收方An的公钥pkn加密值1+αq反之,Aq用接收方An的公钥pkn加密值0+αq;最终得到第一加密值并将其发送给辅发送方An-1;
辅发送方验证:如果辅发送方An-1验证成功,则An-1用接收方An的公钥pkn加密值1+α。否则,An-1用接收方An的公钥pkn加密值0+α;最终得到第二加密值
辅发送方An-1利用随机置换函数π将收到的第一加...

【专利技术属性】
技术研发人员:王保仓樊程程段普张本宇
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1