The invention discloses a large data correlation analysis method and system for protecting consumer privacy in electronic transactions. The method includes data storage, data processing, access query and other steps. The system includes data storage module, which is used for system initialization, and the data are randomly distributed after the secret processing is converted into ciphertext stored to each other. A data server; data processing module, which is used for data processing of related statistical analysis and calculation of ciphertext; access query module is used to decrypt and decrypt the ciphertext on the client after the access request. The invention will use the large data correlation analysis method and system to protect the consumer privacy in electronic transactions, and realize the correlation analysis method that can adjust the consumer information in the case of consumer privacy without damaging the consumer's privacy. The invention is to help users (for example, administrators, businessmen, researchers) to analyze data without divulging data. One
【技术实现步骤摘要】
保护电子交易中消费者隐私的大数据相关性分析方法及系统
本专利技术属于信息安全
,特别涉及一种保护电子交易中消费者隐私的大数据相关性分析方法与系统,通过结合密码学技术与统计数学,严格控制可以进入电子交易过程中消费者信息管理系统的人群,达到不泄露消费者隐私,并且可以对消费者数据进行隐私保护的相关性统计分析。
技术介绍
随着互联网技术越来越全面地渗透至人类社会政治、经济、文化等各个领域,数字化商业已经成为每个人、每个组织所必须要面对的,电子商务、网络购物已经不再是一种选择,而成为一种必然。但是这样的背景下,网购过程中客户个人信息遭泄露和不法侵害的案件也随之增加。因此除了用户自己对个人信息的保管之外,电子交易平台对消费者的信息管理的安全问题也是非常值得关注的。大部分的电子交易平台会对消费者的个人信息建立起综合数据库,并进行一定的分析,以便进行市场调查和调整,以及对消费者进行智能提醒和推荐等服务,比如一个35岁的白领女士想买一件毛衣,那么35岁、白领、女士和她过往购买的东西之间会有怎样的约束和联系,我们需要帮助商家或者研究人员分析大数据相关性,以便对这位女士进行推荐或者提供市场分类等更好的服务,所以我们需要去考虑多种因素下的相关性分析。目前,在电子交易环境当中,对于信息进行二次开发规范就当前来说还是一件比较棘手的事情,如果商家或者管理员、调研员的行为会为消费者带来相服务,如我们上述讲的正常的数据分析,那么这种二次开发就是受到消费者所青睐的,但事实上存在恶意的内部管理人员为了个人利益将消费者信息直接用来牟取利益,进而致使消费者个人信息得到泄漏增添了很多生活上的干 ...
【技术保护点】
1.一种保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,包括以下
【技术特征摘要】
1.一种保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,包括以下步骤:步骤1:数据存储;步骤2:数据统计处理;步骤3:访问查询。2.根据权利要求1所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤1的具体实现包括以下子步骤:步骤1.1:生成预处理参数;选定所需参数,随机选择两个大素数p和q,在各个数据服务器内使用Pailler加密系统中的生成参数算法的要求对两个大素数p和q进行运算,生成本方案所需要的用户的公钥和私钥(pk,sk),同时选择一种签名认证方案生成验证时需要的用户的签名密钥对(pk*,sk*),并将用户的私钥和签名钥通过安全信道发送给用户;步骤1.2:数据收集;在电子交易中收集消费者留下的个人信息;步骤1.3:数据分块;将收集到的消费者信息随机的分成若干等长的数据版块,分别通过安全信道传输给电子交易系统中对应的若干数据服务器,通过步骤1.1选定的参数对其进行使用Pailler加密系统中的加密算法将其转化成密文并且将密文存储在每个数据服务器中。3.根据权利要求1所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤2的具体实现包括以下子步骤:步骤2.1:平均值处理;在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的某一量度的平均值作数据处理,通过平均循环算法,在多个数据服务器中将明文加密并且密文相互相乘,将每一轮循环的值都存放在同一数据服务器中,此数据服务器最终会与用户客户端之间进行数据传输;步骤2.2:半偏相关处理;在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的一个量度在某些量度干扰下与另一量度的相关性系数作数据处理,将明文加密得到原始密文,首先通过平均循环算法对原始密文进行第一次数据处理,将每一轮循环的值都存放在同一数据服务器中,再通过乘方循环算法对原始密文进行第二次数据处理,将每一轮循环的值都存放在同上一数据服务器中,最后通过相关循环算法对原始密文进行第三次数据处理,将每一轮循环的值都存放在同上一数据服务器中,此数据服务器最终会与用户客户端之间进行数据传输;步骤2.3:全偏相关处理;在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的两个量度在同样的多个干扰下的相关性系数作数据处理,将明文加密得到原始密文,通过平均循环算法、乘方循环算法、相关循环算法对原始密文按照一定顺序进行三种数据处理,实现在多个数据服务器中将涉及到的不同属性明文按规定的顺序加密并且相互相乘,将每一轮循环的值都存放在同一数据服务器中,此数据服务器最终会与用户客户端之间进行数据传输;步骤2.4:复相关处理;在多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的一个量度与多个属性在没有任何干扰的情况下的相关性系数作数据处理,将明文加密得到原始密文,通过平均循环算法、乘方循环算法、相关循环算法对原始密文按照一定顺序进行三种数据处理,实现在多个数据服务器中将涉及到的多种不同属性明文按规定的顺序加密并且相互相乘,将每一轮循环的值都存放在同一数据服务器中,此数据服务器最终会与用户客户端之间进行数据传输。4.根据权利要求3所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤2.1中所述循环算法的具体实现过程是:假设要得到n个消费者属性某一量度X=(x1,x2,x3,…,xn)的平均值,其中x1,x2,x3,…,xn表示第一个到第n个消费者的相关量度信息,将每一个数据随机分为三个部分,即xi=αi+βi+γi,i取1到n之间任何一个整数,表示第i个消费者,且对应着有三个数据服务器S1、S2、S3;此时设一个数Cx=1;(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给数据服务器S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在S1,同时将乘积发送给数据服务器S2;(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给数据服务器S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给数据服务器S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在数据服务器S3,计算乘积的值,并将它赋值给Cx,清除掉之前Cx的存值,将新的Cx值存储在数据服务器S3,同时发送给数据服务器S1;(4)将收集到的第二个消费者信息x2中的α2通过安全信道发送给数据服务器S1,数据服务器S1选取一个随机数对α2进行加密,得到并将存放在数据服务器S1,同时将乘积发送给数据服务器S2;(5)将收集到的第二个消费者信息x2中的β2通过安全信道发送给数据服务器S2,数据服务器S2选取一个随机数对β2进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;(6)将收集到的第二个消费者信息x2中的γ2通过安全信道发送给数据服务器S3,数据服务器S3选取一个随机数对γ2进行加密,得到并将存放在数据服务器S3,计算乘积的值,并将它赋值给Cx,清除掉之前Cx的存值,将新的Cx值存储在数据服务器S3,同时发送给数据服务器S1;重复执行上述(1)-(6),依次将x1,x2,x3,…,xn的每个数据分成的部分(xi=αi+βi+γi)加密并且相乘,将最后得到的Cx值存放在数据服务器S3。5.根据权利要求3所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤2.2中所述循环算法的具体实现过程是:假设n个消费者属性的三个量度X=(x1,x2,x3,…,xn)和Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an);(xi,yi,Ai)属于同一个消费者,即第i个消费者,并且量度A只对量度X有影响;将每一个数据随机分为三个部分,即xi=αi+βi+γi,yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″,i取1到n之间任何一个整数;第一种数据处理:先在多个数据服务器的相互配合下,计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)的每个数据分成部分(xi=αi+βi+γi)的加密之后的乘积赋值给Cx,并存放在数据服务器S3,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an)的每个数据分成部分(yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″)的加密运算之后的乘积赋值给Cy和Ca,并存放在数据服务器S3;第二种数据处理:此时设一个数(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给数据服务器S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在S1,同时将发送给数据服务器S2;(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给数据服务器S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器数据服务器S3;(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给数据服务器S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在数据服务器S3,计算乘积的值,将其值存储在数据服务器S3,同时发送给数据服务器S1和数据服务器S2;(4)数据服务器S1选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的α1再进行一次加密,得到并将存放在数据服务器S1,同时将乘积发送给数据服务器S2;(5)数据服务器S2选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的β1再进行一次加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;(6)数据服务器S3选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的γ1再进行一次加密,得到并将存放在数据服务器S3,计算乘积并将它赋值给清除掉之前的存值,将新的值存储在数据服务器S3,同时发送给S1;重复上述(1)-(6)过程,依次将x1,x2,x3,…,xn的每个数据分成的部分(xi=αi+βi+γi)加密并且相乘,将最后得到的值存放在数据服务器S3;依照上述方法,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an)的每个数据分成部分(yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″)在上述加密循环运算之后的乘积赋值给和并存放在数据服务器S3;第三种数据处理:此时设一个数Cxy=1;(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给数据服务器S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在数据服务器S1,同时将发送给数据服务器S2;(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给数据服务器S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给数据服务器S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在数据服务器S3,计算乘积的值,将其值存储在数据服务器S3,同时发送给数据服务器S1和数据服务器S2;(4)数据服务器S1选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的α′1进行加密,得到并将存放在数据服务器S1,同时将乘积发送给数据服务器S2;(5)数据服务器S2选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的β′1进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;(6)数据服务器S3选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的γ′1进行加密,得到并将存放在数据服务器S3,计算乘积并将它赋值给Cxy,清除掉之前Cxy的存值,将新的Cxy值存储在数据服务器S3,同时发送给数据服务器S1;重复上述(1)-(6)过程,依次将x1,x2,x3,…,xn和y1,y2,y3,…,yn的每个数据分成的部分(xi=αi+βi+γi,yi=αi′+βi′+γi′)按顺序加密并且相乘,将最后得到的Cxy值存放在数据服务器S3;依照上述方法,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与A=(a1,a2,...,an)的每个数据分成部分(yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″)在上述...
【专利技术属性】
技术研发人员:张明武,陈文倩,黄嘉骏,冷文韬,阮鸥,沈华,陈效,张旭,
申请(专利权)人:湖北工业大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。