保护电子交易中消费者隐私的大数据相关性分析方法及系统技术方案

技术编号:18238081 阅读:56 留言:0更新日期:2018-06-17 01:28
本发明专利技术公开了一种保护电子交易中消费者隐私的大数据相关性分析方法及系统,方法包括数据存储、数据统计处理、访问查询等步骤;系统包括数据存储模块,用于系统初始化,将数据随机分散后秘密处理转化成密文存储到各个数据服务器;数据统计处理模块,用于对密文进行相关统计分析计算的数据处理;访问查询模块,用于用户通过访问请求之后在客户端对密文进行解密计算。本发明专利技术将使用保护电子交易中消费者隐私的大数据相关性分析方法与系统,实现了在不损害消费者隐私的情况下对消费者信息进行有利于市场调节的相关性分析方法。本发明专利技术是帮助用户(例如,管理员、商家、研究人员)分析数据,而不泄露数据。 1

Large data correlation analysis method and system for protecting consumer privacy in electronic transactions

The invention discloses a large data correlation analysis method and system for protecting consumer privacy in electronic transactions. The method includes data storage, data processing, access query and other steps. The system includes data storage module, which is used for system initialization, and the data are randomly distributed after the secret processing is converted into ciphertext stored to each other. A data server; data processing module, which is used for data processing of related statistical analysis and calculation of ciphertext; access query module is used to decrypt and decrypt the ciphertext on the client after the access request. The invention will use the large data correlation analysis method and system to protect the consumer privacy in electronic transactions, and realize the correlation analysis method that can adjust the consumer information in the case of consumer privacy without damaging the consumer's privacy. The invention is to help users (for example, administrators, businessmen, researchers) to analyze data without divulging data. One

【技术实现步骤摘要】
保护电子交易中消费者隐私的大数据相关性分析方法及系统
本专利技术属于信息安全
,特别涉及一种保护电子交易中消费者隐私的大数据相关性分析方法与系统,通过结合密码学技术与统计数学,严格控制可以进入电子交易过程中消费者信息管理系统的人群,达到不泄露消费者隐私,并且可以对消费者数据进行隐私保护的相关性统计分析。
技术介绍
随着互联网技术越来越全面地渗透至人类社会政治、经济、文化等各个领域,数字化商业已经成为每个人、每个组织所必须要面对的,电子商务、网络购物已经不再是一种选择,而成为一种必然。但是这样的背景下,网购过程中客户个人信息遭泄露和不法侵害的案件也随之增加。因此除了用户自己对个人信息的保管之外,电子交易平台对消费者的信息管理的安全问题也是非常值得关注的。大部分的电子交易平台会对消费者的个人信息建立起综合数据库,并进行一定的分析,以便进行市场调查和调整,以及对消费者进行智能提醒和推荐等服务,比如一个35岁的白领女士想买一件毛衣,那么35岁、白领、女士和她过往购买的东西之间会有怎样的约束和联系,我们需要帮助商家或者研究人员分析大数据相关性,以便对这位女士进行推荐或者提供市场分类等更好的服务,所以我们需要去考虑多种因素下的相关性分析。目前,在电子交易环境当中,对于信息进行二次开发规范就当前来说还是一件比较棘手的事情,如果商家或者管理员、调研员的行为会为消费者带来相服务,如我们上述讲的正常的数据分析,那么这种二次开发就是受到消费者所青睐的,但事实上存在恶意的内部管理人员为了个人利益将消费者信息直接用来牟取利益,进而致使消费者个人信息得到泄漏增添了很多生活上的干扰。因此,一种保护电子交易中消费者隐私的大数据相关性分析方法与系统是非常有必要的。当前的方案是通过安全信道将消费者的信息分成多个数据板块分别加密之后传输到多个数据服务器并且储存,存储在数据服务器的消费者信息是由管理员、商家、研究人员、保险公司等不同的用户共享和访问的,最后将存储在每个数据服务器的加密过的数据板块解密之后再进行统计分析,通过这种方式可以保护消费者数据在传输过程中的安全,并且只要多个数据服务器没有被同时攻破,存放在数据服务器的消费者数据就是安全的,但是还存在着一些严重的问题:在这个系统中消费者信息被存储在数据服务器,由于是对存放在每个数据服务器的加密过的数据版块解密之后再进行数据分析的,也就是说在数据处理之前已经将分散到每个数据服务器的数据版块进行了整合,所以用户(例如,管理员、商家、研究人员)是可以获得消费者的全部敏感信息的,一旦有恶意用户出于个人目的将消费者信息利用,将会造成消费者敏感信息危机。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种保护电子交易中消费者隐私的大数据相关性分析方法与系统。本专利技术的方法所采用的技术方案是:一种保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,包括以下步骤:步骤1:数据存储;步骤2:数据统计处理;步骤3:访问查询。本专利技术的系统所采用的技术方案是:一种保护电子交易中消费者隐私的大数据相关性分析系统,其特征在于:包括数据存储模块、数据统计处理模块、访问查询模块;所述数据存储模块包括预处理参数生成单元、数据收集单元、数据分块单元;所述数据统计处理模块包括平均值处理单元、半偏相关处理单元、全偏相关处理单元、复相关处理单元;所述访问查询模块包括验证请求单元、数据解密单元、数据整合单元;所述数据存储模块用于系统初始化,将数据随机分散后加密存储到各个数据服务器;所述数据统计处理模块用于对相关统计分析计算进行密文的数据处理;所述访问查询模块用于用户通过请求之后在客户端对密文进行解密计算。本专利技术的目的是希望在不被用户得到全部的敏感隐私信息的情况下,可以对消费者数据进行大数据统计处理,并且是只针对于有利于市场调节的相关性统计分析。本专利技术将消费者数据随机分成多个数据版块,使它们的和等于原始数据,通过安全信道将它们分别传输到多个数据数据服务器,在各个数据服务器对其加密后进行存放,结合统计学知识提出一种在不损害消费者隐私的情况下对消费者信息进行有利于市场调节的相关性分析方法,最后将统计结果相关处理过的密文发送给发出请求的用户(例如,管理员、商家、研究人员),由用户客户端对已经处理过的信息进行解密并且整合得到想要的数据。这样做的好处是,由于系统已经在多个服务区的相互作用下对分散的数据板块进行了数据处理,将已经处理过的信息返回给需要的用户,所以即使用户授权进入消费者管理系统,也只能得到查询的信息(比如消费者某一属性的平均值或者消费者几个属性之间的相关性等),无法得到消费者的全部敏感信息,所以有效的防止了内部攻击(恶意管理员等利用消费者敏感信息),同时即使恶意攻击者攻击了任何一个数据服务器(外部攻击),得到的也只能是统计处理过后的密文,解密后无法得到消费者敏感信息,保证了在数据服务器相互数据处理过程中隐私数据的安全,所以只要多个数据服务器没有被全部攻破,整个系统就是安全的,大数据相关性统计结果就是就可靠有效的。一种保护电子交易中消费者隐私的大数据相关性分析方法与系统是帮助用户(例如,管理员、商家、研究人员)分析数据,而不泄露数据。附图说明图1:本专利技术实施例的方法流程图;图2:本专利技术实施例的系统原理图,其中(1)数据存储模块、(2)数据统计处理模块、(3)访问查询模块。具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。请见图1,本专利技术提供的一种保护电子交易中消费者隐私的大数据相关性分析方法,包括以下步骤:步骤1:数据存储;步骤1.1:生成预处理参数;负责选定方案所需参数,在各个数据服务器内用Pailler加密系统生成参数算法生成加密时需要的用户的公钥和私钥(pk,sk),同时选择一种签名认证方案生成验证时需要的用户的签名密钥对(pk*,sk*),并将用户的私钥和签名钥通过安全信道发送给用户;本实施例的参数算法Gen(k)为:随机选择两个大素数p和q,相互独立,满足乘积pq和乘积(p-1)(q-1)也互质;计算出N=pq;计算出(p-1)和(q-1)的最小公倍数,并将值赋给λ;再从中选出一个生成元g,即中每一个元素都可以由g作乘方运算得到,其中是指从1-N2的整数值;计算出μ=(L(gλ(modN2)))-1(modN),其中mod是求余运算;其中函数L()是如下定义的:最后加密系统中公钥pk是(N,g),私钥sk是(λ,μ);同时选择一种签名认证方案(本方案中不提供签名认证方案的详解,可以选择一种合适的签名认证方案,例如RSA签名认证方案),生成验证时需要的用户的签名密钥对(pk*,sk*),用于步骤3.1的用户验证阶段;本流程结束。步骤1.2:数据收集;在电子交易中收集消费者留下的个人信息;步骤1.3:数据分块;将收集到的消费者信息随机的分成多个等长的数据版块,在本具体实施例中假设将消费者信息收集之后分成三个数据版块分别通过安全信道传输给对应的三个数据服务器(S1、S2、S3),即消费者数据的某一个敏感信息数值ρ(整数)随机地分为三个整数α、β、γ,将每个部分通过安全信道传输到对应的本文档来自技高网
...
保护电子交易中消费者隐私的大数据相关性分析方法及系统

【技术保护点】
1.一种保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,包括以下

【技术特征摘要】
1.一种保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,包括以下步骤:步骤1:数据存储;步骤2:数据统计处理;步骤3:访问查询。2.根据权利要求1所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤1的具体实现包括以下子步骤:步骤1.1:生成预处理参数;选定所需参数,随机选择两个大素数p和q,在各个数据服务器内使用Pailler加密系统中的生成参数算法的要求对两个大素数p和q进行运算,生成本方案所需要的用户的公钥和私钥(pk,sk),同时选择一种签名认证方案生成验证时需要的用户的签名密钥对(pk*,sk*),并将用户的私钥和签名钥通过安全信道发送给用户;步骤1.2:数据收集;在电子交易中收集消费者留下的个人信息;步骤1.3:数据分块;将收集到的消费者信息随机的分成若干等长的数据版块,分别通过安全信道传输给电子交易系统中对应的若干数据服务器,通过步骤1.1选定的参数对其进行使用Pailler加密系统中的加密算法将其转化成密文并且将密文存储在每个数据服务器中。3.根据权利要求1所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤2的具体实现包括以下子步骤:步骤2.1:平均值处理;在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的某一量度的平均值作数据处理,通过平均循环算法,在多个数据服务器中将明文加密并且密文相互相乘,将每一轮循环的值都存放在同一数据服务器中,此数据服务器最终会与用户客户端之间进行数据传输;步骤2.2:半偏相关处理;在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的一个量度在某些量度干扰下与另一量度的相关性系数作数据处理,将明文加密得到原始密文,首先通过平均循环算法对原始密文进行第一次数据处理,将每一轮循环的值都存放在同一数据服务器中,再通过乘方循环算法对原始密文进行第二次数据处理,将每一轮循环的值都存放在同上一数据服务器中,最后通过相关循环算法对原始密文进行第三次数据处理,将每一轮循环的值都存放在同上一数据服务器中,此数据服务器最终会与用户客户端之间进行数据传输;步骤2.3:全偏相关处理;在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的两个量度在同样的多个干扰下的相关性系数作数据处理,将明文加密得到原始密文,通过平均循环算法、乘方循环算法、相关循环算法对原始密文按照一定顺序进行三种数据处理,实现在多个数据服务器中将涉及到的不同属性明文按规定的顺序加密并且相互相乘,将每一轮循环的值都存放在同一数据服务器中,此数据服务器最终会与用户客户端之间进行数据传输;步骤2.4:复相关处理;在多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的一个量度与多个属性在没有任何干扰的情况下的相关性系数作数据处理,将明文加密得到原始密文,通过平均循环算法、乘方循环算法、相关循环算法对原始密文按照一定顺序进行三种数据处理,实现在多个数据服务器中将涉及到的多种不同属性明文按规定的顺序加密并且相互相乘,将每一轮循环的值都存放在同一数据服务器中,此数据服务器最终会与用户客户端之间进行数据传输。4.根据权利要求3所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤2.1中所述循环算法的具体实现过程是:假设要得到n个消费者属性某一量度X=(x1,x2,x3,…,xn)的平均值,其中x1,x2,x3,…,xn表示第一个到第n个消费者的相关量度信息,将每一个数据随机分为三个部分,即xi=αi+βi+γi,i取1到n之间任何一个整数,表示第i个消费者,且对应着有三个数据服务器S1、S2、S3;此时设一个数Cx=1;(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给数据服务器S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在S1,同时将乘积发送给数据服务器S2;(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给数据服务器S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给数据服务器S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在数据服务器S3,计算乘积的值,并将它赋值给Cx,清除掉之前Cx的存值,将新的Cx值存储在数据服务器S3,同时发送给数据服务器S1;(4)将收集到的第二个消费者信息x2中的α2通过安全信道发送给数据服务器S1,数据服务器S1选取一个随机数对α2进行加密,得到并将存放在数据服务器S1,同时将乘积发送给数据服务器S2;(5)将收集到的第二个消费者信息x2中的β2通过安全信道发送给数据服务器S2,数据服务器S2选取一个随机数对β2进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;(6)将收集到的第二个消费者信息x2中的γ2通过安全信道发送给数据服务器S3,数据服务器S3选取一个随机数对γ2进行加密,得到并将存放在数据服务器S3,计算乘积的值,并将它赋值给Cx,清除掉之前Cx的存值,将新的Cx值存储在数据服务器S3,同时发送给数据服务器S1;重复执行上述(1)-(6),依次将x1,x2,x3,…,xn的每个数据分成的部分(xi=αi+βi+γi)加密并且相乘,将最后得到的Cx值存放在数据服务器S3。5.根据权利要求3所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤2.2中所述循环算法的具体实现过程是:假设n个消费者属性的三个量度X=(x1,x2,x3,…,xn)和Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an);(xi,yi,Ai)属于同一个消费者,即第i个消费者,并且量度A只对量度X有影响;将每一个数据随机分为三个部分,即xi=αi+βi+γi,yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″,i取1到n之间任何一个整数;第一种数据处理:先在多个数据服务器的相互配合下,计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)的每个数据分成部分(xi=αi+βi+γi)的加密之后的乘积赋值给Cx,并存放在数据服务器S3,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an)的每个数据分成部分(yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″)的加密运算之后的乘积赋值给Cy和Ca,并存放在数据服务器S3;第二种数据处理:此时设一个数(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给数据服务器S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在S1,同时将发送给数据服务器S2;(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给数据服务器S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器数据服务器S3;(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给数据服务器S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在数据服务器S3,计算乘积的值,将其值存储在数据服务器S3,同时发送给数据服务器S1和数据服务器S2;(4)数据服务器S1选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的α1再进行一次加密,得到并将存放在数据服务器S1,同时将乘积发送给数据服务器S2;(5)数据服务器S2选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的β1再进行一次加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;(6)数据服务器S3选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的γ1再进行一次加密,得到并将存放在数据服务器S3,计算乘积并将它赋值给清除掉之前的存值,将新的值存储在数据服务器S3,同时发送给S1;重复上述(1)-(6)过程,依次将x1,x2,x3,…,xn的每个数据分成的部分(xi=αi+βi+γi)加密并且相乘,将最后得到的值存放在数据服务器S3;依照上述方法,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an)的每个数据分成部分(yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″)在上述加密循环运算之后的乘积赋值给和并存放在数据服务器S3;第三种数据处理:此时设一个数Cxy=1;(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给数据服务器S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在数据服务器S1,同时将发送给数据服务器S2;(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给数据服务器S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给数据服务器S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在数据服务器S3,计算乘积的值,将其值存储在数据服务器S3,同时发送给数据服务器S1和数据服务器S2;(4)数据服务器S1选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的α′1进行加密,得到并将存放在数据服务器S1,同时将乘积发送给数据服务器S2;(5)数据服务器S2选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的β′1进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;(6)数据服务器S3选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的γ′1进行加密,得到并将存放在数据服务器S3,计算乘积并将它赋值给Cxy,清除掉之前Cxy的存值,将新的Cxy值存储在数据服务器S3,同时发送给数据服务器S1;重复上述(1)-(6)过程,依次将x1,x2,x3,…,xn和y1,y2,y3,…,yn的每个数据分成的部分(xi=αi+βi+γi,yi=αi′+βi′+γi′)按顺序加密并且相乘,将最后得到的Cxy值存放在数据服务器S3;依照上述方法,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与A=(a1,a2,...,an)的每个数据分成部分(yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″)在上述...

【专利技术属性】
技术研发人员:张明武陈文倩黄嘉骏冷文韬阮鸥沈华陈效张旭
申请(专利权)人:湖北工业大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1