基于向量同态加密的隐私保护k-means聚类方法技术

技术编号:21953824 阅读:30 留言:0更新日期:2019-08-24 18:14
本发明专利技术涉及基于向量同态加密的隐私保护k‑means聚类方法,包括:A.客户端接收待聚类向量组;B.通过向量同态加密的方法对所述待聚类向量组进行加密,在加密过程中保留密钥交换矩阵M和比特扩展矩阵W,加密后得到密文向量组;C.根据通过AM=W得到矩阵A,定义中间矩阵H=A

K-means clustering method for privacy preservation based on vector homomorphic encryption

【技术实现步骤摘要】
基于向量同态加密的隐私保护k-means聚类方法
本专利技术涉及k-means聚类算法在隐私保护下的向量聚类方法,具体的讲是基于向量同态加密的隐私保护k-means聚类方法。
技术介绍
k-means聚类方法(kmeansclustering)原本是一种信号处理方法,后来被广泛应用在数据挖掘中。k-means聚类方法的目的是将n个观测值根据相应的规则划分为k个簇,其中每个观测值都以最小的均值隶属于对应簇中,最终的结果是将一个空间划分为多个小空间。这个问题是一个NP-hard问题,但是很多高效的启发式算法可以让待优化函数收敛到局部最优解。这些通常类似于通过高斯混合模型的迭代方法来求解最优解,它们都使用模型数据的聚类中心。k-means聚类方法的核心在于度量向量到聚类中心的距离。这在明文下是非常容易办到的,但在密文下却是非常困难。密文下度量两个向量之间的相似性一直都是一个非常困难的问题。
技术实现思路
针对现有技术中存在的将k-means聚类分析迁移至云服务器后产生的数据隐私泄露的问题,本专利技术提供了一种基于向量同态加密的隐私保护k-means聚类方法,以使隐私数据在云传输后具有高安全性。本专利技术基于向量同态加密的隐私保护k-means聚类方法,包括:A.客户端接收待聚类向量组(x1,x2,…xn),待聚类向量组(x1,x2,…xn)由n个待聚类的样本构成,其中n为正整数;B.通过向量同态加密的方法对所述待聚类向量组(x1,x2,…xn)进行加密,并且在加密过程中保留密钥交换矩阵M和比特扩展矩阵W,加密后得到密文向量组(c1,c2,…,cn);C.根据所述的密钥交换矩阵M和比特扩展矩阵W,通过AM=W,计算得到矩阵A,并且定义中间矩阵H=ATA,其中T为随机矩阵;D.将所述的中间矩阵H与密文向量组(c1,c2,…,cn)传送至聚类服务器进行聚类分析,并将密文向量组(c1,c2,…,cn)中的每一个向量附上聚类标签;E.聚类服务器将完成聚类分析的密文向量组(c1,c2,…,cn)发送回客户端,由客户端使用密钥矩阵S1进行解密,根据各个向量的标签组合得到聚类结果。具体的,步骤B中所述的向量同态加密,包括:B1.生成随机矩阵T,随机矩阵T中的每个元素都为计算机生成的随机数,同时生成大整数w及整数l,大整数w>>随机矩阵T中的任一元素,并且2l大于待聚类向量组(x1,x2,…xn)中的任一元素;B2.设置密钥矩阵S1=[I,T],其中I为单位矩阵,随机矩阵T∈Zm×m,Z为数学里表示所有整数的通用符,m×m为随机矩阵T的维度,Y为随机矩阵,E为随机噪声矩阵,m为正整数;通过得到对应的密钥交换矩阵M,记录密钥交换矩阵M和密钥矩阵S1;B3.根据密钥交换矩阵M和c=Mx*,得到密文向量组(c1,c2,…cn),其中x为明文向量,向量*的算法可以详见已出版的:ZhouH,WornellG.Efficienthomomorphicencryptiononintegervectorsanditsapplications[C]//2014InformationTheoryandApplicationsWorkshop(ITA).IEEE,2014:1-9。具体的,步骤D中所述的聚类分析包括:D1.根据待聚类向量的密文向量组(c1,c2,…,cn)及中间矩阵H,给密文向量组(c1,c2,…,cn)中每个待聚类向量分别附上各不相同的标签;D2.随机产生k个聚类中心(p1,p2,…,pk),其中k为正整数;D3.通过中间矩阵H计算密文向量组(c1,c2,…,cn)中每个密文向量到每个聚类中心的距离,对于每个密文向量会产生k个距离;D4.对每个密文向量选择最小的距离,并将它们归为一个集合,由此产生k个集合(Q1,Q2,…,Qk);D5.计算(Q1,Q2,…,Qk)中每个集合的平均向量,产生k个新聚类中心(p1',p2',…,pk');D6.重复步骤D3~D5,直到集合(Q1,Q2,…,Qk)不再改变。在此基础上,步骤D3中所述每个密文向量会产生k个距离为:Dij=(ci-pj)TH(ci-pj),i=1,…,n;j=1,…,k。进一步的,聚类中心(p1,p2,…,pk)为维度与密文向量组(c1,c2,…,cn)一致的整数向量。进一步的,所述集合(Q1,Q2,…,Qk)中的每个的元素均为向量。由于在k-means聚类算法中计算的对象是向量,因此可以对向量范数进行比较而不泄露向量每一维度的数据。因此本专利技术通过向量同态加密方案解决了密文数据云传输的安全性问题,保证了数据的隐私可靠性,同时还提高了对向量类型判断的效率,扩大了向量类型判断的应用范围。以下结合实施例的具体实施方式,对本专利技术的上述内容再作进一步的详细说明。但不应将此理解为本专利技术上述主题的范围仅限于以下的实例。在不脱离本专利技术上述技术思想情况下,根据本领域普通技术知识和惯用手段做出的各种替换或变更,均应包括在本专利技术的范围内。附图说明图1为本专利技术基于向量同态加密的隐私保护k-means聚类方法的流程图。具体实施方式如图1所示本专利技术基于向量同态加密的隐私保护k-means聚类方法,包括:A.客户端接收待聚类向量组(x1,x2,…xn),待聚类向量组(x1,x2,…xn)由n个待聚类的样本构成,其中n为正整数;B.通过向量同态加密的方法对所述待聚类向量组(x1,x2,…xn)进行加密,并且在加密过程中保留密钥交换矩阵M和比特扩展矩阵W,加密后得到密文向量组(c1,c2,…,cn):B1.生成随机矩阵T,随机矩阵T中的每个元素都为计算机生成的随机数,同时生成大整数w及整数l,大整数w>>随机矩阵T中的任一元素,并且2l大于待聚类向量组(x1,x2,…xn)中的任一元素;B2.设置密钥矩阵S1=[I,T],其中I为单位矩阵,随机矩阵T∈Zm×m,Z为数学里表示所有整数的通用符,m×m为随机矩阵T的维度,Y为随机矩阵,E为随机噪声矩阵,m为正整数;通过得到对应的密钥交换矩阵M,记录密钥交换矩阵M和密钥矩阵S1;B3.根据密钥交换矩阵M和c=Mx*,得到密文向量组(c1,c2,…cn),其中x为明文向量。C.根据所述的密钥交换矩阵M和比特扩展矩阵W,通过AM=W,计算得到矩阵A,并且定义中间矩阵H=ATA,其中T为随机矩阵;D.将所述的中间矩阵H与密文向量组(c1,c2,…,cn)传送至聚类服务器进行聚类分析:D1.根据待聚类向量的密文向量组(c1,c2,…,cn)及中间矩阵H,给密文向量组(c1,c2,…,cn)中每个待聚类向量分别附上各不相同的标签;D2.随机产生k个聚类中心(p1,p2,…,pk),其中k为正整数,并且聚类中心(p1,p2,…,pk)为维度与密文向量组(c1,c2,…,cn)一致的整数向量;D3.通过中间矩阵H计算密文向量组(c1,c2,…,cn)中每个密文向量到每个聚类中心的距离,对于每个密文向量会产生k个距离::Dij=(ci-pj)TH(ci-pj),i=1,…,n;j=1,…,k;D4.对每个密文向量选择最小的距离,并将它们归为一个集合,由此产生k个集合(Q1,Q2,…,Qk);D5.计算(Q1,Q2,…,Qk)中每个集合的平均向量,产生k个新聚类中心(p1',p2本文档来自技高网...

【技术保护点】
1.基于向量同态加密的隐私保护k‑means聚类方法,其特征包括:A.客户端接收待聚类向量组(x1,x2,…xn),待聚类向量组(x1,x2,…xn)由n个待聚类的样本构成,其中n为正整数;B.通过向量同态加密的方法对所述待聚类向量组(x1,x2,…xn)进行加密,并且在加密过程中保留密钥交换矩阵M和比特扩展矩阵W,加密后得到密文向量组(c1,c2,…,cn);C.根据所述的密钥交换矩阵M和比特扩展矩阵W,通过AM=W,计算得到矩阵A,并且定义中间矩阵H=A

【技术特征摘要】
1.基于向量同态加密的隐私保护k-means聚类方法,其特征包括:A.客户端接收待聚类向量组(x1,x2,…xn),待聚类向量组(x1,x2,…xn)由n个待聚类的样本构成,其中n为正整数;B.通过向量同态加密的方法对所述待聚类向量组(x1,x2,…xn)进行加密,并且在加密过程中保留密钥交换矩阵M和比特扩展矩阵W,加密后得到密文向量组(c1,c2,…,cn);C.根据所述的密钥交换矩阵M和比特扩展矩阵W,通过AM=W,计算得到矩阵A,并且定义中间矩阵H=ATA,其中T为随机矩阵;D.将所述的中间矩阵H与密文向量组(c1,c2,…,cn)传送至聚类服务器进行聚类分析,并将密文向量组(c1,c2,…,cn)中的每一个向量附上聚类标签;E.聚类服务器将完成聚类分析的密文向量组(c1,c2,…,cn)发送回客户端,由客户端使用密钥矩阵S1进行解密,根据各个向量的标签组合得到聚类结果。2.如权利要求1所述的基于向量同态加密的隐私保护k-means聚类方法,其特征为:步骤B中所述的向量同态加密,包括:B1.生成随机矩阵T,随机矩阵T中的每个元素都为计算机生成的随机数,同时生成大整数w及整数l,大整数w>>随机矩阵T中的任一元素,并且2l大于待聚类向量组(x1,x2,…xn)中的任一元素;B2.设置密钥矩阵S1=[I,T],其中I为单位矩阵,随机矩阵T∈Zm×m,Z为数学里表示所有整数的通用符,m×m为随机矩阵T的维度,Y为随机矩阵,E为随机噪声矩阵,m为正整数;通过得到对应的密钥交换矩阵M,记录密钥交换矩阵M和密钥矩阵S1...

【专利技术属性】
技术研发人员:张小松何伟超牛伟纳刘宪赵艺宾任仲蔚
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1