The invention discloses a density peak clustering method for privacy protection based on homomorphic encryption, which includes the following steps: step 1: cluster center calculation stage: participants need to encrypt their own privacy data and send it to cloud service provider A to calculate the distance between participants, and then calculate the cluster center safely according to the distance. Step 2: Residual Participant Assignment Stage: Cloud Service Provider A should eliminate the participants corresponding to outliers in order to avoid affecting the clustering results. Then, according to DPC algorithm, the remaining participants are allocated to the nearest cluster, and the outlier participants are finally allocated. The privacy protection density peak clustering method based on homomorphic encryption of the invention has good accuracy for density peak clustering, and can resist collusion attacks, even if cloud service providers collude with n_1 participants, they can also provide mutual privacy protection.
【技术实现步骤摘要】
一种基于同态加密的隐私保护密度峰聚类方法
本专利技术涉及密度聚类领域,具体涉及一种基于同态加密的隐私保护的密度峰聚类方法。
技术介绍
聚类作为数据挖掘重要的研究方法之一,其目的是将数据对象划分成若干个簇,使得簇中的对象相似度高,而每个簇之间对象的相似度低。在运用聚类分析的过程中,大量用户的隐私数据会被收集和分析,例如地理位置、健康状况以及情感状态等,这些信息一旦被泄露,将会造成严重的后果。因此,开发一种用户和云计算平台的相互隐私保护数据挖掘技术至关重要。隐私保护方法基本分为三大类,既k匿名技术、扰动技术和数据加密技术。k匿名技术包括泛化法和抑制法,可以对信息进行直接隐藏从而有效保护用户的隐私数据,但是该方法安全性不高,不能有效抵制链接攻击;扰动技术包括数据清洗、数据交换和随机化干扰,其中包括差分隐私技术,通过对原始数据随机加扰或者添加噪声来保护用户隐私,这种对数据干扰会影响计算结果的准确度;数据加密技术最典型的包括安全多方计算和同态加密算法,通过严谨的密码学原理得到的计算结果较为准确,并且安全性高,但是计算开销较大,所以本文使用同态加密算法并且借助云计算平台来进行计算。密度峰聚类(DensityPeaksClustering,DPC)是一种简单高效的聚类算法,其思想是:通过度量每一个样本点的局部密度和距离得到决策图;根据聚类中心点的特征,在决策图上选择最佳的聚类中心点;将剩余样本点分配到距其最近并拥有较高密度的样本所在簇中。使用DPC算法首先需要计算距离信息,该过程要利用参与者的隐私数据,则增加了泄露隐私的风险。
技术实现思路
本专利技术所要解决的技术问题是实 ...
【技术保护点】
1.一种基于同态加密的隐私保护密度峰聚类方法,其特征在于,包括以下步骤:步骤1:在云计算环境下,参与者需要加密自身隐私数据并发送给云服务商A来计算各个参与者之间的距离,再根据距离安全地计算聚类中心;步骤2:云服务商A剔除离群点对应的参与者,再根据DPC算法分配剩余参与者到其最近的簇中,最后分配离群的参与者。
【技术特征摘要】
1.一种基于同态加密的隐私保护密度峰聚类方法,其特征在于,包括以下步骤:步骤1:在云计算环境下,参与者需要加密自身隐私数据并发送给云服务商A来计算各个参与者之间的距离,再根据距离安全地计算聚类中心;步骤2:云服务商A剔除离群点对应的参与者,再根据DPC算法分配剩余参与者到其最近的簇中,最后分配离群的参与者。2.根据权利要求1所述的基于同态加密的隐私保护密度峰聚类方法,其特征在于:所述步骤1中,先定义欧式距离、同态加密的概念,通过乘法同态加密方案安全的计算各个参与者之间的欧式距离,在参与者发送各自的隐私数据给云服务商A的过程中实施隐私保护方案。3.根据权利要求1所述的基于同态加密的隐私保护密度峰聚类方法,其特征在于:所述步骤2中,根据步骤1得到的聚类中心,云服务商A先识别离群点,再分配其余参与者到最近的簇中,最后分配离群点。4.根据权利要求1或2所述的基于同态加密的隐私保护密度峰聚类方法,其特征在于,所述步骤1包括以下步骤:步骤1.1、假定由n个参与者a1,...,an组成的聚类问题,每个参与者ai拥有自身的隐私信息利用以下公式,计算参与者ai和aj之间的欧式距离:步骤1.2、参与者ai和aj的隐私数据都是q维向量,分别表示为现在考虑aiTaj的值,公式如下:步骤1.3、计算出每个参与者到其他参与者之间的距离,计算公式如下:步骤1.4、p,q是两个大素数,n=pq,根据欧拉定理,L(n)=(p-1)(q-1),随机选择整数λ,e,使得gcd(λ,L(n))=1,eλ≡1(L(n)),则公钥PK为{n,e},私钥SK为{λ};步骤1.5、明文空间M中的任意消息对应密文定义式如下:E(m)=memodn;步骤1.6、对于密文E(m),相应的明文定义式如下:D(E(m))=E(m)λmodn;步骤1.7、RSA密码系统是乘性同态的,满足以下条件:给定通过以下公式:E(m1·m2)=E(m1)·E(m2);步骤1.8、对于参与者的q维隐私数据,分别对其进...
【专利技术属性】
技术研发人员:慈尚,孙丽萍,鲍舒婷,俞庆英,罗永龙,
申请(专利权)人:安徽师范大学,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。