【技术实现步骤摘要】
基于线性变换的K
‑
means聚类的隐私保护外包方法
[0001]本专利技术属于隐私保护
,涉及一种聚类隐私保护方法,具体涉及一种基于线性变换的K
‑
means聚类的隐私保护外包方法。
技术介绍
[0002]云计算是以用户为中心的一种计算服务。近年来,随着云计算技术的不断发展,以及云服务提供商的不断增多,越来越多的用户和企业选择云计算服务,作为云计算的重要应用之一,外包计算技术也成为人们关心的热点。在云计算环境中,计算能力和存储资源受限的用户终端可以将复杂的计算任务外包给云服务器处理,通过按需付费的方式享用云计算平台所提供的无尽的计算和存储资源。这种新的计算模式减轻了个人计算的负担,避免了用户对本地软硬件和维护的大量投入,用户可远程地将数据存放到云端进行处理,并按需享受云中高质量的应用和服务。在当前云计算技术发展越来越快的今天,外包计算为聚类分析的加速提供了可能。
[0003]聚类是探索性数据挖掘和统计数据分析的主要任务之一,广泛应用于医疗保健、社会网络、图像分析、模式识别等 ...
【技术保护点】
【技术特征摘要】
1.一种基于线性变换的K
‑
means聚类的隐私保护外包方法,其特征在于所述方法包括如下步骤:步骤1、密钥生成:数据拥有者拥有一个大规模原始数据集D,且数据样本个数为n,样本为维数m,数据拥有者使用密钥生成算法随机生成一个密钥sk=π1,π2,Q,L,c,其中,π1、π2为两个随机置换函数,Q为通过Householder变换产生的正交实数方阵,L为一个具有相同行向量的实数矩阵,c为随机实数,c>0;步骤2、数据加密:生成密钥sk后,数据所有者首先用π1、π2对原始数据集D中每条记录对应的索引顺序和属性顺序进行置换,得到置换数据集D',接下来,数据所有者使用密钥(Q,L,c)将D'转化为加密数据集D”并将D”发送到云端;步骤3、云计算:云接收到加密数据集D”后,执行K
‑
means均值聚类任务,计算任务完成后,云返回K
‑
means聚类结果和每个聚类的质心给数据拥有者;步骤4、结果验证:数据拥有者对从云返回的聚类结果进行验证;步骤5、数据解密:数据所有者在验证成功云返回的聚类结果后,通过π1恢复加密数据集D”中每条记录对应的索引顺序,得到真实的K
‑
means聚类结果。2.根据权利要求1所述的基于线性变换的K
‑
means聚类的隐私保护外包方法,其特征在于所述步骤1具体包括如下步骤:步骤1.1、数据拥有者根据数据样本个数n和样本维数m生成π1、π2,具体形式如下:步骤1.2、数据拥有者通过QR分解中的Householder变换生成m维的正交实数方阵Q;步骤1.3、生成一个n
×
m的实数矩阵L;步骤1.4、生成随机实数c。3.根据权利要求2所述的基于线性变换的K
‑
means聚类的隐私保护外包方法,其特征在于所述步骤1.2具体包括如下步骤:步骤1.2.1、生成m个随机实数q1,q2,
…
,q
m
;步骤1.2.2、构造一个列向量q=(q1,q2,
…
,q
m
)
T
;步骤1.2.3、构造Householder变换矩阵,公式如下:其中,I是单位矩阵。4.根据权利要求2所述的基于线性变换的K
‑
means聚类的隐私保护外包方法,其特征在于所述步骤1.3具体步骤如下:步骤1.3.1、生成m个随机实数l1,l2,
…
,l
m
;步骤1.3.2、构造一个m维的列向量l=(l1,l2,
…
,l
m
)
T
;步骤1.3.3、构造一个n
×
m的矩阵L=(l,l,
…
,l)
T
。5.根据权利要求1所述的基于线性变换的K
‑
means聚类的隐私保护外包方法,其特征在于所述步骤2中,置换数据集D'的公式如下:
其中,i=1,2,...,n,j=1,2,...,m;加密数据集D”的公式如下:D”=c
×
(D'
×
Q
‑
L)。6.根据权利要求1所述的基于线性变换的K
‑
means聚类的隐私保护外包方法,其特征在于所述步骤4具体包括如下步骤:步骤4.1、数据拥有者根据云返回的聚类结果计算每个聚类的质心是...
【专利技术属性】
技术研发人员:杨武,赵韦,苘大鹏,吕继光,王焕然,董国忠,韩帅,
申请(专利权)人:哈尔滨工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。