【技术实现步骤摘要】
一种面向多视图聚类挖掘的个性化隐私保护方法
本专利技术为一种面向多视图聚类挖掘的个性化隐私保护方法,涉及信息安全
技术介绍
随着互联网、物联网、智慧城市等数字化技术的发展,传感器、移动终端等各类数据收集设备将人类的衣食住行各类信息以数字化形式存储起来,从而催生了大数据时代的到来。数据首次作为一种资源,受到了政府、企业以及学术界等社会实体的高度关注。然而在数据使用过程中,个人的隐私信息可能遭到泄露。在发掘数据潜在价值的过程中,如何保障个人的隐私安全,尤其是如何避免数据挖掘带来的隐私泄露,是数据科学目前亟需解决的关键问题。隐私数据对个人或团体而言是特殊的或敏感的,是其不愿意泄露的信息。隐私信息的保护程度决定着用户对相关服务的信任度和接受性,是数据价值能否找到受众的基础。数据在发布、存储、挖掘和使用的整个生命周期中都可能存在隐私泄露风险。数据在发布和使用过程中的隐私安全问题已受到学术界的普遍关注,并已产生了大量有意义的研究成果。随着数据挖掘技术在应用层面的普及,面向挖掘的隐私安全问题已经得到了广泛关注,隐私保护领域的研究焦点和重心正在逐步向隐私保护数据挖掘领域 ...
【技术保护点】
一种面向多视图聚类挖掘的个性化隐私保护方法,其特征在于,包含以下步骤:步骤一 定义隐私关系;隐私数据集合D中的一条记录为多重组d=(d1,d2,…,dn),序偶di=<ai,si>∈d,ai为字段Ai上的原始数据值,si为ai对应的隐私度;称卡氏积D×D的下述子集为D上的隐私关系:R={<d,d'>|d,d'∈D,di=<ai,si>∈d,d'i=<a'i,s'i>∈d',且si≥s'i};若D上的两条记录d和d'具有隐私关系,即<d,d'>∈R,记为:d≥d';步骤二 输入隐私数据集D,包括每个视图数据X
【技术特征摘要】
1.一种面向多视图聚类挖掘的个性化隐私保护方法,其特征在于,包含以下步骤:步骤一定义隐私关系;隐私数据集合D中的一条记录为多重组d=(d1,d2,…,dn),序偶di=<ai,si>∈d,ai为字段Ai上的原始数据值,si为ai对应的隐私度;称卡氏积D×D的下述子集为D上的隐私关系:R={<d,d'>|d,d'∈D,di=<ai,si>∈d,d'i=<a'i,s'i>∈d',且si≥s'i};若D上的两条记录d和d'具有隐私关系,即<d,d'>∈R,记为:d≥d';步骤二输入隐私数据集D,包括每个视图数据X(i)(i=1,2,3,4),原始数据记录表和对应的隐私度记录表聚类簇数目期望值K,调节参数γ;初始化队列Q为空,置偏序隐私层L=1,并生成隐私偏序集<D',R'>;其中,记A'=(Ai,Ai+1,……,Ai+k)为原始数据模型A的一个属性子集(k≤n),对应的隐私度子模式为S'=(Si,Si+1,……,Si+k),D中每条记录去掉A'和S'中未出现的属性字段后所得的子集记为D',并设R'为D'上的隐私关系,则称序偶<D',R'>为隐私偏序集合,简称隐私偏序;若数据集合对于隐私数据b∈B,且B中不存在隐私数据x,使得b≠x且b≥x,那么隐私数据b∈B称为B的一个极小隐私元;B的所有极小隐私元构成的集合为B的极小隐私集;隐私数据集的第一个极小隐私集对应的偏序隐私层数为1,删掉第一个极小隐私集后,剩余数据集的极小隐私集对应的层数为2,依次类推,层数逐次增加1,直到删完所有数据为止;步骤三判断D是否为空,若为空则得到隐私线序集Q,Q中存储三类值:隐私数据记录指针、偏序隐私层号和相对隐私秩,若D不为空执行下一步;步骤四求解D的极小隐私集E,置E'=E,,计算e在E内的相对隐私秩;其中,极小隐私集E中隐私秩最小的隐私数据e为B的一个首隐私极元;记隐私数据d的隐私秩为:式中,d和d'为给定含n个属性的两条隐私数据,二者对应各属性的隐私度分别为s=(s1,s2,…,sn)和s'=(s'1,s'2,…,s'n);|>为求给定隐私数据的隐私秩的专用符号;符号表示若x>0,则置x=0;sign()为符号函数;步骤五任选E'内一个首隐私极元e,并置Q队尾节点的记录指针指向e,层数为L,置相对隐私秩为|e>;置E'=E'-{e},判断E'是否为空,若不为空,反复本步骤;步骤六置D=D...
【专利技术属性】
技术研发人员:徐东,李贤,张子迎,孟宇龙,张朦朦,姬少培,王岩俊,吕骏,方一成,王杰,
申请(专利权)人:哈尔滨工程大学,
类型:发明
国别省市:黑龙江,23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。