一种面向大规模图数据发布的隐私保护方法及系统技术方案

技术编号:17363949 阅读:54 留言:0更新日期:2018-02-28 14:13
本发明专利技术公开了一种面向大规模图数据发布的隐私保护方法,具体为(1)将原图数据均匀地划分多个子块;(2)读取被切割连边,比较被切割连边两端的节点度大小,在节点度较大的节点所属子块内新增噪声节点,通过节点度较大的节点与噪声节点连线实现对被切割连边的保留;(3)构造出同构块矩阵;将子块结构信息与同构块矩阵比较,并以添加噪声边的方式进行同构,完成图数据匿名保护。本发明专利技术将整体的图数据匿名保护所需时间降低了一个数量级,做到了匿名化过程的高效性;最终的匿名图满足k匿名机制,做到了匿名化的安全性。该发明专利技术保证了匿名图在可用性,安全性,高效性三者的平衡性能大幅度提升。

A privacy protection method and system for large scale map data publishing

【技术实现步骤摘要】
一种面向大规模图数据发布的隐私保护方法及系统
本专利技术属于图数据处理
,更具体地,涉及一种面向大规模图数据发布的隐私保护方法及系统。
技术介绍
近年来,随着多方共享数据规模的爆炸式增长,无论是学术界或是工业界,都迫切需要大规模数据处理技术,尤其是对于像大规模图数据的这类非结构化数据。由于图数据的结构特性,其在众多数据存储分析领域得到广泛运用。例如Facebook采用TAO系统存储其超大规模的社会网络数据。然而像这类的社会网络数据包含了大量的用户个人隐私信息,数据拥有者在发布和分享这些数据给第三方之前需要对原数据进行特殊的隐私保护处理。通常说来,简单地将原图数据去除用户ID来保护隐私,攻击者仍旧能够基于已知的背景知识轻易地识别出图数据上的个体,并且获取其相关的隐私信息。而这类重识别攻击风险可大致划分为三类:1、身份泄露风险:个体能够通过其对应的邻居节点信息被唯一识别;2、成员泄露风险:各个成员间的关联信息泄露;3、内容泄露风险:个体敏感属性或者个体间连接的敏感信息泄露。因此,保护图数据上的隐私信息至关重要。目前,针对图数据的隐私保护主要方式之一是k匿名机制。k匿名机制其目的在于本文档来自技高网...
一种面向大规模图数据发布的隐私保护方法及系统

【技术保护点】
一种面向大规模图数据发布的隐私保护方法,其特征在于,所述方法包括以下步骤:(1)图分割步骤:将原图数据均匀地划分为k个子块,记录子块间由于块划分导致的被切割连边信息;(2)连边保留步骤:读取被切割连边,比较被切割连边两端的节点度大小,在节点度较大的节点所属子块内新增噪声节点,通过节点度较大的节点与噪声节点连线实现对被切割连边的保留;(3)子块同构步骤:聚合k个子块的结构信息,构造出同构块矩阵T;将k个子块结构信息分别与同构块矩阵T比较,并以添加噪声边的方式进行同构,使得同构后的k个子块的邻接矩阵与矩阵T相等,完成图数据匿名保护。

【技术特征摘要】
1.一种面向大规模图数据发布的隐私保护方法,其特征在于,所述方法包括以下步骤:(1)图分割步骤:将原图数据均匀地划分为k个子块,记录子块间由于块划分导致的被切割连边信息;(2)连边保留步骤:读取被切割连边,比较被切割连边两端的节点度大小,在节点度较大的节点所属子块内新增噪声节点,通过节点度较大的节点与噪声节点连线实现对被切割连边的保留;(3)子块同构步骤:聚合k个子块的结构信息,构造出同构块矩阵T;将k个子块结构信息分别与同构块矩阵T比较,并以添加噪声边的方式进行同构,使得同构后的k个子块的邻接矩阵与矩阵T相等,完成图数据匿名保护。2.根据权利要求1所述的面向大规模图数据发布的隐私保护方法,其特征在于,所述步骤(3)中构造同构块矩阵T的具体实施方式为:(3-1)统计各k个子块包含的最多节点数,记为max;(3-2)分别在各k个子块内,将各节点按照节点度升序排列构成节点序列;(3-3)改变节点序列中节点的索引信息,使得节点的新索引值newindex满足以下公式:newindex=max-block.size+oldindex其中block.size为子块包含的节点数,oldindex为子块节点的原索引值;(3-4)在节点序列中添加噪声节点,使得每个节点序列中的节点数等于max,其中噪声节点添加至已经排好序的节点序列的首部,其索引为从0开始未被使用的索引值;(3-5)依据节点序列构造k个子块的邻接矩阵,以矩阵相加的方式聚合k个邻接矩阵,形成同构块矩阵T。3.根据权利要求1或2所述的面向大规模图数据发布的隐私保护方法,其特征在于,所述步骤(3)中同构的具体实施方式为:对比各子块的邻接矩阵与同构块矩阵T差异;如果矩阵T中第i行,第j列的值Tij大于等于1并且对应子块的邻接矩阵中第i行第j列的值Nij等于0,则在子块节点序列的第i个节点ni和第j个节点nj之间构造噪声边eij。4.根据权利要求1或2所述的面向大规模图数据发布的隐私保护方法,其特征在于,在图分割步骤前还对原图数据进行模块化处理,具体为:根据原图数据的结构信息和节点属性,计算原图的...

【专利技术属性】
技术研发人员:丁晓锋金海王摧
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1