基于云服务的社交网络相似分组匿名方法技术

技术编号:13464280 阅读:45 留言:0更新日期:2016-08-04 18:25
一种基于云服务的社交网络相似分组匿名方法,本发明专利技术在社交网络图G中节点的集合V={v1,v2,…vn}中提取所有带有敏感属性的节点作为敏感标签节点并组成集合其中:vn表示社交网络图G中节点,vsk表示敏感标签节点;将集合Vs中每一个节点进行分组,形成组集合C={g1,g2…gi},其中:gi代表各个组,1≤i≤k;将集合C中每组中的节点的邻居标签图进行匿名成相同的邻居标签图,从而得到匿名的社交网络图G’,本发明专利技术可以有效的防止社交网络中的邻居标签攻击,保护用户的身份,确保敏感信息和邻居网络结构不被攻击者所识别,能够显著的提高匿名后的社交网络数据质量的可用性。

【技术实现步骤摘要】
【专利摘要】一种,本专利技术在社交网络图G中节点的集合V={v1,v2,…vn}中提取所有带有敏感属性的节点作为敏感标签节点并组成集合其中:vn表示社交网络图G中节点,vsk表示敏感标签节点;将集合Vs中每一个节点进行分组,形成组集合C={g1,g2…gi},其中:gi代表各个组,1≤i≤k;将集合C中每组中的节点的邻居标签图进行匿名成相同的邻居标签图,从而得到匿名的社交网络图G’,本专利技术可以有效的防止社交网络中的邻居标签攻击,保护用户的身份,确保敏感信息和邻居网络结构不被攻击者所识别,能够显著的提高匿名后的社交网络数据质量的可用性。【专利说明】
本专利技术设及的是一种社交网络安全领域的技术,具体是一种基于云服务的社交网 络相似分组匿名方法。
技术介绍
公司将社交网络数据外包到云计算服务提供商,W便节省公司开支和管理。但运 也带来了隐私泄露的问题,用户的隐私信息很容易被攻击。 社交网络能够用节点和边来表示,其中节点表示社交网络中的用户,他们之间的 边来表示用户与用户之间的社交网络关系。 现有技术中,有许多方法来保护社交网络中的用户隐私信息,都主要关于用户身 份识别和他们之间的边信息的掲露,使得一个攻击者在发布的社交网络中不能W-个高的 概率去识别目标用户。但现实社交网络中的用户通常具有很多的属性信息,W上方法不能 防止邻居标签(label-nei曲borhood)攻击因此,需要保证运些具有敏感属性信息的用户, 使其敏感信息不被窃取。 经过对现有技术的检索发现,中国专利文献号CN103279713A,【公开日】为2013年9月 04日,公开了一种优化的社交网络图数据发布隐私保护方法,其首先将社交网络的数据抽 象为无向图,并将该无向图生成度序列;然后对度序列进行分组,构建出匿名度序列;最后 再对匿名度序列进行增加边和增加顶点的处理,使社交网络数据中每个个人或团体数据都 具有至少k和他属性相同的其他个人或团体,攻击者根据背景信息只能定位到至少k个体, 能够很好的保护社交网络参与者的个人或团体隐私信息。但该技术并未保护社交网络用户 的个人敏感属性信息,且仅考虑的是节点度的信息。
技术实现思路
本专利技术针对现有技术存在的上述不足,提出一种基于云服务的社交网络相似分组 匿名方法。 本专利技术是通过W下技术方案实现的:[000引本专利技术包括W下步骤: 1)在社交网络图G中节点的集合V={vl,V2,…Vn}中提取所有带有敏感属性的节点 作为敏感标签节点并组成集合^ =把1,"。切},其中:Vn表示社交网络图G中节点,vsk表 示敏感标签节点; 2)将集合Vs中每一个节点进行分组,形成组集合〔={的瓜.'常},其中:的代表各个 组,<k; 3)将集合C中每组中的节点的邻居标签图进行匿名成相同的邻居标签图,从而得 到匿名的社交网络图G'。 所述的步骤2)具体包括W下步骤: 2.1)将集合V和集合Vs中各个节点按照各自的度降序排序,i的初值为0; 2.2)选择集合Vs中未被分组的节点Vs建立新的分组gi,作为该分组的种子节点,且 i 二 1+i;[001引2.3)将集合¥中与巾3的邻居标签序列相似度化55最高的1个节点加入旨1,并将该1个 节点从集合V中除去,当集合V的节点数不足1时,则1取集合V中实际剩余的节点数; 2.4)将gi加入集合C中,如果V和Vs都不为空,则回到步骤2.2); 2.5)当最后一组中的节点数量不足1,将该组中每一个节点加入到该节点与帥有 最大邻居标签序列相似度值的组中,最后得到集合C。 所述的邻居标签序列相似度,其中:V1和V2为任意节 点,化Sv谢化SV2为节点VI和V2的邻居标签序列的集合。 所述的步骤3)具体包括W下步骤: 3.1)对集合C中的各个组g中任意两个节点进行匿名操作,得到每一组中任意两个 节点的匿名损失值; 3.2)将集合C中各个组按照节点数量降序排列,在各组中将除第一个节点之外的 所有节点按照其与第一个节点之间的匿名损失值降序排列; 3.3)采用标签优先,后进行度数匹配来匹配各组中的节点,将每组中各个节点的 邻居标签图都匿名成相同的邻居标签图,得到匿名的社交网络图G'。 所述的匿名损失值包括:标签信息泛化损失值化CG)、加边信息损失值W及加点信 息损失值,匿名损失值(IF(r) I - I巧巧 I),τ = Gi (U1) U Gi (化),Τ' = G' 1 (U1) U G' 1 (U2),其中:U1和U2为集合C中的各个 组内任意两个节点,Gl(Ul),Gi(U2)分别为U1和U2的邻居标签图,G'l (山),G'1(U2)分别为U1和 U2匿名后的邻居标签图,E(T)表示邻居标签图T的边的数量,ν(Τ)表示邻居标签图中节点的 数量,3, 丫,β分别表示标签信息泛化损失值,加边信息损失值W及加点信息损失值的权值。 技术效果 与现有技术相比,本专利技术可W有效的防止社交网络中的邻居标签攻击,保护用户 的身份,确保敏感信息和邻居网络结构不被攻击者所识别,能够显著的提高匿名后的社交 网络数据质量的可用性。【附图说明】 图1为本专利技术流程图; 图2为任意两个节点匿名过程示意图; 图3为原始图G实验中数据集的平均节点度在不同取值下的度的分布情况; 图4为已匿名图护实验中数据集的平均节点度在不同取值下的度的分布情况; 图5为实验中原始图G和已匿名图G/在不同隐私参数下的平均最短路径值的分布; 图6为实验中原始图G和已匿名图G/在不同隐私参数下的聚类系数的分布; 图7为实验中k-匿名方法和GSGA方法在不同隐私参数下回答聚集查询的误差; 图8为实验中数据集的平均节点度为4的信息损失值情况; 图9为实验中数据集的平均节点度为6的信息损失值情况。【具体实施方式】 下面对本专利技术的实施例作详细说明,本实施例在W本专利技术技术方案为前提下进行 实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施 例。 实施例1 本实施例首先将社交网络图G中每个敏感标签节点单独分为一组,将其它所有节 点中与敏感标签节点的邻居标签序列相似度最高的1个节点补入各组,得到一个组集合C, 然后先采用标签优先和度数匹配来匹配节点,最后将每组中各个节点的邻居标签图都匿名 成相同的邻居标签图,得到匿名的社交网络图G'。 如图1所示,本实施例具体包括W下步骤: 步骤1、在社交网络图G=(V,E)中节点的集合V={vl,v2,…vn}中提取所有带有敏 感属性的节点作为敏感标签节点并组成集合^ =板1,做U山其中:Vn表示社交网络图G 中节点,vsk表示敏感标签节点,E为每个节点的度。[003引步骤2、将集合Vs每一个节点进行分组,形成组集合〔={的,邑2.'常},其中:邑1代表各 个组,1 ^ i ^ k,具体包括W下步骤: 步骤2.1、将集合V和集合Vs各个节点按照各自的度降序排序,设数值i = 0。 步骤2.2、选择Vs中未被分组的节点vsi标记为vsf,建立新的分组gi,作为该分组的 种子节点,其中i = l+i。 步骤2.3、令候选集化]1山(1日163为空。[00创步骤2.4、将集合V中除节点Vsf之外未包含在gi的节点v加入候选集化ndidates。 步骤2.5、计算化11山(1曰*63本文档来自技高网
...

【技术保护点】
一种基于云服务的社交网络相似分组匿名方法,其特征在于,包括以下步骤:1)在社交网络图G中节点的集合V={v1,v2,…vn}中提取所有带有敏感属性的节点作为敏感标签节点并组成集合其中:vn表示社交网络图G中节点,vsk表示敏感标签节点;2)将集合Vs中每一个节点进行分组,形成组集合C={g1,g2…gi},其中:gi代表各个组,1≤i≤k;3)将集合C中每组中的节点的邻居标签图进行匿名成相同的邻居标签图,从而得到匿名的社交网络图G’。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴帆王洋邱富东陈贵海
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1