用于匿名化数据集的系统和方法技术方案

技术编号:21554069 阅读:51 留言:0更新日期:2019-07-07 01:36
本发明专利技术涉及用于匿名化数据集的方法,其中所述方法具有如下步骤:在中央节点处确定(S101)用于数据集的准标识符的泛化级别的组合;传送(S102)的泛化级别的组合给多个子节点;以及通过所述子节点基于所述泛化级别的组合来并行地执行(S103)所述数据集的匿名化。

Systems and methods for anonymizing data sets

【技术实现步骤摘要】
【国外来华专利技术】用于匿名化数据集的系统和方法
本专利技术涉及一种用于匿名化数据集的方法和系统。
技术介绍
出版物US7,269,578涉及用于去标识化或匿名化输入数据源中的条目的系统和方法。该方法的目标是:将也以组合的方式包含间接的个人关联的属性值、诸如出生日期这样在数据量中概括化,使得即便在背景信息、诸如具有出生日期的申报登记被查询的情况下,那么也不再可能由这些数据量推论出具体个人。具有间接个人关联的属性被表示为准标识符(QuasiIdentifier)。如果每个可能的关于准标识符组合的询问始终要么并不提供结果要么提供至少一个数目为k的结果,则数据组是“k-anonym(k匿名)”。这由此来实现:经泛化的准标识符的每个组合描述至少k个元素的组。附加地,存在超出k匿名性的对匿名化的结果的更强度的条件。这些条件除了每个产生的组的k个元素的最小数目以外还对并没有已经被泛化的特殊属性提出条件。这些特殊属性被表示为敏感属性。为此常用的标准是:“1多样性”(1-Diversity)和“t紧密度”(t-Closeness)。针对敏感属性的示例例如可以是在患者数据组中的属性“疾病”。“1多样性”意味着:每个产生的本文档来自技高网...

【技术保护点】
1.用于匿名化数据集(105)的方法,其中所述方法具有如下步骤:在中央节点(101)处确定(S101)用于数据集(105)的准标识符的泛化级别的组合;传送(S102)所述泛化级别的组合给多个子节点(109);以及通过所述子节点(109)基于所述泛化级别的组合来并行地执行(S103)所述数据集(105)的匿名化。

【技术特征摘要】
【国外来华专利技术】1.用于匿名化数据集(105)的方法,其中所述方法具有如下步骤:在中央节点(101)处确定(S101)用于数据集(105)的准标识符的泛化级别的组合;传送(S102)所述泛化级别的组合给多个子节点(109);以及通过所述子节点(109)基于所述泛化级别的组合来并行地执行(S103)所述数据集(105)的匿名化。2.根据权利要求1所述的方法,其中检验:经匿名化的所述数据集(105)是否满足k匿名性的条件。3.根据权利要求2所述的方法,其中如果所述经匿名化的数据集(105)满足所述k匿名性的条件,则较低的泛化级别的组合被确定。4.根据权利要求2所述的方法,其中,如果所述经匿名化的数据集(105)并不满足k匿名性的条件,则较高泛化级别的组合被确定。5.根据权利要求3或4所述的方法,其中较低的或较高的泛化级别的组合被传送给多个所述子节点(109)并且所述数据集(109)的匿名化基于所述较低的或较高的泛化级别的组合通过所述子节点(109)来并行地执行。6.根据以上权利要求中任意一项所述的方法,其中基于泛化图GG来执行泛化级别的组合的确定。7.根据权利要求6所述的方法,其中所述泛化图GG被加载到所述中央节点(101)的存储器中。8.根据权利要求6或7所述的方法,其中借助预给定的搜...

【专利技术属性】
技术研发人员:M莫克A哈普费尔迈尔M伊米希
申请(专利权)人:西门子股份公司
类型:发明
国别省市:德国,DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1