流式数据匿名化制造技术

技术编号:17940075 阅读:47 留言:0更新日期:2018-05-15 20:24
一种用于使流式数据集匿名化的系统和方法包括:将一个或多个数据集处理为这些数据集的一个或多个匿名矢量代表;访问包括期望的数据匿名化水平的广义矢量;将数据集的匿名矢量代表与广义矢量作比较;基于该比较来确定数据集的匿名矢量代表是否充分匿名;识别用于发送充分匿名的数据集的时间段;以及基于时间段中剩余的时间量来增加或者减小用于确定数据集的矢量代表是否充分匿名的计算资源的数量。

Streaming data anonymity

A system and method for anonymity of a stream data set, which includes one or more data sets to be represented as one or more anonymous vectors of these data sets; access to a generalized vector containing the desired level of data anonymity; compare the anonymous vector of the dataset to the broad sense vector; based on the comparison The anonymous vector of the set of data sets represents full anonymity; identifies the time period for sending a fully anonymous data set; and increases or decreases the number of computing resources that are used to determine whether the vector of the dataset is sufficiently anonymous to determine the data set based on the amount of time remaining in the time period.

【技术实现步骤摘要】
流式数据匿名化
本专利技术涉及处理数据,并且更具体地涉及数据集匿名化。
技术介绍
数据集可以被创建为每个数据集均包括多个数据值。这些数据集可以描述大量现象。例如,数据集可以包括与人相关联的用于描述个人或者涉及个人的多个数据值。即是说,个人可与表明其住所(诸如,邮政编码)、其性别、或者年龄的数据相关联。数据集可替代地可以描述其它主题,诸如,车辆和与该车辆相关联的车辆功能。鉴于数据集可包括识别信息,所以其通常被匿名化,以便使得该信息的接收者不能具体地识别该数据集中包括的特定数据值(例如,人或者车辆)。可以通过使用k-匿名技术来处理数据集并且使其匿名来实现匿名化。然而,k-匿名通常应用于静态数据集。相反,许多数据集现在都是作为流式数据来发送,并且使这些流式数据集匿名化可具有挑战性。当将现有的k-匿名技术应用至流式数据时,可具有挑战性的是识别应用数据集的最佳匿名量以便确保数据充分匿名并且在限定时间要求内处理该数据集。
技术实现思路
根据实施例,提供了一种用于使流式数据集匿名化的方法。该方法包括:将一个或多个数据集处理为这些数据集的一个或多个匿名矢量代表;访问包括期望的数据匿名化水平的广义矢量;将本文档来自技高网...
流式数据匿名化

【技术保护点】
一种用于流式数据集匿名化的方法,包括如下步骤:(a)将一个或多个数据集处理为这些数据集的一个或多个匿名矢量代表;(b)访问包括期望的数据匿名化水平的广义矢量;(c)将所述数据集的所述匿名矢量代表与所述广义矢量作比较;(d)基于所述比较来确定所述数据集的所述匿名矢量代表是否充分匿名;(e)识别用于发送充分匿名的数据集的时间段;以及(f)基于所述时间段中剩余的时间量来增加或者减小用于确定所述数据集的所述矢量代表是否充分匿名的计算资源的数量。

【技术特征摘要】
2016.11.04 US 15/3442201.一种用于流式数据集匿名化的方法,包括如下步骤:(a)将一个或多个数据集处理为这些数据集的一个或多个匿名矢量代表;(b)访问包括期望的数据匿名化水平的广义矢量;(c)将所述数据集的所述匿名矢量代表与所述广义矢量作比较;(d)基于所述比较来确定所述数据集的所述匿名矢量代表是否充分匿名;(e)识别用于发送充分匿名的数据集的时间段;以及(f)基于所述时间段中剩余的时间量来增加或者减小用于确定所述数据集的所述矢量代表是否充分匿名的计算资源的数量。2.根据权利要求1所述的方法,其中,所述一个或多个数据集包括至少一个标识符数据条目以及至少一个内容数据条目。3.根据权利要求1所述的方法,其中,所述一个或多个数据集中所包括的每个数据条目表示在所述一个或多个匿名矢量代表上的点。4.根据权利要求1所述的方法,其中,步骤(c)进一步包括如下步骤:确定所述匿名矢量代表与所述广义矢量之间的角度的余弦。5.根据权利要求1所述的方法,其中,步骤(d...

【专利技术属性】
技术研发人员:K·拉玛莫塞S·R·莫拉普迪
申请(专利权)人:通用汽车有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1