当前位置: 首页 > 专利查询>武汉大学专利>正文

一种分布式w‑事件型差分隐私无限流数据发布方法技术

技术编号:12399410 阅读:80 留言:0更新日期:2015-11-26 04:39
本发明专利技术公开了一种分布式w‑事件型差分隐私无限流数据发布方法,采用基于几何方法的函数监测技术辅助用户的隐私预算分配,实现用户间隐私预算同步化分配;同时本发明专利技术中的数据发布方案不依赖可信的数据中心,并且所有传输的数据为含噪音数据,具有较高的安全性。本发明专利技术提供两种高可用性的w‑事件差分隐私发布方案,即dBD方案和dBA方案,可以根据实际数据的特点供灵活选择。

【技术实现步骤摘要】

本专利技术属于隐私安全数据发布
,涉及一种无限流数据发布方法,尤其涉 及一种面向无限流数据满足W-事件型差分隐私的分布式数据发布方法。
技术介绍
受益于电子设备制造技术的发展,人们可以通过智能手机、可穿戴设备等移动智 能设备更方便的获取人体生理参数、地理位置等数据。据统计,到2013年底,平板和智能手 机这两种具备网络通信功能的移动设备全球总销量将达到12亿台,而到2017年,全世界每 个人都将会拥有1. 4个移动设备。这些具备高速通信能力和强大传感器的移动设备催生了 移动互联网的诞生,并深刻改变了人们固有的生活方式。 在移动互联网时代,人们可以使用移动设备快速、连续地收集数据,例如人体生理 数据、个体轨迹数据等。合理利用这些感知数据可以为政府决策、企业推广和私人定制服务 提供便利。然而,这些信息具有的较高的敏感性,相关隐私信息的泄露得到广泛关注。而随 着现代社会互联化、信息化的趋势不断深入,这种个人隐私泄露的风险越来越成为现实。基 于这种隐私泄露的担忧,一系列隐私保护的数据发布方案被提了出来。基于传统密码学的 隐私保护方案或使用假名ID来隐藏用户记录真实ID,或使用一系列访问控制策略来将用 户记录共享给特定用户组。这些方法要么被现有去匿名化攻击证明十分脆弱,安全性不强; 要么就是过程复杂,十分不利于流数据的共享使用,因而实用性不强。 而为推动流数据发布的安全实用化,基于k-匿名模型的数据隐私保护方案被大 量提出。这类方案的基本思想是通过对记录数据的准标示符(quasi-identifier)进行泛 化(obscure)或截取(suppress)处理,将数据集依照这些泛化的标示符划分为若干个等价 类,使得每一个等价类当中数据不少于k个。然而,由于缺乏对隐私保护程度的量化和对攻 击者能力的清楚界定,基于k-匿名的方案仍然被发现具有诸多隐私泄露风险,需不断地针 对新泄露的风险提出修补方案。 基于概率模型的差分隐私(Differential Privacy)模型被提出来应对以上诸多 方案的不足。差分隐私要求单个记录数据对数据集处理结果的影响从概率上是微小可控 的,并且差分隐私模型假定在最差情况下,攻击者拥有除数据本身以外的所有记录数据,这 是攻击者理论上的攻击能力上限,因此能够抵御差分攻击即表明可以抵御所有已知和未知 的隐私攻击。由于差分隐私具有上述隐私可量化、攻击能力可界定的良好性质,它被广泛地 引入到诸多数据发布与查询应用领域。针对流数据自身的特点,差分隐私数据发布方案根 据保护侧重点的不同,可以分为针对无限流数据的事件型方案和面向有限流数据的用户型 方案。面向无限流数据的事件型差分隐私方案可以保护单个事件信息,而有限流数据的用 户型差分隐私方案则重点在于对用户整体信息的保护。然而,需要指出的是,现有的两类差 分隐私发布方案往往无法满足实时系统的应用需求。这是由于针对无限流数据的事件型差 分隐私发布方案,没有考虑连续时间内事件间的关联关系,导致敏感数据关联性泄露;而面 向有限流数据的用户型差分隐私方案由于发布次数的限制而无法满足实时系统的发布需 求。 w-事件型差分隐私(w-event differentialprivacy)正是在上述背景下被提出 的。W-事件型差分隐私发布方案是一种特殊的事件型方案,该方案克服了传统事件型差分 隐私方案未考虑事件间关联关系的不足,实现了对w时间窗内任意事件的信息保护。另外, 在数学定义上,当W趋近于无穷大时,该方案则实现了无限流数据上的用户型差分隐私。因 此W-事件型差分隐私综合了上述两种差分隐私方案的优势,具有重大的理论和应用价值。 Kellaris等提出了两种符合W-事件型差分隐私的数据发布方案:BD(Budget Distribution)方案和BA (Budget Absorption)方案。上述两种方案均假设存在一个可信 的数据中心来收集用户的原始数据,在收集到用户的所有数据后,数据中心根据既定的规 则计算并发布满足W-事件型差分隐私数据。但是,可信数据中心存在基础设施部署昂贵的 问题,并且还会带来的额外安全隐患,因此,如何移除可信数据中心,以分布式的方式实现 W-事件型差分隐私数据发布很有必要。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种分布式的满足W-事件型差分隐私 的无限流数据发布方法,适用于无可信数据中心的无限流数据隐私安全发布。 本专利技术所采用的技术方案是:一种分布式W-事件型差分隐私无限流数据发布方 法,假定无限流数据发布系统中有m个用户,分别为 Ul、……、Uni;假定存在一个数据请求者 u。,u。能够和所有用户通信;其特征在于,包括以下步骤: 步骤1 :无限数据流发布初始化,其具体实现包括以下子步骤: 步骤I. 1 :任意用户U1选择一个保密随机数r 1;用户u 发送给用户U1 i和用 户u1+1,这里g为q阶乘法群G的生成元,q为大素数;收到其他用户的信息后,用户U1计算 两个随机数种子L 和户+Λ; 步骤1. 2 :用户采集原始数据后,每一个用户按照约定的隐私预算额度生成对应 的伽马噪音,并将该噪音添加至采集的原始数据中;然后,用户利用其在步骤1. 1中得到的 随机数种子,生成随机数,将该随机数与含伽马噪音的数据相加,并将结果发送给数据请求 者;数据请求者收集到所有用户的数据后,数据请求者利用其随机数种子生成随机数,计算 这些数据的和值得到首次发布数据; 步骤1.3 :得到首次发布数据后,数据请求者计算一个以首次发布数据为球心 且半径最大的球形检测安全域,并以此为基础得到各个用户的相似度局部监测安全区域 B (Cl,^),这里B (Cl,Γι)是球心为C1半径为r i的球,并将对应的监测安全区域发送给每个用 户; 步骤2 :用户的隐私预算分配以及相似度局部监测,其具体实现包括以下子步骤: 步骤2. 1 :用户i在t时刻请求或者计算一个对应的局部监测安全区域B (C1, Γι); 步骤2. 2 :当用户i获得t时刻的数据后,用户i根据指定的隐私预算分配模式,计 算其对应的原始数据V1 (t);然后,用户监测V1 (t)是否在该时刻对应的局部监测安全区域 B (Cl,r)中;若V1⑴在局部监测安全区域B (Cl,r)外,则用户i向数据请求者发送一个预警 信号,数据请求者进而要求所有用户发送其添加噪音后的数据;反之,用户i保持静默,直 至数据请求者请求其数据; 步骤2. 3 :若t时刻用户i未发送数据给数据请求者,则用户i记该时间点的隐私 预算分配为〇 ;若t时刻用户i发送数据给数据请求者,则用户i需等待数据请求者的最 终反馈结果;若数据请求者反馈一个接受信号,则用户i记该时间点的隐私预算分配为其 对应值;反之,记该时间点的隐私预算分配为〇 ;根据发布结果调整其对应局部监测安全区 域; 步骤3 :数据请求者发布满足W-事件差分隐私的流数据,其具体实现包括以下子 步骤: 步骤3. 1 :若t时刻,数据请求者未收到来自任意用户的信息,则数据请求者记该 时刻的发布数据为空;若t时刻,数据请求者收到任意一个用户的预警信息,则数据请求者 要求所有用户发送其该时刻的含噪数据; 步骤3. 2 :收到所有含噪数据后,数本文档来自技高网
...

【技术保护点】
一种分布式w‑事件型差分隐私无限流数据发布方法,假定无限流数据发布系统中有m个用户,分别为u1、……、um;假定存在一个数据请求者u0,u0能够和所有用户通信;其特征在于,包括以下步骤:步骤1:无限数据流发布初始化,其具体实现包括以下子步骤:步骤1.1:任意用户ui选择一个保密随机数ri;用户ui将发送给用户ui‑1和用户ui+1,这里g为q阶乘法群G的生成元,q为大素数;收到其他用户的信息后,用户ui计算两个随机数种子和步骤1.2:用户采集原始数据后,每一个用户按照约定的隐私预算额度生成对应的伽马噪音,并将该噪音添加至采集的原始数据中;然后,用户利用其在步骤1.1中得到的随机数种子,生成随机数,将该随机数与含伽马噪音的数据相加,并将结果发送给数据请求者;数据请求者收集到所有用户的数据后,数据请求者利用其随机数种子生成随机数,计算这些数据的和值得到首次发布数据;步骤1.3:得到首次发布数据后,数据请求者计算一个以首次发布数据为球心且半径最大的球形检测安全域,并以此为基础得到各个用户的相似度局部监测安全区域B(ci,ri),这里B(ci,ri)是球心为ci半径为ri的球,并将对应的监测安全区域发送给每个用户;步骤2:用户的隐私预算分配以及相似度局部监测,其具体实现包括以下子步骤:步骤2.1:用户i在t时刻请求或者计算一个对应的局部监测安全区域B(ci,ri);步骤2.2:当用户i获得t时刻的数据后,用户i根据指定的隐私预算分配模式,计算其对应的原始数据vi(t);然后,用户监测vi(t)是否在该时刻对应的局部监测安全区域B(ci,r)中;若vi(t)在局部监测安全区域B(ci,r)外,则用户i向数据请求者发送一个预警信号,数据请求者进而要求所有用户发送其添加噪音后的数据;反之,用户i保持静默,直至数据请求者请求其数据;步骤2.3:若t时刻用户i未发送数据给数据请求者,则用户i记该时间点的隐私预算分配为0;若t时刻用户i发送数据给数据请求者,则用户i需等待数据请求者的最终反馈结果;若数据请求者反馈一个接受信号,则用户i记该时间点的隐私预算分配为其对应值;反之,记该时间点的隐私预算分配为0;根据发布结果调整其对应局部监测安全区域;步骤3:数据请求者发布满足w‑事件差分隐私的流数据,其具体实现包括以下子步骤:步骤3.1:若t时刻,数据请求者未收到来自任意用户的信息,则数据请求者记该时刻的发布数据为空;若t时刻,数据请求者收到任意一个用户的预警信息,则数据请求者要求所有用户发送其该时刻的含噪数据;步骤3.2:收到所有含噪数据后,数据请求者计算该时刻的整体相似度大小,判定接受或者拒绝该时刻数据并将该判定结果反馈给用户;步骤3.3:当接收新的非空数据发布后,为每个用户按照步骤1.3的原理计算新的局部监测安全区域。...

【技术特征摘要】

【专利技术属性】
技术研发人员:刘树波李永凯蔡朝晖王俊
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1