【技术实现步骤摘要】
本专利技术涉及数据挖掘和隐私保护领域,更具体地,涉及一种基于差分隐私的相关性时间序列发布方法及系统,用于解决现有利用差分隐私机制发布相关性时间序列的方法中,面临的实际有效的隐私保护强度无法达到预设值及数据可用性较低的问题。
技术介绍
随着社会信息化的发展和移动终端设备的日益普及,产生了大量的时间序列数据(如医疗、金融、交通数据等),对于信息咨询组织、商业机构以及政府决策部门来说,为了对时间序列进行分析挖掘以获得有价值的信息,要求数据搜集者(个人、企业、政府等)将采集到的时间序列数据进行发布和共享。但时间序列数据中可能包含用户的敏感信息,数据搜集者出于隐私泄露的担忧不愿发布自身的时间序列数据,因此,如何在发布时间序列数据的同时保证用户的隐私不被泄露,是时间序列发布亟待解决的问题。在目前的隐私保护方法中,能够较好地平衡数据安全性和可用性的是Dwork于2006年提出的差分隐私保护框架,它具有严格的数学公理化模型,并对攻击者的背景知识没有限制,是一种从数学上严格定义保护强度和数据可用性的隐私保护手段,在保证隐私安全性的同时能够较好的支持数据分析挖掘类应用,近年来成为隐私保护研究的热门领域。差分隐私最初是为了解决由相互独立的数据构成的静态数据集的隐私泄露问题而提出的,通过对待保护数据加入独立的噪声来保护隐私。因此,最初基于差分隐私的时间序列发布算法,也都是将时间序列作为独立序列来处理,通过对待发布时间序列叠加独立的噪声序列来保护隐私。但实际应用产生的绝大多数时间序列的数据之间是非独立的(具有相关性),这会导致最初的这些算法加入的独立噪声序列的相关特性与待发布时间 ...
【技术保护点】
一种基于差分隐私的相关性时间序列发布方法,其特征在于:包括以下步骤,步骤S1,数据预处理,包括读入待保护的原始时间序列X,总长度记为n;利用预设长度l的观测窗口从原始时间序列X的第i个时刻开始提取数据,得到当前待处理的时间序列,记为W,W={xi,xi+1,…,xi+l‑1},数据xi∈X;令i=1;步骤S2,自相关函数计算,包括计算观测窗口内时间序列W的自相关函数如下式,其中,为观测窗口序列中原始数据的均值;步骤S3,噪声生成,包括生成长度为l,自相关函数为的拉普拉斯噪声序列Z;包括以下子步骤,步骤S3‑1,设定滤波器的冲激响应为其中,N0是生成拉普拉斯噪声所需的高斯白噪声的功率谱密度;步骤S3‑2,生成长度为l,功率谱密度为N0的4个高斯白噪声序列G1、G2、G3和G4,其中高斯白噪声的分布满足步骤S3‑3,将高斯白噪声序列G1、G2、G3和G4通过冲激响应为h(n)的滤波器,得到4个自相关函数为RG′(n)的相关性高斯噪声序列G′1、G′2、G′3和G′4,其中步骤S3‑4,计算得到特定相关性的拉普拉斯噪声序列Z,Z的自相关函数步骤S4,噪声加入,包括根据自相关函数为的拉普拉斯噪 ...
【技术特征摘要】
1.一种基于差分隐私的相关性时间序列发布方法,其特征在于:包括以下步骤,步骤S1,数据预处理,包括读入待保护的原始时间序列X,总长度记为n...
【专利技术属性】
技术研发人员:徐正全,王豪,王涛,熊文君,
申请(专利权)人:武汉大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。