一种基于分形维数的流式数据差分隐私保护发布方法技术

技术编号:19343210 阅读:45 留言:0更新日期:2018-11-07 14:17
本发明专利技术公开了一种基于分形维数的流式数据差分隐私保护发布方法,包括:步骤一、利用滑动窗口技术对数据流进行分割,将满足条件的数据流以静态方式展示在滑动窗口中;步骤二、将数据进行初始聚类,并且将初始聚类结果计算各类的分形维数,并构造分形树;步骤三、将步骤一种分割窗口数据送至分形聚类模块用于数据聚类分析,对所到达数据进行分形聚类,对分形聚类结果进行按类统计,形成待发布分组,并且计算分组间差值集,并且以相似分组求均值进行代替,对分组融合优化后分组进行噪声干扰,并发布噪声干扰后的分组数据;步骤四、当分组数据量达到滑动窗口大小时,窗口向前平移,并且重复步骤三完成最终的数据发布。

A method of differential privacy protection for streaming data based on fractal dimension

The invention discloses a flow-based data differential privacy protection publishing method based on fractal dimension, which includes: step 1: dividing data stream by sliding window technology, displaying data stream satisfying conditions in sliding window in a static manner; step 2: initial clustering of data and initial clustering. The fractal dimension is calculated and the fractal tree is constructed. Step 3: The fractal clustering module is used for data clustering analysis. The fractal clustering module is used for data clustering analysis. The fractal clustering results are classified and counted to form groups to be published, and the difference sets between groups are calculated. Similar grouping is replaced by the mean value of the grouping. The grouping after grouping fusion is optimized is disturbed by noise and the grouping data after noise interference is released. Step 4: When the grouping data amount reaches the size of sliding window, the window moves forward and the final data release is completed by repeating step 3.

【技术实现步骤摘要】
一种基于分形维数的流式数据差分隐私保护发布方法
本专利技术涉及大数据安全领域,具体涉及一种基于分形维数的流式数据差分隐私保护发布方法。
技术介绍
实时动态数据存在于多种应用领域之中,例如监测传感器网络数据、在线交易数据处理、疾病实时统计发布、推荐系统等。这些应用场合通常需要快速而又准确地数据流统计发布,然而动态数据的直接发布必然会导致个人隐私信息泄露的发生。因此,在动态数据的处理和发布过程中,需要保护动态数据中的隐私信息,并保证数据的可用性。现有差分隐私数据发布方法的研究大多关注静态数据集的发布问题。然而,研究表明,当前社会对数据的动态发布需求更为强烈。而且,静态数据的差分隐私发布方法无法应用于动态数据的发布。由于动态数据具有动态性、多维性、持续到达和多种数据类型等特点,从而导致基于差分隐私的动态数据的发布存在发布数据可用性低、噪声积累导致数据发布误差大和隐私预算耗尽等问题,而且针对多维动态数据的差分隐私发布研究较少。而且研究发现,环境检测数据、传感器网络产生的数据等动态数据流具有分形特性。因此,利用分形挖掘技术对此类数据进行处理,并结合差分隐私技术对动态数据进行隐私保护数据发布,能本文档来自技高网...

【技术保护点】
1.一种基于分形维数的流式数据差分隐私保护发布方法,其特征在于,包括如下步骤:步骤一、利用滑动窗口技术对数据流进行分割,将满足条件的数据流以静态方式展示在所述滑动窗口中;步骤二、将数据进行初始聚类,并且将初始聚类结果计算各类的分形维数,并构造分形树;步骤三、将所述步骤一种分割窗口数据送至分形聚类模块用于数据聚类分析,有分形维数计算,对所到达数据进行分形聚类,对分形聚类结果进行按类统计,形成待发布分组,并且计算分组间差值集作为近似分组融合时近似分组判断参考,并且以相似分组求均值进行代替,对分组融合优化后分组进行噪声干扰,并发布噪声干扰后的分组数据;步骤四、当所述分组数据量达到所述滑动窗口大小时,...

【技术特征摘要】
1.一种基于分形维数的流式数据差分隐私保护发布方法,其特征在于,包括如下步骤:步骤一、利用滑动窗口技术对数据流进行分割,将满足条件的数据流以静态方式展示在所述滑动窗口中;步骤二、将数据进行初始聚类,并且将初始聚类结果计算各类的分形维数,并构造分形树;步骤三、将所述步骤一种分割窗口数据送至分形聚类模块用于数据聚类分析,有分形维数计算,对所到达数据进行分形聚类,对分形聚类结果进行按类统计,形成待发布分组,并且计算分组间差值集作为近似分组融合时近似分组判断参考,并且以相似分组求均值进行代替,对分组融合优化后分组进行噪声干扰,并发布噪声干扰后的分组数据;步骤四、当所述分组数据量达到所述滑动窗口大小时,窗口向前平移,并且重复步骤三完成最终的数据发布。2.如权利要求1所述的基于分形维数的流式数据差分隐私保护发布方法,其特征在于,在所述步骤一中,对数据流进行分割包括:将长度为T的数据流xi分割成T个时间戳上的数据点,得到数据点D={x1,x2,…xT}。3.如权利要求2所述的基于分形维数的流式数据差分隐私保护发布方法,其特征在于,在所述步骤二中,所述初始聚类和构造分形树的过程包括:积累一段时间的数据流,利用现有聚类算法进行初始聚类;若初始聚类为k个,记为{C1,C2,…,Ck},分别对初始化的类计算其分形维数,并构建分形树{FTree1,FTree2,…,FTreek},第i个类的分形维数记为Fd(Ci)。4.如权利要求3所述的基于分形维数的流式...

【专利技术属性】
技术研发人员:张兴颜飞史伟李万杰李帅
申请(专利权)人:辽宁工业大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1