【技术实现步骤摘要】
数据流中频繁情节挖掘的差分隐私保护方法
本专利技术涉及隐私保护
,具体涉及一种数据流中频繁情节挖掘的差分隐私保护方法。
技术介绍
近年来,在许多应用中出现了大量的有序事件,如网络监控、入侵检测、股票交易、网络日志、基因序列等。对事件序列进行挖掘和分析,可以发现事件之间的紧随关系,从而揭示用户或系统潜在的行为模式,这种模式被定义为“情节”。一个情节通常被定义为一组有序的事件集,一个情节的支持度通常表示它在一个序列中发生的次数。基于事件序列上的频繁情节挖掘(FEM)已经成为时序数据挖掘领域的热点之一。频繁情节挖掘(FEM)旨在挖掘所有支持度大于用户定义的阈值的情节。频繁情节的挖掘很有可能来自于敏感数据(例如网络日志),发布或者查询挖掘出来的频繁情节可能会泄露个人隐私。因此,数据挖掘中的隐私保护问题引起广泛关注。差分隐私被认为是解决这一问题的一种方法,不像基于匿名的隐私模型(例如:k-匿名和l-多样性),差分隐私模型为发布数据的隐私保护提供了强有力的理论保障,并且不需要假设攻击者拥有多少程度的背景知识。差分隐私通过对查询结果添加适当的噪声,确保数据集的计算处理结果 ...
【技术保护点】
1.数据流中频繁情节挖掘的差分隐私保护方法,其特征是,包括步骤如下:步骤1、初始化:设定总的隐私预算ε,令初始的滑动次数t=0,初始的隐私预算ε0=ε;将初始的滑动采样窗口置于数据流的初始时间戳,此时初始的滑动采样窗口中的所有事务均为更新事务;步骤2、基于当前隐私预算εt,对当前滑动采样窗口中的更新事务进行窗口内部加噪处理,并发布当前滑动采样窗口所挖掘出的频繁情节及其加噪支持度;步骤3、令当前滑动次数t加1,并让滑动采样窗口在数据流上向前滑动,同时通过计算当前采样间隔It,确定当前滑动采样窗口在数据流上的当前时间戳;步骤4、更新当前分配隐私预算εt;其中
【技术特征摘要】
1.数据流中频繁情节挖掘的差分隐私保护方法,其特征是,包括步骤如下:步骤1、初始化:设定总的隐私预算ε,令初始的滑动次数t=0,初始的隐私预算ε0=ε;将初始的滑动采样窗口置于数据流的初始时间戳,此时初始的滑动采样窗口中的所有事务均为更新事务;步骤2、基于当前隐私预算εt,对当前滑动采样窗口中的更新事务进行窗口内部加噪处理,并发布当前滑动采样窗口所挖掘出的频繁情节及其加噪支持度;步骤3、令当前滑动次数t加1,并让滑动采样窗口在数据流上向前滑动,同时通过计算当前采样间隔It,确定当前滑动采样窗口在数据流上的当前时间戳;步骤4、更新当前分配隐私预算εt;其中其中,It为当前采样间隔,为当前剩余的隐私预算,t为滑动次数;步骤5、通过对比当前滑动采样窗口与上一次滑动采样窗口的时间戳,将当前滑动采样窗口中的事务分成重合事务和更新事务,其中重合事务为当前滑动采样窗口与上一个滑动采样窗口相重合的事务,更新事务为当前滑动采样窗口所有事务减去重合事务;步骤6、对当前滑动采样窗口中的重合事务进行预处理,即:步骤61、先对当前滑动采样窗口中重合事务进行频繁情节挖掘,并将这些挖掘出的频繁情节归入挖掘频繁情节集中;再分别计算每个挖掘出的频繁情节在挖掘频繁情节集上的加噪支持度;步骤62、先删除上一个滑动采样窗口所挖掘出的频繁情节中过期的频繁情节,仅保留其中与当前滑动采样窗口的重合事务相对应的频繁情节,并将保留下的频繁情节归入保留频繁情节集中;再分别计算每个保留下的频繁情节在保留频繁情节集上的加噪支持度;步骤63、计算步骤61中所有挖掘出的频繁情节的加噪支持度之和与步骤62所有保留下的频繁情节的加噪支持度之和的差值,得到支持度差距dist;步骤64、判断支持度差距dist是否小于等于当前支持度阈值如果是,则将步骤62中所有保留下的频繁情节及其加噪支持度直接进行发布,并转至步骤3;否则,将当前滑动采样窗口中的重合事务也视为更新事务后,并继续执行步骤7;步骤7、基于当前的隐私预算εt,对当前滑动采样窗口中的更新事务进行窗口内部加噪处理,并发布当前滑动采样窗口所挖掘出的频繁情节及其加噪支持度;步骤8、重复步骤3-7,从而完成整个数据流的繁情节及其加噪支持度的分布。2.根据权利要求1所述的数据流中频繁情节挖掘的差分隐私保护方法,其特征是,步骤2和步骤7的具体过程如...
【专利技术属性】
技术研发人员:王金艳,秦佳雯,黎启宇,李先贤,
申请(专利权)人:广西师范大学,
类型:发明
国别省市:广西,45
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。