多条流中top-k共生模式挖掘的差分隐私保护方法技术

技术编号：20917815 阅读：25 留言：0更新日期：2019-04-20 09:57

本发明专利技术公开一种多条流中top‑k共生模式挖掘的差分隐私保护方法，首先对原始事务数据进行截断，然后利用指数机制对图进行扰动，之后根据采样频率对后续窗口隐私预算进行分配和吸收，最后利用拉普拉斯机制对模式计数加噪。

Differential Privacy Protection Method for Top-k Symbiotic Pattern Mining in Multiple Streams

The invention discloses a differential privacy protection method for top_k symbiotic pattern mining in multiple streams. Firstly, the original transaction data is truncated, then the graph is disturbed by an exponential mechanism, and then the privacy budget of subsequent windows is allocated and absorbed according to the sampling frequency. Finally, the pattern counting is noised by Laplace mechanism.

全部详细技术资料下载

【技术实现步骤摘要】
多条流中top-k共生模式挖掘的差分隐私保护方法
本专利技术涉及数据隐私保护
，具体涉及一种多条流中top-k共生模式挖掘的差分隐私保护方法。
技术介绍
随着大数据时代和物联网信息时代的到来，导致数字信息爆炸性增长，如何从数据中挖掘有用的信息并保障他人隐私不会被侵犯成为当前研究的热点。从数据流中挖掘频繁模式有着广泛的应用，如生物信息学数据分析、网络流量分析和web使用分析等多种在线应用。例如，在社交网络服务(SNS)中，Twitter和Facebook，SNS用户可以看成为流，连续发布推文的每个推特用户也可以被视为流，可以看到一些关键字可能经常出现在多个用户的推文中。我们把这种模式称为共生模式，它是一种特殊的闭合频繁模式。目前闭合频繁模式是研究较多的一种模式，它是频繁模式的一种简洁表示。2017年，Daichi等人提出了一种多条流中top-k共生模式挖掘的新方法，该方法以牺牲内存来提升数据挖掘的时间，但是该方法并没有考虑到用户的隐私问题，当事务数据流中含有个人的敏感信息时(如顾客的购买记录，用户的行为记录等)，敌手可以以很大概率推测出个人的信息，从而导致个人敏感信息受到威胁。
技术实现思路
本专利技术所要解决的是直接发布多条流中top-k共生模式所导致的隐私泄露的问题，提供一种多条流中top-k共生模式挖掘的差分隐私保护方法。为解决上述问题，本专利技术是通过以下技术方案实现的：多条流中top-k共生模式挖掘的差分隐私保护方法，具体包括如下步骤：步骤1、利用长度限制Lf对当前时刻的原始数据中长度大于Lf的事务数据进行截断，并利用所保留下来事务数据建立当前时...

【技术保护点】
1.多条流中top‑k共生模式挖掘的差分隐私保护方法，其特征是，具体包括如下步骤：步骤1、利用长度限制Lf对当前时刻的原始数据中长度大于Lf的事务数据进行截断，并利用所保留下来事务数据建立当前时刻的共生模式图；步骤2、利用指数机制对当前时刻的共生模式图的边进行扰动，得到当前时刻被扰动后的共生模式图；步骤3、计算当前时刻被扰动后的共生模式图中所有项的支持度，并对这些项的支持度进行降序排列后，将排在第k位的项的支持度作为当前闭合频繁模式阈值；步骤4、依次从当前时刻被扰动后的共生模式图中选出项作为当前项；对于每个当前项，不断计算当前项的每一个超集的支持度，并将超集的支持度与当前闭合频繁模式阈值进行比较：若超集的支持度大于当前闭合频繁模式阈值，且该超集为闭合频繁模式，则将当前闭合频繁模式阈值更新为该超集的支持度；否则，保持当前闭合频繁模式阈值不变，直到当前项的所有超集计算完毕为止；步骤5、将当前时刻被扰动后的共生模式图的所有项及其闭合频繁模式的超集的支持度进行降序排列，并从中选出支持度排在前k位的项和超集作为答案，并将这k个共同组成当前时刻的候选集；步骤6、用拉普拉斯机制对候选集进行加噪，得到...

【技术特征摘要】
1.多条流中top-k共生模式挖掘的差分隐私保护方法，其特征是，具体包括如下步骤：步骤1、利用长度限制Lf对当前时刻的原始数据中长度大于Lf的事务数据进行截断，并利用所保留下来事务数据建立当前时刻的共生模式图；步骤2、利用指数机制对当前时刻的共生模式图的边进行扰动，得到当前时刻被扰动后的共生模式图；步骤3、计算当前时刻被扰动后的共生模式图中所有项的支持度，并对这些项的支持度进行降序排列后，将排在第k位的项的支持度作为当前闭合频繁模式阈值；步骤4、依次从当前时刻被扰动后的共生模式图中选出项作为当前项；对于每个当前项，不断计算当前项的每一个超集的支持度，并将超集的支持度与当前闭合频繁模式阈值进行比较：若超集的支持度大于当前闭合频繁模式阈值，且该超集为闭合频繁模式，则将当前闭合频繁模式阈值更新为该超集的支持度；否则，保持当前闭合频繁模式阈值不变，直到当前项的所有超集计算完毕为止；步骤5、将当前时刻被扰动后的共生模式图的所有项及其闭合频繁模式的...

【专利技术属性】
技术研发人员：王金艳，方仕健，刘陈，李先贤，
申请(专利权)人：广西师范大学，
类型：发明
国别省市：广西,45

全部详细技术资料下载我是这个专利的主人