【技术实现步骤摘要】
一种基于移动用户动态敏感数据的差分隐私保护与数据挖掘方法和系统
[0001]本专利技术属于信息数据处理
,具体涉及一种基于移动用户动态敏感数据的差分隐私保护与数据挖掘方法和系统。
技术介绍
[0002]传统的基于分组的隐私保护模型的安全性与攻击者所掌握的背景知识有关。而所有可能的背景知识其实很难被充分定义,因此存在攻击漏洞,无法抵抗攻击者拥有最大背景知识的条件下的各种形式的攻击。并且,传统的隐私保护模型无法提供一种有效且严格的方法来证明其隐私保护水平,因此当模型参数改变时,通常无法对隐私保护水平进行定量分析。而差分隐私保护方案,已经证明可以通过对敏感数据增加噪声干扰,有效抵抗攻击者拥有最大背景知识的条件下的各种形式的攻击,更好的保证用户的敏感隐私不被泄露。然而,经过差分隐私加噪处理的敏感数据,直接影响了数据价值的挖掘,降低了数据的可用性。
技术实现思路
[0003]基于现有技术对用户隐私数据差分隐私后因为挖掘效率不高导致的数据可用性较低的问题,本专利技术提供一种基于移动用户动态敏感数据的差分隐私保护与数 ...
【技术保护点】
【技术特征摘要】
1.一种基于移动用户动态敏感数据的差分隐私保护与数据挖掘方法,其特征在于,包括以下步骤:步骤1,通过样本数据集确定待保护敏感属性:步骤1.1,获取超大规模移动终端应用用户的动态隐私敏感数据和已知的分类数据,构成包括分类属性和若干敏感属性的敏感数据集;步骤1.2,根据敏感数据集的分类属性值计算敏感数据集的信息熵,并通过计算敏感数据集每个敏感属性的期望信息熵,从而得到每个敏感属性的信息增益度;步骤1.3,选择信息增益度最大的敏感属性,作为敏感数据集的最敏感属性,即为待保护敏感属性;步骤2,对移动终端应用的动态隐私敏感数据进行局部保护:获取移动终端应用待发布的动态隐私敏感数据,对其中待保护的敏感属性数据进行差分隐私加噪处理,其他敏感属性数据不变,得到局部保护的动态隐私敏感数据并向外发布;步骤3,数据挖掘以获取分类:通过预建的决策树对发布的动态隐私敏感数据进行挖掘,得到相应的分类;其中,所述决策树根据敏感数据集构建得到。2.根据权利要求1所述的方法,其特征在于,所述决策树的构建方法为:步骤3.01,将步骤1得到的原始敏感数据集中信息增益度最大的敏感属性作为根节点;步骤3.02,根据原始敏感数据集在根节点的不同属性值,将原始的敏感数据集分解为与根节点属性值对应的多个数据子集;步骤3.03,针对每个数据子集:若数据子集中的分类属性值均相同,则将该分类属性值作为上一级节点的子节点,且作为叶子节点,终止对该数据子集继续分解;否则,按照步骤1.2相同的方法计算数据子集中每个敏感属性的信息增益度,取其中增益度最大的敏感属性作为上一级节点的子节点,或者数据子集中只有1个敏感属性;若数据子集中只有1个敏感属性,则使用多数表决的方式将该节点转换成叶子节点;步骤3.04,对每个子节点对应的数据子集:根据数据子集在该子节点的不同属性值,将该数据子集分解为与该子节点属性值对应的多个数据子集,然后返回执行步骤3.03,直到所有节点均为叶子节点。3.根据权利要求1所述的方法,其特征在于,敏感数据集和步骤3中分解得到的各数据子集,其信息熵的计算公式为:...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。