一种隐私数据分级保护方法技术

技术编号：21630713 阅读：83 留言：0更新日期：2019-07-17 11:39

本发明专利技术提出了一种隐私数据的分级保护方法。针对现有的模型大多对所有的隐私数据一视同仁，没有考虑到隐私敏感程度的问题，本发明专利技术在隐私保护过程中将隐私程度看作是一种度量，通过计算隐私数据的敏感级别，并将敏感程度高的数据的出现频率限制在一个较低的值，实现为敏感程度高的隐私数据提供更高程度的保护。此外，本发明专利技术从用户的角度入手，在实现隐私的分级保护之后，直接计算用户从中能够获得的收益，将隐私的分级保护结果与用户的服务质量与隐私损失联系起来，让用户能从系统中得到满意服务的同时实现用户数据隐私性的保证。

A Hierarchical Protection Method for Privacy Data

全部详细技术资料下载

【技术实现步骤摘要】
一种隐私数据分级保护方法
本专利技术属于信息安全
，具体涉及一种隐私数据分级保护方法。
技术介绍
目前，关于数据隐私保护的研究主要包括隐私保护功能模块的研究、数据匿名化发布、差分隐私保护方法、加密算法的应用等方面。隐私保护大体上可以分为语法隐私保护(Thegrammarprotection)和语义隐私保护(Thesemanticprotection)两类。匿名化技术是语法隐私保护技术中的一种。匿名化技术已经在众多领域得到了很好的应用。k-匿名是数据挖掘算法的一种，由于攻击者通常是通过对半标识属性组攻击来识别用户身份等隐私信息，因此k-匿名化技术的基本要求是在所有的数据中任一组数据都至少与一部分数据不可区分，根据这个不可区分的特性，公开的数据中就保证了每个等价类至少有k组记录相同，从而减小攻击者获取用户隐私的概率。在k-匿名化技术中有两个专有名词分别叫做泛化和抑制，泛化指的是用更一般的指代替原来数据中的值，抑制则表示将某种属性的值部分或全部删除。将泛化和抑制两种操作结合使用可以增加所公布数据的价值，但同时也会导致数据的可用性降低。因此关于泛化和抑制的最优化使用研究仍在继续。l-多样性方法是在k-匿名技术上衍生出来的隐私保护的方法。它要求数据的每个等价类都包含l个敏感属性，当敏感属性值只有两个时，攻击者有50％的概率猜出真正的敏感属性，可见l的值越大，遭受攻击时就越安全。当l为1时，此时的l-多样性方法就等价于k-匿名化方法。该方法保证了数据属性的多样性，但是由于忽略了敏感属性的全局分布特特性，在遭受攻击时很容易被发现敏感属性导致也会泄露更多的信息。为了...

【技术保护点】
1.一种隐私数据分级保护方法，其特征在于，所述方法包括以下步骤：S10、将隐私数据的众多属性中用户所在意的敏感属性分离出来，将这些敏感属性集合称为特征，其中第i条隐私数据的第j个特征用dij表示；S20、根据特征与敏感程度的对应关系，选出所有满足单调性的特征；S30、以集合L＝{L1,L2,...,LK}表示数据的敏感程度级别，确定dij在相应特征级别上的分量大小θij，k，再对一项数据的j个特征的分级测量值进行求和计算，得到该数据属于相应特征级别的分量大小θik，并取求得的最大的θik中的最小的k值，作为该数据的敏感级别的具体值；S40、针对不同敏感级别的特征，为相应数据设置不同的出现频率，实现分级保护。

【技术特征摘要】
1.一种隐私数据分级保护方法，其特征在于，所述方法包括以下步骤：S10、将隐私数据的众多属性中用户所在意的敏感属性分离出来，将这些敏感属性集合称为特征，其中第i条隐私数据的第j个特征用dij表示；S20、根据特征与敏感程度的对应关系，选出所有满足单调性的特征；S30、以集合L＝{L1,L2,...,LK}表示数据的敏感程度级别，确定dij在相应特征级别上的分量大小θij，k，再对一项数据的j个特征的分级测量值进行求和计算，得到该数据属于相应特征级别的分量大小θik，并取求得的最大的θik中的最小的k值，作为该数据的敏感级别的具体值；S40、针对不同敏感级别的特征，为相应数据设置不同的出现频率，实现分级保护。2.根据权利要求1所述的隐私数据分级保护方法，其特征在于，所述步骤S30中根据每个特征的性质将特征划分级别，包括：根据特征的性质以及应用，设置特征属于某个级别的判决门限；然后根据判决门限和分类标准确定特征的级别...

【专利技术属性】
技术研发人员：郭永安，达庆佶，王安之，刘晓庆，朱洪波，杨龙祥，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人