一种面向云平台的多域数据隐私保护方法技术

技术编号:22387825 阅读:44 留言:0更新日期:2019-10-29 06:39
一种面向云平台的多域数据隐私保护方法,涉及多域数据隐私保护技术领域。本发明专利技术为了解决现有的多域数据隐私保护方法一般采用静态匿名来发布数据,不够灵活,不能限制数据分析人员获得的数据范围,无法满足使用原始数据的需求的问题。本发明专利技术包括数据匿名化处理和原始数据恢复处理;本发明专利技术针对数据分析和事务处理场景下的具体需求,来采用相应的隐私保护策略,对不同领域的结构化数据表,通过数据匿名为主体的隐私保护技术,来达到减少云端数据隐私泄露风险的效果,同时满足一定事务处理上的需求。将匿名后数据存储并用于数据分析,降低隐私信息泄露的风险,对数据进行动态的匿名化,限制数据分析人员可以获得的数据范围,同时更好的保护数据隐私。

A multi domain data privacy protection method for cloud platform

【技术实现步骤摘要】
一种面向云平台的多域数据隐私保护方法
本专利技术涉及一种面向云平台的多域数据隐私保护方法,涉及多域数据隐私保护

技术介绍
随着云计算的发展和广泛使用,更多用户数据被收集和存储到云平台中,其方便了对数据的使用和共享,同时通过数据挖掘等方法分析数据为用户带来了便利,也为企业带来了收益;然而随着存储和处理的数据量越来越大,通过外部数据表识别出数据中用户信息的链接攻击等时有发生,使用户信息面临隐私泄露的风险,也给企业的效益和信誉造成了极大的损失。因此,对于在云平台上产生和存储大规模数据的企业和组织而言,保证正常数据使用的同时,降低用户数据隐私泄露的可能性,对于用户数据隐私的保护和企业级应用技术的发展有着重要的意义。不同领域的大量记录表型数据,都有存储在云平台上的需求,来方便对数据提供者收集数据和数据使用者访问分析数据。现有多域数据隐私保护方法一般采用静态匿名来发布数据,不够灵活,不能限制数据分析人员获得的数据范围,一般没有设置将匿名数据恢复至原始数据的过程,无法满足使用原始数据的需求。
技术实现思路
本专利技术要解决的技术问题是:本专利技术为了解决现有的多域数据隐私保护方法一般采用静态本文档来自技高网...

【技术保护点】
1.一种面向云平台的多域数据隐私保护方法,其特征在于:所述方法的实现过程为:步骤一、数据匿名化处理,其包括数据静态匿名化步骤,过程为:首先对原始数据集进行预处理;然后为数据集的各个QI属性构建泛化层次;之后进行满足k‑匿名原则的脱敏处理:根据已有的泛化层次信息,构建相应的数据结构以实现满足k匿名原则的匿名算法,来为每个属性选择具体的泛化等级,并根据得到的泛化等级,对原始数据集的数据值进行泛化,将原始数据集转化成相对应的匿名数据集;步骤二、原始数据恢复处理:在原始数据集转化成匿名数据集的过程中建立两者的对应关系来实现原始数据的恢复,其过程为:首先,对原始数据集中不同的数值进行字典编码,将具体数值...

【技术特征摘要】
1.一种面向云平台的多域数据隐私保护方法,其特征在于:所述方法的实现过程为:步骤一、数据匿名化处理,其包括数据静态匿名化步骤,过程为:首先对原始数据集进行预处理;然后为数据集的各个QI属性构建泛化层次;之后进行满足k-匿名原则的脱敏处理:根据已有的泛化层次信息,构建相应的数据结构以实现满足k匿名原则的匿名算法,来为每个属性选择具体的泛化等级,并根据得到的泛化等级,对原始数据集的数据值进行泛化,将原始数据集转化成相对应的匿名数据集;步骤二、原始数据恢复处理:在原始数据集转化成匿名数据集的过程中建立两者的对应关系来实现原始数据的恢复,其过程为:首先,对原始数据集中不同的数值进行字典编码,将具体数值与整数编码对应,并根据字典生成原始数据表和属性泛化层次表;在匿名过程中生成与原始数据表具有相同行索引的数据转化表,来记录每一行原始数据泛化后所产生的匿名数据,并维持原始数据表中元组与泛化后的数据转化表中的元组具有相同的行索引,来实现原始数据元组与匿名数据元组索引的一一对应关系,从而实现对原始数据的恢复。2.根据权利要求1所述的一种面向云平台的多域数据隐私保护方法,其特征在于:在步骤一中,对原始数据集进行预处理的具体过程为,提取或收集结构化的记录表型数据,将所述记录表型数据中的数值型代码转换成其所代表的具有实际意义的数值,删除其中属性值为空值的个体,并且将原始数据集导出到csv文件进行存储。3.根据权利要求2所述的一种面向云平台的多域数据隐私保护方法,其特征在于:在步骤一中,构建属性泛化层次的具体过程为:对不同类型的属性值采用不同的泛化方式,针对整数型有序数据,采用区间的泛化方式;针对字符型数据,采用语义上的范围变化来进行泛化;在泛化方法的选择上,采用要求所有叶子节点的原始属性值,要泛化为同一等级的泛化值的全域泛化。4.根据权利要求3所述的一种面向云平台的多域数据隐私保护方法,其特征在于:在步骤一中,满足k-匿名原则的脱敏处理过程中,所述匿名算法具体为:匿名算法通过遍历由属性泛化层次组成的泛化格,根据预先定义的属性泛化层次和节点中各个属性所选择的泛化层次等级,来遍历原始数据集对其进行泛化,对每个单独节点进行是否满足k匿名原则的验证,然后根据当前节点匿名与否来在整个搜索空间上进行剪枝;匿名算法整体由四部分组成:其中路径寻找算法负责构建一条由未被标记的节点组成的路径;节点审查算法负责审核输入节点是否满足相应的匿名原则...

【专利技术属性】
技术研发人员:张伟哲何慧方滨兴刘川意郭睿
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1