面向结构化仿真数据的质量评估方法、系统和设备技术方案

技术编号:33123386 阅读:41 留言:0更新日期:2022-04-17 00:29
本发明专利技术提供了一种面向结构化仿真数据的质量评估方法和系统,包括:根据原始数据构建仿真数据生成模型;数据拥有者使用包含隐私信息的原始数据对仿真数据生成模型进行训练,得到仿真数据;将原始数据和仿真数据输入评估系统,评估仿真数据的可用性和仿真数据的隐私性,选择质量最高的仿真数据发布;所述原始数据和仿真数据为结构化数据,由若干条数据记录组成,每条记录有若干字段,仿真数据的字段与原始数据的字段完全相同。本发明专利技术使用仿真数据代替原始数据参与数据流通进行质量评估,由于仿真数据的数据条目都是合成的,不与现实中的任何实体产生关联,也不需要其他的假设或先验知识,有效避免了隐私泄露的风险,评估全面、可靠,通用性好。通用性好。通用性好。

【技术实现步骤摘要】
面向结构化仿真数据的质量评估方法、系统和设备


[0001]本专利技术涉及数据安全
,具体涉及一种面向关系型数据库水印的适配方法、设备及存储介质。

技术介绍

[0002]大数据时代,数据拥有者与合作者分享数据或对外发布数据是很常见的情况。传统的数据匿名化技术无法理想地保护隐私,对于拥有相关其他数据源知识的攻击者来说,很有可能推测出经过匿名化处理的标识符或准标识符,即重识别攻击;而数据匿名化技术则会大幅降低数据的可用性。
[0003]中国国家知识产权局公开的专利文献CN110222058A提出了一种基于FP

growth的多源数据关联隐私泄露风险评估系统,该系统需要与外部关联数据源进行关联分析,分析结果与收集的外部数据源高度相关,不具备通用性;而且仅能针对与外部数据源的关联性这一方面进行隐私评估,评估维度单一;公开的专利文献CN110287729A提出了一种面向数据使用需求的隐私泄露风险评估方法,该方法只能对于已知原始数据的隐私特征泄露风险进行评估,对于潜在的隐私风险无法评估;而且只能对于已知的数据操作风险进行评估本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向结构化仿真数据的质量评估方法,其特征在于,包括步骤:根据原始数据构建仿真数据生成模型;数据拥有者使用包含隐私信息的原始数据对仿真数据生成模型进行训练,得到仿真数据;将所述原始数据和所述仿真数据输入评估系统,评估所示仿真数据的可用性和所述仿真数据的隐私性,选择质量最高的仿真数据发布;其中,所述原始数据和所述仿真数据为结构化数据,由若干条数据记录组成,每条记录有若干字段,所述仿真数据的字段与所述原始数据的字段完全相同。2.如权利要求1所述的面向结构化仿真数据的质量评估方法,其特征在于,在评估所述仿真数据的可用性和所述仿真数据的隐私性步骤中,还包括将数据拥有者对数据用途的假设输入评估系统。3.如权利要求1所述的面向结构化仿真数据的质量评估方法,其特征在于,根据所述仿真数据与所述原始数据在潜在的数据分析任务中效果相似程度评估所述仿真数据的可用性。4.如权利要求1所述的面向结构化仿真数据的质量评估方法,其特征在于,根据所述仿真数据暴露原始数据信息的风险程度评估所述仿真数据的隐私性。5.如权利要求1

4任一项所述的面向结构化仿真数据的质量评估方法,其特征在于,所述仿真数据的可用性评估包括:评估在特定分析任务中所述仿真数据和所述原始数据的效果相似程度;评估所述原始数据中的字段关联关系在所述仿真数据中的保留程度;评估各字段中的所述仿真数据与所述原始数据的统计量是否一致;评估在不同的映射情况下,所述仿真数据与所述原始数据的相似程度;所述仿真数据的隐私性评估包括:评估特定分析任务中恶意分析者对隐私字段的真实预测效果;评估所述仿真数据防御成员推断攻击的效果;评估所述仿真数据记录暴露所述原始数据条目的风险程度;评估在不同的映射情况下,所述仿真数据与所述原始数据的相似程度。6.一种面向结构化仿真数据的质量评估系统,其特征在...

【专利技术属性】
技术研发人员:刘川意韩培义周宇星
申请(专利权)人:哈尔滨工业大学深圳
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1