当前位置: 首页 > 专利查询>浙江大学专利>正文

一种隐私保护下的可交互微数据发布系统技术方案

技术编号:39244643 阅读:9 留言:0更新日期:2023-10-30 11:57
本发明专利技术公开了一种隐私保护下的可交互微数据发布系统,该系统用于获取用户查询的SQL语句,过滤掉不符合语法要求的其他SQL,基于模拟执行获得对应的语义信息,记录用户的过往查询并综合多次查询的信息泄露,预防可能的推理攻击,记录下系统的历史决策来提高效率并保持决策的一致性,用一或多个隐私指标衡量隐私泄露,向衡量隐私泄露的函数添加随机扰动并根据预定阈值决定是否返回执行结果给用户。预定阈值决定是否返回执行结果给用户。预定阈值决定是否返回执行结果给用户。

【技术实现步骤摘要】
一种隐私保护下的可交互微数据发布系统


[0001]本专利技术属于隐私与安全
,尤其涉及一种隐私保护下的可交互微数据发布系统。

技术介绍

[0002]在过去几十年中,数据逐渐被认识为数字经济中的重要资源。大量的数据在许多商业活动中被收集、共享、交换、重复使用和交易。与此同时,当敏感数据被收集和处理时,人们越来越关注隐私问题。越来越多关于隐私增强技术的研究正在涌现,以最小化数据泄露的风险,例如隐私保护数据发布(PPDP),差分隐私和多方协作分布式数据库等。
[0003]隐私保护数据发布(PPDP)是一系列研究,提供了发布有用信息同时保持一定隐私水平的方法和指标。根据数据发布模式,PPDP主要可以分为两类:交互模型和非交互模型。(i)在典型的交互模型中,数据请求者仅被赋予(自适应)访问具有统计查询的数据库的权限,在发布结果之前,系统通常需要对查询响应进行一些隐私处理,例如差分隐私。(ii)在典型的非交互模型中,数据集经过一系列去识别和匿名化处理,以打破数据与最初关联数据的个体之间的联系,然后处理后的数据将被发布给数据分析师。最广泛使用的隐私指标包括k

匿名性,l

多样性和t

闭近度。
[0004]《L.Sweeney,“k

anonymity:A model for protecting privacy,”Int.J.Uncertain.Fuzziness Knowl.Based Syst.,vol.10,no.5,pp.557

570,2002.[Online].Available:https://doi.org/10.1142/S0218488502001648》提出了不可交互的微数据发布模型中最著名的k匿名模型,它通过抹除标识符,将准标识符进行了匿名操作后进行发布,使得发布的每一个等价类中的数据行都不小于k个,使得用户无法区分出该行数据属于哪一个真实的个体,可以防止身份公开。该方案的缺点为:安全性上:无法防御同质攻击,背景攻击;交互性上:属于不可交互。
[0005]《A.Machanavajjhala,D.Kifer,J.Gehrke,and M.Venkitasubramaniam,“L

diversity:Privacy beyond k

anonymity,”ACM Trans.Knowl.Discov.Data,vol.1,no.1,p.3,2007.[Online].Available:https://doi.org/10.1145/1217299.1217302》提出了不可交互的微数据发布模型中的l多样性模型,它是对k匿名模型的升级。它通过抹除标识符,将准标识符进行了匿名操作后进行发布,使得发布的每一个等价类中的数据的敏感属性需要有l个表现良好的值,可以防止身份公开和部分属性公开。该方案的缺点为:安全性上:无法防御相似化攻击和Skewness攻击;实现性上困难;可交互性上:不可交互
[0006]《N.Li,T.Li,and S.Venkatasubramanian,“t

closeness:Privacy beyond k

anonymity and l

diversity,”in Proceedings of the 23rd International Conference on Data Engineering,ICDE 2007,The Marmara Hotel,Istanbul,Turkey,April 15

20,2007,R.Chirkova,A.Dogac,M.T.Ozsu,
¨
and T.K.Sellis,Eds.IEEE Computer Society,2007,pp.106

115.[Online].Available:https://doi.org/10.1109/ICDE.2007.367856》提出了不可交互的微数据发布模型中的t相近模型,它是对k匿名模型
和l多样性模型的升级。它通过抹除标识符,将准标识符进行了匿名操作后进行发布,使得发布的每一个等价类中的数据的敏感属性的分布与敏感属性的全局分布的统计距离不大于t。该方案的缺点为:安全性上:可能受到语义攻击;实现难度上:困难;数据可用性上:低;可交互性上:不可交互。

技术实现思路

[0007]针对现有技术存在的问题,本申请实施例的目的是提供一种隐私保护下的可交互微数据发布系统。
[0008]本申请实施例提供一种隐私保护下的可交互微数据发布系统,其特征在于,该系统用于获取用户查询的SQL语句,过滤掉不符合语法要求的其他SQL,基于模拟执行获得对应的语义信息,记录用户的过往查询并综合多次查询的信息泄露,预防可能的推理攻击,记录下系统的历史决策来提高效率并保持决策的一致性,用一或多个隐私指标衡量隐私泄露,向衡量隐私泄露的函数添加随机扰动并根据预定阈值决定是否返回执行结果给用户。
[0009]进一步地,包括预处理层、语义分析层、信息合成与推理层、查询历史层、隐私指标量化层和后处理层;
[0010]所述预处理层用于获取用户查询的SQL语句,过滤其中不满足语法要求的SQL并重写其中含有where从句的SQL;
[0011]所述语义分析层用于分析所述预处理层输出的SQL语句中SQL布尔阵列查询的语义,从而将SQL语句转化为新约束;
[0012]所述信息合成与推理层用于将所述新约束存储到该用户的记录表中,以使得所述新约束与所述记录表中的约束进行合成,对得到的合成约束进行基于函数依赖的推理,补全该合成约束的可能延伸约束,得到完整约束,其中所述合成约束为与所述记录表中的约束进行合成产生了新信息的约束;
[0013]所述查询历史层用于比对所述完整约束和许可列表中的约束,忽略所述完整约束中在所述许可列表的合法约束;比对所述完整约束和拒绝列表中的约束,将所述完整约束中在所述拒绝列表的不合法约束对应的新约束输出至后处理层,将其余未知合法性约束输出至信息泄露指标层,其中所述许可列表中记录所有未被拒绝的查询对应的约束,所述拒绝列表中记录所有被拒绝的查询对应的约束;
[0014]所述信息泄露指标层用于使用隐私指标量化所述未知合法性约束的隐私泄露并输出风险分数;
[0015]所述后处理层用于对所述风险分数添加噪音,判断带噪音的风险分数是否超过预定阈值,对于带噪音的风险分数未超过预定阈值的约束,接收用户的查询请求并输出对应的查询结果至用户;对于带噪音的风险分数超过预定阈值的约束和所述不合法约束对应的新约束,判断该新约束与合法信息记录表中的约束判定偏序关系,若该新约束为合法约束,则接收用户的查询请求并输出对应的查询结果至用户,反之则拒绝该查询。
[0016]进一步地,在所述预处理层中,通过字符串匹配的方式过滤不满本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种隐私保护下的可交互微数据发布系统,其特征在于,该系统用于获取用户查询的SQL语句,过滤掉不符合语法要求的其他SQL,基于模拟执行获得对应的语义信息,记录用户的过往查询并综合多次查询的信息泄露,预防可能的推理攻击,记录下系统的历史决策来提高效率并保持决策的一致性,用一或多个隐私指标衡量隐私泄露,向衡量隐私泄露的函数添加随机扰动并根据预定阈值决定是否返回执行结果给用户。2.根据权利要求1所述的系统,其特征在于,包括预处理层、语义分析层、信息合成与推理层、查询历史层、隐私指标量化层和后处理层;所述预处理层用于获取用户查询的SQL语句,过滤其中不满足语法要求的SQL并重写其中含有where从句的SQL;所述语义分析层用于分析所述预处理层输出的SQL语句中SQL布尔阵列查询的语义,从而将SQL语句转化为新约束;所述信息合成与推理层用于将所述新约束存储到该用户的记录表中,以使得所述新约束与所述记录表中的约束进行合成,对得到的合成约束进行基于函数依赖的推理,补全该合成约束的可能延伸约束,得到完整约束,其中所述合成约束为与所述记录表中的约束进行合成产生了新信息的约束;所述查询历史层用于比对所述完整约束和许可列表中的约束,忽略所述完整约束中在所述许可列表的合法约束;比对所述完整约束和拒绝列表中的约束,将所述完整约束中在所述拒绝列表的不合法约束对应的新约束输出至后处理层,将其余未知合法性约束输出至信息泄露指标层,其中所述许可列表中记录所有未被拒绝的查询对应的约束,所述拒绝列表中记录所有被拒绝的查询对应的约束;所述信息泄露指标层用于使用隐私指标量化所述未知合法性约束的隐私泄露并输出风险分数;所述后处理层用于对所述风险分数添加噪音,判断带噪音的风险分数是否超过预定阈值,对于带噪音的风险分数未超过预定阈值的约束,接收用户的查询请求并输出对应的查询结果至用户;对于带噪音的风险分数超过预定阈值的约束和所述不合法约束对应的新约束,判断该新约束与合法信息记录表中的约束判定偏序关系,若该新约束为合法约束,则接收用户的查询请求并输出对应的查询结果至用户,反之则拒绝该查询。3.根据权利...

【专利技术属性】
技术研发人员:张秉晟张钰任奎
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1