基于随机响应机制本地差分隐私的数据库水印系统技术方案

技术编号:24207359 阅读:121 留言:0更新日期:2020-05-20 15:15
本发明专利技术公开了一种基于随机响应机制本地差分隐私的数据库水印系统,数据拥有者利用数据库预处理模块对待发布的原始数据库进行属性排序获得排序数据库;由本地差分隐私与水印嵌入模块针对排序数据库的敏感属性值实施基于随机响应机制的本地差分隐私,获得隐私保护数据库,依据隐私保护数据库中的数据特征向隐私保护数据库中嵌入水印信息,获得带水印信息数据库并发布到云端;针对被怀疑数据库,由数据拥有者或权威取证机构根据带水印信息数据库所对应的密钥和水印位置数组,从被怀疑数据库中提取水印信息,从而进行版权追踪和数据库完整性验证。本发明专利技术能够对数据库的隐私数据安全性、数据完整性及来源可靠性等做出综合保护。

Database watermarking system based on local differential privacy of random response mechanism

【技术实现步骤摘要】
基于随机响应机制本地差分隐私的数据库水印系统
本专利技术属于数据库安全领域,特别是涉及一种基于随机响应机制本地差分隐私的数据库水印系统及其实施方法。
技术介绍
计算机网络技术和大数据技术的快速发展为数据在世界范围内的迅速传播开辟了便捷的途径,然而,日趋流行的大数据共享和交易也导致了信息安全和数据库版权保护的问题日趋严重。近年来,数据泄露的事件频繁发生,甚至发生在包含大量敏感数据的医疗领域以及服务行业。数据库作为政府、企业以及个人获取和传递信息的重要载体,其创建、传输和共享显著增加的同时也带来了安全风险,如数据被盗窃、非法复制和侵犯版权。目前针对数据库的隐私保护技术包括k-匿名、l-diversity匿名、t-closeness匿名和差分隐私等方法,而针对数据库版权保护技术主要依赖于数据库水印技术。尽管这些技术都得到了很好的发展,但是,目前缺少一种方法能够在保持较高数据可用性的同时解决数据库隐私问题以及版权保护问题。目前的差分隐私技术和数据库水印技术还存在以下缺点:1、当数据库中包含大量的用户个人敏感信息时,隐私保护非常重要且数据库共享时数据库溯源、版权保护以及数据的完整性验证等问题也需要解决。目前的数据库水印技术只能对数据库的完整性进行验证以及对数据库进行版权保护,但不能保护隐私。2、目前尚无既能提供数据库隐私保护,又能提供原始数据版权追踪、完整性验证的数据库水印方法。3、目前的差分隐私技术进行隐私保护时造成的数据失真比较大。4、目前的数据库水印技术的鲁棒性还有待进一步提高,且嵌入水印导致失真使数据质量下降,不能满足大数据共享环境下数据挖掘和统计分析的需求,还有待进一步改进。针对以上缺点,本申请专利技术人公开号为CN109033766A、公开日为20181218的专利技术专利申请中公开了“一种基于本地差分隐私的数据库水印方法”,其是基于拉普拉斯机制的本地差分隐私的数据库水印方法的专利技术专利申请,以提供改进方案,但其技术方案仍然存在不足,一是该方法虽然在提供版权保护的同时提供了较好数据库隐私保护,但依然没有解决传统差分隐私机制造成数据失真较大的问题;二是该方法中数据库水印技术具有很好的鲁棒性,但还有进一步改进的空间。
技术实现思路
本专利技术是为避免上述现有技术所存在的问题,提供一种基于随机响应机制本地差分隐私的数据库水印系统,以期对数据库的隐私数据安全性、数据完整性及来源可靠性等做出综合保护。本专利技术为解决技术问题采用如下技术方案:本专利技术基于随机响应机制本地差分隐私的数据库水印系统的特点是:所述数据库水印系统包括:数据库预处理模块、本地差分隐私与水印嵌入模块和水印提取模块;数据拥有者利用所述数据库预处理模块针对待发布的原始数据库A进行属性排序获得排序数据库A1,并获得排序数据库A1的敏感属性,根据随机生成的密钥对所述排序数据库A1进行元组分组,确定所述排序数据库A1中各元组编号;由所述本地差分隐私与水印嵌入模块针对所述排序数据库A1的敏感属性值实施基于随机响应机制的本地差分隐私,获得隐私保护数据库B,依据所述隐私保护数据库B中的数值特性向隐私保护数据库B中嵌入水印信息,获得带水印信息数据库C,由所述数据拥有者将带水印信息数据库C发布到云端;在发现有被怀疑数据库D时,由所述数据拥有者或权威取证机构根据带水印信息数据库C所对应的密钥和水印位置数组,由水印提取模块从经过所述数据库预处理模块处理后的被怀疑数据库D中提取水印信息,从而进行版权追踪和数据库完整性验证;所述带水印信息数据库C所对应的密钥和水印位置数组是由数据拥有者通过安全信道传递给权威取证机构;所述被怀疑数据库D是指疑似为带水印信息数据库C的非法传播、或为带水印信息数据库C被篡改数据的数据库。本专利技术基于随机响应机制本地差分隐私的数据库水印系统的特点也在于:利用式(1)确定所述排序数据库A1中各元组编号ni:ni=H(Ks||H(Ks||tu.PK))%Ng(1)式(1)中:ni=1,2…Ng,Ng为水印信息长度,以i表征排序数据库A1中第i行元组行号;H()表示hash算法,“||”是连接符号,Ks是密钥,tu.PK是元组的主键。本专利技术基于随机响应机制本地差分隐私的数据库水印系统的特点也在于按如下方式获得隐私保护数据库B:针对排序数据库A1中各元组所对应的敏感属性值xi实施基于随机响应机制的本地差分隐私,按如下方式获得一一对应的具有隐私保护的各属性值yi:依据满足式(2)的概率pu,v将敏感属性值xi修改为属性值yi:式(2)中:t为敏感属性值xi能取到的最大整数值,xi∈(1,2,…,t)是指属性值xi取从1到t的整数值,xi∈(0,1)是指属性值xi取值为0或1;pu,v=p[yi=u,xi=v]为将取值为v的敏感属性值xi修改为取值为u的属性值yi的概率值;pu,v满足0<pu,v<1,且m为xi的取值范围的长度,并且当u=v=b时,pu,v=pb,b>0.5;ε是隐私保护预算值,ε不小于针对排序数据库A1中所有元组的敏感属性值xi一一对应获得各属性值yi,从而得到隐私保护数据库B,且隐私保护数据库B中各元组编号与排序数据库A1中各元组编号相同。本专利技术基于随机响应机制本地差分隐私的数据库水印系统的特点也在于:按如下步骤向隐私保护数据库B中嵌入水印信息得到带水印信息数据库C:步骤4.1、初始化水印位置数组mark;步骤4.2、计算获得属性值yi造成的数据失真值di为:di=|yi-xi|;数据库拥有者自定义属性值失真范围为ξ,若数据失真值di超出属性值失真范围ξ,则在水印位置数组mark中记录属性值yi所在隐私保护数据库B中的位置,并在属性值yi中按如下方式嵌入水印位;根据隐私保护数据库B中各元组编号ni进行水印嵌入,具有相同元组编号的元组嵌入相同的水印位w;水印嵌入过程为:首先根据要嵌入的水印位w修改属性值yi得到更新属性值y′i,当嵌入的水印为1时,将属性值yi变为奇数作为更新属性值y′i,当嵌入的水印为0时,将属性值yi变为偶数作为更新属性值y′i;针对所有元组完成水印嵌入得到带水印信息数据库C。本专利技术基于随机响应机制本地差分隐私的数据库水印系统的特点也在于按如下方式进行版权追踪和数据库完整性验证:步骤5.1、数据使用者、权威取证机构或数据拥有者针对带水印信息数据库C从云端下载得到下载数据库D′w,根据下载数据库D′w的属性名的升序或者降序对属性进行排序得到排序下载数据库D″w;所述排序下载数据库D″w与所述排序数据库A1中的属性排序相同,且各元组编号相同;步骤5.2、拥有密钥和水印位置数组的数据拥有者或权威取证机构从排序下载数据库D″w中提取水印信息;按照排序下载数据库D″w中元组编号ni依次对每组中的所有元组进行对应水印位的提取;如果每组中各元组的属性位置信息存在于水印位置本文档来自技高网
...

【技术保护点】
1.一种基于随机响应机制本地差分隐私的数据库水印系统,其特征是:/n所述数据库水印系统包括:数据库预处理模块(a)、本地差分隐私与水印嵌入模块(b)和水印提取模块(c);/n数据拥有者利用所述数据库预处理模块(a)针对待发布的原始数据库A进行属性排序获得排序数据库A1,并获得排序数据库A1的敏感属性,根据随机生成的密钥对所述排序数据库A1进行元组分组,确定所述排序数据库A1中各元组编号;/n由所述本地差分隐私与水印嵌入模块(b)针对所述排序数据库A1的敏感属性值实施基于随机响应机制的本地差分隐私,获得隐私保护数据库B,依据所述隐私保护数据库B中的数值特性向隐私保护数据库B中嵌入水印信息,获得带水印信息数据库C,由所述数据拥有者将带水印信息数据库C发布到云端;/n在发现有被怀疑数据库D时,由所述数据拥有者或权威取证机构根据带水印信息数据库C所对应的密钥和水印位置数组,由水印提取模块(c)从经过所述数据库预处理模块(a)处理后的被怀疑数据库D中提取水印信息,从而进行版权追踪和数据库完整性验证;/n所述带水印信息数据库C所对应的密钥和水印位置数组是由数据拥有者通过安全信道传递给权威取证机构;/n所述被怀疑数据库D是指疑似为带水印信息数据库C的非法传播、或为带水印信息数据库C被篡改数据的数据库。/n...

【技术特征摘要】
1.一种基于随机响应机制本地差分隐私的数据库水印系统,其特征是:
所述数据库水印系统包括:数据库预处理模块(a)、本地差分隐私与水印嵌入模块(b)和水印提取模块(c);
数据拥有者利用所述数据库预处理模块(a)针对待发布的原始数据库A进行属性排序获得排序数据库A1,并获得排序数据库A1的敏感属性,根据随机生成的密钥对所述排序数据库A1进行元组分组,确定所述排序数据库A1中各元组编号;
由所述本地差分隐私与水印嵌入模块(b)针对所述排序数据库A1的敏感属性值实施基于随机响应机制的本地差分隐私,获得隐私保护数据库B,依据所述隐私保护数据库B中的数值特性向隐私保护数据库B中嵌入水印信息,获得带水印信息数据库C,由所述数据拥有者将带水印信息数据库C发布到云端;
在发现有被怀疑数据库D时,由所述数据拥有者或权威取证机构根据带水印信息数据库C所对应的密钥和水印位置数组,由水印提取模块(c)从经过所述数据库预处理模块(a)处理后的被怀疑数据库D中提取水印信息,从而进行版权追踪和数据库完整性验证;
所述带水印信息数据库C所对应的密钥和水印位置数组是由数据拥有者通过安全信道传递给权威取证机构;
所述被怀疑数据库D是指疑似为带水印信息数据库C的非法传播、或为带水印信息数据库C被篡改数据的数据库。


2.根据权利要求1所述的基于随机响应机制本地差分隐私的数据库水印系统,其特征是:
利用式(1)确定所述排序数据库A1中各元组编号ni:
ni=H(Ks||H(Ks||tu.PK))%Ng(1)
式(1)中:
ni=1,2…Ng,Ng为水印信息长度,以i表征排序数据库A1中第i行元组行号;
H()表示hash算法,“||”是连接符号,Ks是密钥,tu.PK是元组的主键。


3.根据权利要求2所述的基于随机响应机制本地差分隐私的数据库水印系统,其特征是按如下方式获得隐私保护数据库B:
针对排序数据库A1中各元组所对应的敏感属性值xi实施基于随机响应机制的本地差分隐私,按如下方式获得一一对应的具有隐私保护的各属性值yi:
依据满足式(2)的概率pu,v将敏感属性值xi修改为属性值yi:



式(2)中:
t为敏感属性值xi能取到的最大整数值,xi∈(1,2,…,t)是指属性值xi取从1到t的整数值,xi∈(0,1)是指属性值xi取值为0或1;
pu,v=p[yi=u,xi=v]为将取值为v的敏感属性值xi修改为取值为u的属性值yi的概率值;
pu,v满足0<pu,v<1,且m为xi的取值范围的长度,并且当u=v=b时,pu,v=pb,b>0.5;
ε是隐私保护预算值,ε不小于
针对排序数据库A1中所有元组的敏感属性值xi一一对应获得各属性值yi,从而得到隐私保护数据库B,且隐私保护数据库B中各元组编号与排序数据库A1中各元组编号相同。


4.根据权利要求2所述的基于随机响应机制本地差分隐私的数据库水印系统,其特征是,按如下步骤向隐私保护数据库B中嵌入水印信息得到带水印信息数据库C:
步骤4.1、初始化水印位置数组mark;
步骤4.2、计算获得属性值yi造成的数据失真值di为:di=|yi-xi|;数据库拥有者自定义属性值失真范围为ξ,若数据失真值di超出属性值失真范围ξ,则在水印位置数组mark中记录属性值yi所在隐私保护数据库B中的位置,并在属性值yi中按如下方式嵌入水印位;
根据隐私保护数据库B中各元组编号ni进行水印嵌入,具有相同元组编号的元组嵌入相同的水印位w;水印嵌入过程为:首先根据要嵌入的水印位w修改属性值yi得到更新属性值y′i,当嵌入的水...

【专利技术属性】
技术研发人员:胡东辉严凇赵丹李萌郑淑丽
申请(专利权)人:合肥工业大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1