System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于数据库隐私保护,具体涉及一种基于动态数据库直方图发布的差分隐私方法、系统及设备。
技术介绍
1、随着人工智能与大数据技术的迅速发展,使得数据的收集与分析变得尤其容易,服务机构通过对数据收集者所收集和汇聚的数据库进行分析和查询,以便于开发出更具有个性化的工具。然而,随着计算机技术的不断进步,数据库技术一直在不断变化,数据的查询方式也在不断的探索和发展。与静态数据库不同,动态数据库是一种能够根据需要动态更新和修改的数据库。动态数据库允许数据的添加、删除和修改,以满足不断变化的需求。动态数据库通常应用于需要频繁更新和查询数据的场景,如在线交易系统、社交网络等。数据分析者(或第三方的商业组织)通过向拥有动态数据库的可信任服务器提出动态查询请求,服务器可以及时向其响应查询结果。然而,不可信的数据分析者可能会从多个响应结果中推测出用户的隐私信息,进而威胁到用户的财产和自身安全。针对这一问题,差分隐私技术通过扰动查询结果的方式以确保用户的数据和隐私安全。目前,差分隐私着眼于面向静态数据的聚合查询等研究,而涉及动态数据的数据查询和数据发布的工作寥寥无几。
2、随着数据库的不断演变,查询方式也在不断变化,其中直方图也是计数查询的一种形式。动态数据库中的数据查询广泛应用在oltp(on-line transaction processing,联机事务处理)中,而如何在动态数据中实现用户隐私保护的同时发布直方图已成为一种差分隐私研究的新思路。目前,在有限的时间 t内,基于动态数据直方图发布的差分隐
3、针对噪声引入过多的问题,目前的差分隐私方案集中于时间节点采样的方式。基于时间节点采样的差分隐私方案的基本思路为:当该时间节点被采样命中,对该时间节点的数据进行扰动处理,反之,不需要对数据进行处理,依据前一时刻被采样命中的数据结果进行查询响应。但该方案存在的缺陷包括,只使用某些时间样本的数据来进行分析或查询,这可能会导致分析结果的准确性降低。因此,并不能从本质上改善噪声对动态数据库查询的影响。
4、除此之外,上述的差分隐私直方图发布方案只能适用于某一时间节点的查询,并不适用于对任意范围时间节点的更新数据进行查询。如果对任意范围时间的数据进行查询,其方案只能通过对该范围中的所有时间点的数据均进行查询之后,再对所有的扰动结果进行汇总聚合。但是,该方案查询结果的误差与查询范围长度成正比,所以在针对较长的范围计数查询时会额外引入过多的噪声,从而导致查询结果的准确性降低。与此同时,对于动态数据库的查询,服务器也不可以及时的进行响应反馈。
技术实现思路
1、本专利技术的目的在于针对上述现有技术中的问题,提供一种基于动态数据库直方图发布的差分隐私方法、系统及设备,可以通过直方图的发布结果对某一时间点的数据进行计数查询以及任意节点间的范围查询,并采用构建时间树的结构降低噪声,提高数据查询的精度。
2、为了实现上述目的,本专利技术有如下的技术方案:
3、第一方面,本专利技术实施例提供一种基于动态数据库直方图发布的差分隐私方法,包括:
4、收到任意时间范围基于直方图的数据查询请求后,根据时间节点构建树型结构;
5、统计并汇总树型结构所有时间节点的直方图;
6、对每个时间节点的直方图添加满足差分隐私的噪声,得到加噪直方图并发布;
7、选择并汇总目标时间节点上的加噪直方图对数据查询请求进行响应。
8、作为一种优选的方案,动态数据库集合 d={ d1, d2, …, dt}为包含 t个时间节点的数据库,其中的任一数据库表示第个时间节点的数据库;所述任意时间范围为,其中,且。
9、作为一种优选的方案,在所述根据时间节点构建树型结构的步骤中,利用二分树的分层结构对时间戳进行划分,按照式将时间戳划分为不相交的周期数据,式中,。
10、作为一种优选的方案,所述对每个时间节点的直方图添加满足差分隐私的噪声包括:
11、按照二分树的分层结构对每个时间节点的直方图添加满足差分隐私的噪声,包括按照时间戳划分的周期数据,,对所划分时间段内所有时间节点的直方图,添加大小为的噪声,为隐私代价,表示服从拉普拉斯分布的函数,得到每个时间节点的加噪直方图。
12、作为一种优选的方案,所述统计并汇总树型结构所有时间节点的直方图包括:
13、对每个时间节点的数据进行直方图的统计,并将直方图存储在树型结构的叶子节点中;根据树型结构对每个叶子节点的直方图进行向上汇总,得到所有叶子节点的直方图,进行向上汇总时的汇总规则为父节点为对应所有子节点之和。
14、作为一种优选的方案,在所述选择并汇总目标时间节点上的加噪直方图对数据查询请求进行响应的步骤中,对每一棵树型结构以自上向下的方式选择查询请求所包含区间的时间节点,选择最少数量的时间节点来表示查询区间。
15、作为一种优选的方案,不受信任的数据分析者向服务器提出任意时间范围基于直方图的数据查询请求,服务器根据动态数据库以扰动的方式发布直方图并向数据分析者响应数据查询请求。
16、第二方面,本专利技术实施例提供一种基于动态数据库直方图发布的差分隐私系统,包括:
17、树型结构构建模块,用于收到任意时间范围基于直方图的数据查询请求后,根据时间节点构建树型结构;
18、直方图汇总模块,用于统计并汇总树型结构所有时间节点的直方图;
19、直方图加噪及发布模块,用于对每个时间节点的直方图添加满足差分隐私的噪声,得到加噪直方图并发布;
20、查询请求响应模块,用于选择并汇总目标时间节点上的加噪直方图对数据查询请求进行响应。
21、第三方面,本专利技术实施例提供一种电子设备,包括:
22、存储器,存储至少一个指令;及处理器,执行所述存储器中存储的指令以实现如第一方面所述基于动态数据库直方图发布的差分隐私方法。
23、第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述基于动态数据库直本文档来自技高网...
【技术保护点】
1.一种基于动态数据库直方图发布的差分隐私方法,其特征在于,包括:
2.根据权利要求1所述基于动态数据库直方图发布的差分隐私方法,其特征在于,动态数据库集合D={D1, D2, …, DT}为包含T个时间节点的数据库,其中的任一数据库表示第个时间节点的数据库;所述任意时间范围为,其中,且。
3.根据权利要求2所述基于动态数据库直方图发布的差分隐私方法,其特征在于,在所述根据时间节点构建树型结构的步骤中,利用二分树的分层结构对时间戳进行划分,按照式将时间戳划分为不相交的周期数据,式中,。
4.根据权利要求3所述基于动态数据库直方图发布的差分隐私方法,其特征在于,所述对每个时间节点的直方图添加满足差分隐私的噪声包括:
5.根据权利要求1所述基于动态数据库直方图发布的差分隐私方法,其特征在于,所述统计并汇总树型结构所有时间节点的直方图包括:
6.根据权利要求1所述基于动态数据库直方图发布的差分隐私方法,其特征在于,在所述选择并汇总目标时间节点上的加噪直方图对数据查询请求进行响应的步骤中,对每一棵树型结构以自上向下的方式选择查询
7.根据权利要求1所述基于动态数据库直方图发布的差分隐私方法,其特征在于,不受信任的数据分析者向服务器提出任意时间范围基于直方图的数据查询请求,服务器根据动态数据库以扰动的方式发布直方图并向数据分析者响应数据查询请求。
8.一种基于动态数据库直方图发布的差分隐私系统,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述基于动态数据库直方图发布的差分隐私方法。
...【技术特征摘要】
1.一种基于动态数据库直方图发布的差分隐私方法,其特征在于,包括:
2.根据权利要求1所述基于动态数据库直方图发布的差分隐私方法,其特征在于,动态数据库集合d={d1, d2, …, dt}为包含t个时间节点的数据库,其中的任一数据库表示第个时间节点的数据库;所述任意时间范围为,其中,且。
3.根据权利要求2所述基于动态数据库直方图发布的差分隐私方法,其特征在于,在所述根据时间节点构建树型结构的步骤中,利用二分树的分层结构对时间戳进行划分,按照式将时间戳划分为不相交的周期数据,式中,。
4.根据权利要求3所述基于动态数据库直方图发布的差分隐私方法,其特征在于,所述对每个时间节点的直方图添加满足差分隐私的噪声包括:
5.根据权利要求1所述基于动态数据库直方图发布的差分隐私方法,其特征在于,所述统计并汇总树型结构所有时间节点的直方图包括:
6...
【专利技术属性】
技术研发人员:张亮,曹晓光,李娇娇,刘涛,吴志刚,徐建忠,郝春辉,李艾功,
申请(专利权)人:杭州世平信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。