当前位置: 首页 > 专利查询>山东大学专利>正文

基于混合结构满足差分隐私的分布式基数直方图估计方法技术

技术编号:41068232 阅读:16 留言:0更新日期:2024-04-24 11:23
本发明专利技术提供了一种基于混合结构满足差分隐私的分布式基数直方图估计方法,属于数据处理技术领域。本发明专利技术将多个数据拥有者的数据组成数据并集,按照某个数据属性的取值,将所述数据并集划分成多个子集并估计不同子集的基数得到初始直方图;根据初始直方图,根据设定阈值对桶进行分簇,将多个基数小于阈值的桶合并为基数和与阈值差异在设定范围内的簇,将基数大于阈值的桶单独分簇;对每个簇中的桶的基数进行更新,提取更新后的某个数据属性对应的直方图;本发明专利技术通过将差分隐私和安全多方计算结合并应用于分布式直方图估计,保证了数据拥有者的数据在估计过程和结果上的隐私,并且保证了数据的可用性。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别涉及一种基于混合结构满足差分隐私的分布式基数直方图估计方法


技术介绍

1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
,并不必然构成现有技术。

2、基数是指数据库表中满足查询条件的非重复元素的数量,基数估计是查询优化器的重要组成部分,基数估计会被应用于基于代价的优化方案以及查询计划选择部分。

3、基于直方图的基数估计将数据划分为不同的桶,而后统计桶中样本出现的频率,并假设桶内数据均匀分布。当存在多个计算方和数据拥有者时,每个数据拥有者拥有一个数据集合,集合由一系列包含多个离散属性(连续属性通过将域离散为固定数量的等宽范围转化为离散属性)的数据记录组成,比如医院的患者记录等。

4、专利技术人发现,实际应用中,数据分析师希望获得数据记录在某个属性上的分布情况,以挖掘或提取数据背后的大量潜在信息,为群体和个体提供准确可靠的查询服务,因此计算方需要收集数据拥有者所拥有的数据并进行估计;然而,数据拥有者的数据中往往包含个人敏感信息,数据拥有者不希望将这些敏感数据分享给计算方,使得计算方无法对数据本文档来自技高网...

【技术保护点】

1.一种基于混合结构满足差分隐私的分布式基数直方图估计方法,其特征在于,包括以下过程:

2.如权利要求1所述的基于混合结构满足差分隐私的分布式基数直方图估计方法,其特征在于,

3.如权利要求2所述的基于混合结构满足差分隐私的分布式基数直方图估计方法,其特征在于,

4.如权利要求1所述的基于混合结构满足差分隐私的分布式基数直方图估计方法,其特征在于,

5.如权利要求1所述的基于混合结构满足差分隐私的分布式基数直方图估计方法,其特征在于,

6.如权利要求5所述的基于混合结构满足差分隐私的分布式基数直方图估计方法,其特征在于,

...

【技术特征摘要】

1.一种基于混合结构满足差分隐私的分布式基数直方图估计方法,其特征在于,包括以下过程:

2.如权利要求1所述的基于混合结构满足差分隐私的分布式基数直方图估计方法,其特征在于,

3.如权利要求2所述的基于混合结构满足差分隐私的分布式基数直方图估计方法,其特征在于,

4.如权利要求1所述的基于混合结构满足差分隐私的分布式基数直方图估计方法,其特征在于,

5.如权利要求1所述的基于混合结构满足差分隐私的分布式基数直方图估计方法,其特征在于,

6.如权利要求5所述的基于混合结构满足差分隐私的分布式基数直方图估计方法,其特征在于,

【专利技术属性】
技术研发人员:唐朋金崇实郭山清胡程瑜
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1