群智感知系统中基于连接函数的多维数据本地隐私保护方法技术方案

技术编号:20655270 阅读:34 留言:0更新日期:2019-03-23 06:55
本发明专利技术公开了一种智能感知系统中基于连接函数的多维数据本地隐私保护方法。本发明专利技术提出的方法首先基于本地隐私转换的方法,对参与用户的感知数据在用户端进行本地隐私保护,然后基于连接函数对隐私保护后数据进行采样和合成,最终得到可直接发布的具有本地隐私保护的数据集,相比一般的隐私保护方法,本发明专利技术不但能够在用户端提供本地差分隐私保护,并且通过降低多维感知数据值域空间来提高发布数据效用性。本发明专利技术在实现的过程中,实现了多维数据的降维处理,开销只限制在本地转换和二维概率分布估计的部分,无需复杂运算或加密解密。在群智感知系统中,本发明专利技术简单、易于实现,可扩展性强,实用价值高。

【技术实现步骤摘要】
群智感知系统中基于连接函数的多维数据本地隐私保护方法
本专利技术属于隐私保护领域,具体涉及一种群智感知系统中基于连接函数的多维数据本地隐私保护方法。
技术介绍
随着信息时代的来临和飞速发展,广泛的数据来源和多样数据融合,形成了真实的大数据群智感知系统,来自大量参与用户的感知数据将在服务器端进行汇聚,最后服务器将汇聚后的多维群智感知数据发送给第三方组织进行分析研究,以便利人们的生产生活,提供一个更加高效的社会环境。但是,直接发布高维感知数据会暴露参与用户的隐私信息,并且由于高维群智数据属性的之间关联关系,更是导致了前所未有的隐私威胁,同时使得隐私保护面临严峻的挑战。目前已有大量的基于差分隐私技术的文章被提出,从统计估计的角度来保护用户的隐私。但是,当面临属性关联关系复杂的多维群智数据时,这些方法在计算复杂度和精度等方面都存在缺陷,并且难以避免不可信服务器所带来的隐私威胁。目前针对群智感知系统中多维数据的隐私发布主要面临两个方面的严峻挑战。一方面,现有大多数方法都假设服务器是可信的,即非本地隐私保护,从而容易遭受内部攻击;另一方面,多维感知数据输出规模巨大,当感知数据维度增加时,已有方法容易遭受“维数灾难”,且信噪比会严重降低。
技术实现思路
本专利技术的目的是解决群智感知系统中用户隐私保护问题,提供了一种智能感知系统中基于连接函数的多维数据本地隐私保护方法。本专利技术可以有效保护群智感知系统中参与用户的数据隐私,同时保证高效的计算开销和提高发布数据的效用性。本专利技术采用如下技术方案来实现的:群智感知系统中基于连接函数的多维数据本地隐私保护方法,首先对系统中每个用户的数据都基于随机化应答技术进行本地隐私转换,然后基于转换后的比特串计算二维概率分布和计算多维属性依赖结构,最后根据概率分布和依赖函数合成和发布多维感知数据,具体包括以下步骤:1)感知数据本地隐私转换:给定N个用户的d维感知数据D,每个用户的数据在用户端直接被哈希成比特串,然后对比特串进行随机翻转,得到隐私保护后的比特串,并发送给服务器端,具体包括以下步骤:1-1)哈希映射:对每个用户的d维数据中的每个属性值进行哈希转换,从而将每个数据值转换为长度为mj的比特串其中i=1,2,...N,j=1,2,...d;1-2)随机翻转:基于随机化应答技术对每个比特串的每个比特位进行随机翻转,从而提供本地隐私保护;1-3)比特串连接:进行随机翻转之后,将每个维度的所有比特串进行连接,从而得到一个d·mj位的比特向量,并发送至服务器端;2)计算二维概率分布:获取到服务器端的隐私保护后的比特串之后,利用Lasso回归算法计算原始数据的二维概率分布;3)计算多维属性依赖结构:基于二维概率分布,计算多维属性的皮尔森相关系数来描述多维属性的依赖关系,从而建立多维属性之间的依赖结构模型;4)基于连接函数进行采样和合成:基于逆累积分布和依赖结构,利用多元高斯连接函数采样和合成多维感知数据,得到具有隐私保护的发布数据集本专利技术进一步的改进在于,步骤1)中在用户端进行本地隐私转换之后,即为群智感知系统中每一个参与用户提供本地差分隐私保护,并保证后续步骤都是在基于隐私保护后的数据上进行,不会泄露用户的敏感数据,并且对于d-维数据而言,步骤1)获得差分隐私保护的表达式为其中,ε表示差分隐私保护程度,h为哈希函数个数,f为翻转概率。本专利技术进一步的改进在于,步骤1-1)中哈希映射的具体操作为:对每维属性Aj使用哈希函数将原始数据值转换为长度为mj的比特串的表达式为本专利技术进一步的改进在于,步骤1-2)中对比特串进行随机翻转规则的表达式为其中,f∈(0,1)用来控制随机翻转的概率,从而指定本地隐私保护程度。本专利技术进一步的改进在于,步骤1-3)中进行比特串连接的具体操作是:将所有属性的比特串依次连接起来,得到一个d·mj位的比特向量,该向量的表达式为本专利技术进一步的改进在于,步骤2)中计算二维概率分布的具体操作为:设步骤1)中对二维属性(Ak,Av)使用的哈希函数分别为和则计算比特串候选集的表达式为其中,Ωk和Ωv是属性(Ak,Av)值域;基于Lasso回归计算二维属性(Ak,Av)的二维概率分布的表达式为其中,是属性(Ak,Av)的真实比特计数和组成的向量。本专利技术进一步的改进在于,步骤3)的具体操作为,计算两两属性(Ak,Av)(k,v=1,…d)的皮尔森系数最后得到d-维属性的依赖结构R。本专利技术进一步的改进在于,步骤4)的具体操作为,依次对d-维属性进行采样和合成,进而得到能够对外发布的合成数据集为其中,(X1,X2,...,Xd)∈[0,1]N×d是符合多元高斯连接函数d-维随机向量,隐含了d-维属性之间的依赖关系,(F1-1,F2-1,...,Fd-1)是d-维属性的逆累积分布函数。本专利技术具有如下有益的技术效果:本专利技术所述的智能感知系统中基于连接函数的多维数据本地隐私保护方法,通过本地隐私转换过程实现了用户端的本地差分隐私隐私保护,有效保证了参与用户的敏感信息,并且利用连接函数降低属性值域空间,实现了对多维数据的降维处理,从而极大的避免了“维数灾难”,并提高了发布数据的效用性。通过理论分析和实验分析,实验结果都证实了本专利技术在隐私保护和保证数据效用性方面都十分有效,并且本专利技术在隐私与效用的折衷方面更优于其他的多维数据差分隐私保护方法。附图说明图1是基于连接函数的多维数据本地隐私保护方法过程示意图;图2是不同隐私保护程度下针对不同数据集进行实验的平均偏差距离对比图;图3是不同概率分布估计下针对不同数据集进行实验的平均偏差距离对比图;图4是不同隐私保护程度下针对不同数据集进行实验的平均支持向量机分类准确率对比图。具体实施方式下面结合附图对本专利技术作进一步详细描述。参考图1,本专利技术提供的智能感知系统中基于连接函数的多维数据本地隐私保护方法,具体包括以下步骤:Step1感知数据本地隐私转换:给定N个用户的d维感知数据D,每个用户的数据在用户端直接被哈希成比特串,然后对比特串进行随机翻转,得到隐私保护后的比特串,并发送给服务器端,获得差分隐私保护的表达式为其中,ε表示差分隐私保护程度,h为哈希函数个数,f为翻转概率;Step1具体包括以下步骤:Step1-1哈希映射:对每个用户的d维数据中的每个属性值进行哈希转换,从而将每个数据值转换为长度为mj的比特串其中i=1,2,...N,j=1,2,...d,对每维属性Aj使用哈希函数将原始数据值转换为长度为mj的比特串的表达式为Step1-2随机翻转:基于随机化应答技术对每个比特串的每个比特位进行随机翻转,对比特串进行随机翻转规则的表达式为其中,f∈(0,1)用来控制随机翻转的概率,从而指定本地隐私保护程度;Step1-3比特串连接:进行随机翻转之后,将每个维度的所有比特串进行连接,从而得到一个d·mj位的比特向量,该向量的表达式为并将该向量发送至服务器端。Step2计算二维概率分布:获取到服务器端的隐私保护后的比特串之后,利用Lasso回归算法计算原始数据的二维概率分布,设对二维属性(Ak,Av)使用的哈希函数分别为和则计算比特串候选集的表达式为其中,Ωk和Ωv是属性(Ak,Av)值域;基于Lasso回归计算二维属性(Ak,Av)的二维概率分布的表达式为其中本文档来自技高网...

【技术保护点】
1.群智感知系统中基于连接函数的多维数据本地隐私保护方法,其特征在于,首先对系统中每个用户的数据都基于随机化应答技术进行本地隐私转换,然后基于转换后的比特串计算二维概率分布和计算多维属性依赖结构,最后根据概率分布和依赖函数合成和发布多维感知数据,具体包括以下步骤:1)感知数据本地隐私转换:给定N个用户的d维感知数据D,每个用户的数据在用户端直接被哈希成比特串,然后对比特串进行随机翻转,得到隐私保护后的比特串,并发送给服务器端,具体包括以下步骤:1‑1)哈希映射:对每个用户的d维数据

【技术特征摘要】
1.群智感知系统中基于连接函数的多维数据本地隐私保护方法,其特征在于,首先对系统中每个用户的数据都基于随机化应答技术进行本地隐私转换,然后基于转换后的比特串计算二维概率分布和计算多维属性依赖结构,最后根据概率分布和依赖函数合成和发布多维感知数据,具体包括以下步骤:1)感知数据本地隐私转换:给定N个用户的d维感知数据D,每个用户的数据在用户端直接被哈希成比特串,然后对比特串进行随机翻转,得到隐私保护后的比特串,并发送给服务器端,具体包括以下步骤:1-1)哈希映射:对每个用户的d维数据中的每个属性值进行哈希转换,从而将每个数据值转换为长度为mj的比特串其中i=1,2,...N,j=1,2,...d;1-2)随机翻转:基于随机化应答技术对每个比特串的每个比特位进行随机翻转,从而提供本地隐私保护;1-3)比特串连接:进行随机翻转之后,将每个维度的所有比特串进行连接,从而得到一个d·mj位的比特向量,并发送至服务器端;2)计算二维概率分布:获取到服务器端的隐私保护后的比特串之后,利用Lasso回归算法计算原始数据的二维概率分布;3)计算多维属性依赖结构:基于二维概率分布,计算多维属性的皮尔森相关系数来描述多维属性的依赖关系,从而建立多维属性之间的依赖结构模型;4)基于连接函数进行采样和合成:基于逆累积分布和依赖结构,利用多元高斯连接函数采样和合成多维感知数据,得到具有隐私保护的发布数据集2.根据权利要求1所述的群智感知系统中基于连接函数的多维数据本地隐私保护方法,其特征在于,步骤1)中在用户端进行本地隐私转换之后,即为群智感知系统中每一个参与用户提供本地差分隐私保护,并保证后续步骤都是在基于隐私保护后的数据上进行,不会泄露用户的敏感数据,并且对于d-维数据而言,步骤1)获得差分隐私保护的表达式为其中,ε表示差分隐私保护程度,h为哈希函数个数,f为翻转概率...

【专利技术属性】
技术研发人员:杨新宇王腾任雪斌姚向华魏洁翟守沛王舒阳
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1