基于本地化差分隐私的键值数据安全采集方法和系统技术方案

技术编号:43954204 阅读:25 留言:0更新日期:2025-01-07 21:40
本发明专利技术提供了一种基于本地化差分隐私的键值数据安全采集方法和系统,通过服务器向各用户端下发预设的键值数据采集参数;各用户端根据接收到的键域,填充本地键值数据集,得到混淆后的键值数据集,并按照预设概率从中抽取一个键值数据,基于预设的评分函数,根据接收到的键域、键扰动隐私预算和值扰动隐私预算,对抽取的键值数据进行扰动,得到扰动结果,并将该结果发送至服务器;服务器根据键域、键扰动隐私预算、值扰动隐私预算和接收到的扰动结果,校准得到所抽取的各键值数据的键的频率估计和均值估计。本发明专利技术能够有效减少通信开销,提升执行速度和估计结果的准确性。

【技术实现步骤摘要】

本专利技术涉及信息安全,具体涉及基于本地化差分隐私的键值数据安全采集方法和系统


技术介绍

1、在大数据时代,服务提供商热衷于收集和分析用户数据以辅助决策或改进服务。然而,数据采集操作伴随着隐私风险,这必然引发用户对隐私泄露的担忧。随着数据采集安全需求的持续增长,差分隐私(differential privacy,dp)已成为保护用户隐私数据的关键技术。无论攻击者具备何种先验知识,差分隐私都能够提供可证明的隐私保护。本地化差分隐私(local differential privacy,ldp)部署在数据收集阶段,其隐私化处理过程从服务提供方转移至用户端,从而降低了不可信的数据收集者泄露用户数据的风险。

2、键值数据是一种典型的非结构化查询语言(non structured query language,non-sql)混合数据类型,在实践中得到了广泛应用,实现键值数据的安全采集需要ldp的介入。目前,基于一元编码和通用随机响应机制的ldp采集方案在键值数据采集中得到了应用,其代表性的方案包括privkv(privacy key-value),p本文档来自技高网...

【技术保护点】

1.一种基于本地化差分隐私的键值数据安全采集方法,其特征在于,应用于键值数据采集系统,所述系统包括通信连接的服务器和多个用户端;

2.根据权利要求1所述的方法,其特征在于,各所述用户端根据接收到的所述键域,填充本地键值数据集,得到混淆后的键值数据集,包括:

3.根据权利要求1或2所述的方法,其特征在于,各所述用户端按照预设概率从所述混淆后的键值数据集中抽取一个键值数据,包括:

4.根据权利要求1或2所述的方法,其特征在于,各所述用户端基于预设的评分函数,根据接收到的所述键域、所述键扰动隐私预算和所述值扰动隐私预算,对抽取的键值数据进行扰动,得到扰动结果...

【技术特征摘要】

1.一种基于本地化差分隐私的键值数据安全采集方法,其特征在于,应用于键值数据采集系统,所述系统包括通信连接的服务器和多个用户端;

2.根据权利要求1所述的方法,其特征在于,各所述用户端根据接收到的所述键域,填充本地键值数据集,得到混淆后的键值数据集,包括:

3.根据权利要求1或2所述的方法,其特征在于,各所述用户端按照预设概率从所述混淆后的键值数据集中抽取一个键值数据,包括:

4.根据权利要求1或2所述的方法,其特征在于,各所述用户端基于预设的评分函数,根据接收到的所述键域、所述键扰动隐私预算和所述值扰动隐私预算,对抽取的键值数据进行扰动,得到扰动结果,包...

【专利技术属性】
技术研发人员:张军鹏汪旭解滨李梦倩曾水光杜晓辉张晓飞
申请(专利权)人:河北师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1