基于差分隐私的用户数据匿名编码方法及装置制造方法及图纸

技术编号:29460183 阅读:25 留言:0更新日期:2021-07-27 17:29
本发明专利技术属于大数据技术领域,本发明专利技术提供了一种基于差分隐私的用户数据匿名编码方法及装置,基于差分隐私的用户数据匿名编码方法包括:根据接收的用户数据生成随机序列;根据所述随机序列对所述用户数据进行编码,以生成比特向量;根据所述比特向量对编码后的用户数据进行差分隐私处理。本发明专利技术扩充了比特向量编码方案的特性,使其能应用于数据发布的场景。在保护用户隐私的前提下,使得针对数据量大的应用场景估计误差较小,在数据量大的应用场景有很高的实用性。

User data anonymous coding method and device based on differential privacy

【技术实现步骤摘要】
基于差分隐私的用户数据匿名编码方法及装置
本专利技术属于大数据
,具体涉及一种基于差分隐私的用户数据匿名编码方法及装置。
技术介绍
众所周知,差分隐私是针对统计数据库的隐私泄漏提出的一种新的隐私定义。某条记录在或者不在数据集中,对计算结果的影响是微乎其微的。因此,一条记录添加到数据集中所引起的隐私泄漏风险被控制到非常小且在可接受的范围内,并且攻击者不能通过观察计算结果而获得准确的个人信息。与传统的隐私保护模型相比,差分隐私保护模型有两个显著的优点:第一:差分隐私对攻击者拥有的背景做了最严格的定义,即使攻击者掌握了除了要保护的信息以外的所有相关的背景知识,也依然能保护用户的个人信息。第二:差分隐私建立在坚实的数学基础上,对隐私保护进行了严格的定义并提供了量化评估的方法,使得数据集在不同参数处理下所提供的隐私保护水平具有可比较性。由于差分隐私既克服了加密技术带来的计算复杂度的问题,又克服了K-ANONYMITY及衍生的匿名隐私保护技术中攻击者背景知识假设不严格的各种攻击问题。因此自差分隐私保护模型提出以来,就被相关业界人员认可并迅速成为隐私保护领域中的研究热点。但在实际应用中想要找到一个真正可信的第三方数据收集平台十分困难,这极大地限制了中心化差分隐私技术的应用。鉴于此,在不可信第三方数据收集者的场景下,本地化差分隐私(LOCALDIFFERENTIALPRIVACY)技术应运而生,其在继承中心化差分隐私技术定量化定义隐私攻击的基础上,细化了对个人敏感信息的保护。具体来说,其将数据的隐私化处理过程转移到每个用户上,使得用户能够单独地处理和保护个人敏感信息,即进行更加彻底的隐私保护。如何在有效利用数据给人类提供便利服务的同时,并能使个人隐私信息能够得到有效的保护,是目前急需解决的问题。
技术实现思路
本专利技术属于大数据
,针对现有技术中的问题,本专利技术扩充了比特向量编码方案的特性,使其能应用于数据发布的场景。在保护用户隐私的前提下,使得针对数据量大的应用场景估计误差较小,在数据量大的应用场景有很高的实用性。为解决上述技术问题,本专利技术提供以下技术方案:第一方面,本专利技术提供一种基于差分隐私的用户数据匿名编码方法,包括:根据接收的用户数据生成随机序列;根据所述随机序列对所述用户数据进行编码,以生成比特向量;根据所述比特向量对编码后的用户数据进行差分隐私处理。一实施例中,所述根据接收的用户数据生成随机序列,包括:将预接收的用户数据划分为目标均匀分布数据;根据所述目标均匀分布数据以及所述用户数据生成所述随机序列。一实施例中,所述根据所述目标均匀分布数据以及所述用户数据生成所述随机序列,包括:对所述用户数据进行列置换,以生成列置换后的用户数据;根据所述目标均匀分布数据以及所述列置换后的用户数据生成所述用户数据的随机序列。一实施例中,基于差分隐私的用户数据匿名编码方法还包括:根据差分隐私处理后的用户数据计算所述用户数据对应的直方图发布K。第二方面,本专利技术提供一种基于差分隐私的用户数据匿名编码装置,包括:随机序列生成模块,用于根据接收的用户数据生成随机序列;用户数据编码模块,用于根据所述随机序列对所述用户数据进行编码,以生成比特向量;用户数据差分处理模块,用于根据所述比特向量对编码后的用户数据进行差分隐私处理。一实施例中,所述随机序列生成模块包括:用户数据划分单元,用于将预接收的用户数据划分为目标均匀分布数据;随机序列生成单元,用于根据所述目标均匀分布数据以及所述用户数据生成所述随机序列。一实施例中,所述随机序列生成单元包括:用户数据列置换单元,用于对所述用户数据进行列置换,以生成列置换后的用户数据;随机序列生成子单元,用于根据所述目标均匀分布数据以及所述列置换后的用户数据生成所述用户数据的随机序列。一实施例中,基于差分隐私的用户数据匿名编码装置还包括:参数计算模块,用于根据差分隐私处理后的用户数据计算所述用户数据对应的直方图发布K。第三方面,本专利技术提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现基于差分隐私的用户数据匿名编码方法的步骤。第四方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现基于差分隐私的用户数据匿名编码方法的步骤。从上述描述可知,本专利技术实施例提供的基于差分隐私的用户数据匿名编码方法及装置,首先根据接收的用户数据生成随机序列;接着,根据随机序列对用户数据进行编码,以生成比特向量;最后根据比特向量对编码后的用户数据进行差分隐私处理。本专利技术扩充了比特向量编码方案的特性,使其能应用于数据发布的场景。在保护用户隐私的前提下,使得针对数据量大的应用场景估计误差较小,在数据量大的应用场景有很高的实用性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术的实施例中基于差分隐私的用户数据匿名编码方法流程示意图一;图2为本专利技术的实施例中步骤100的流程示意图;图3为本专利技术的实施例中步骤102的流程示意图;图4为本专利技术的实施例中基于差分隐私的用户数据匿名编码方法流程示意图二;图5为本专利技术的具体应用实例中基于差分隐私的用户数据匿名编码系统的结构图;图6为本专利技术的具体应用实例中基于差分隐私的用户数据匿名编码方法的流程示意图;图7为本专利技术的具体应用实例中改进的比特向量机制示意图;图8为本专利技术的具体应用实例中比特向量编码示意图;图9为本专利技术的具体应用实例中基于改进比特向量编码机制直方图发布原理图;图10为本专利技术实施例中基于差分隐私的用户数据匿名编码装置结构框图一;图11为本专利技术的实施例中随机序列生成模块10的结构框图;图12为本专利技术的实施例中随机序列生成单元102的结构框图;图13为本专利技术实施例中基于差分隐私的用户数据匿名编码装置结构框图二;图14为本专利技术的实施例中的电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本领域内的技术人员应明白,本专利技术的实施例可提供为方法、系统、或计算机程序产品。因此,本专利技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面本文档来自技高网
...

【技术保护点】
1.一种基于差分隐私的用户数据匿名编码方法,其特征在于,包括:/n根据接收的用户数据生成随机序列;/n根据所述随机序列对所述用户数据进行编码,以生成比特向量;/n根据所述比特向量对编码后的用户数据进行差分隐私处理。/n

【技术特征摘要】
1.一种基于差分隐私的用户数据匿名编码方法,其特征在于,包括:
根据接收的用户数据生成随机序列;
根据所述随机序列对所述用户数据进行编码,以生成比特向量;
根据所述比特向量对编码后的用户数据进行差分隐私处理。


2.根据权利要求1所述的用户数据匿名编码方法,其特征在于,所述根据接收的用户数据生成随机序列,包括:
将预接收的用户数据划分为目标均匀分布数据;
根据所述目标均匀分布数据以及所述用户数据生成所述随机序列。


3.根据权利要求2所述的用户数据匿名编码方法,其特征在于,所述根据所述目标均匀分布数据以及所述用户数据生成所述随机序列,包括:
对所述用户数据进行列置换,以生成列置换后的用户数据;
根据所述目标均匀分布数据以及所述列置换后的用户数据生成所述用户数据的随机序列。


4.根据权利要求1所述的用户数据匿名编码方法,其特征在于,还包括:
根据差分隐私处理后的用户数据计算所述用户数据对应的直方图发布K。


5.一种基于差分隐私的用户数据匿名编码装置,其特征在于,包括:
随机序列生成模块,用于根据接收的用户数据生成随机序列;
用户数据编码模块,用于根据所述随机序列对所述用户数据进行编码,以生成比特向量;
用户数据差分处理模块,用于根据...

【专利技术属性】
技术研发人员:黄思创鲁金彪陆杰文罗鹏飞
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1