【技术实现步骤摘要】
数据加密、数据分析方法和装置
本说明书实施例涉及互联网
,更具体地,涉及一种数据加密方法和装置、以及一种数据分析方法和装置。
技术介绍
在互联网大数据建模分析需求下,如何保护用户的隐私是非常重要的问题。例如,互联网公司会采集用户设备的遥测数据并对其进行分析,这将提高用户的体验,然而,这也可能泄漏用户的隐私。在该背景下,差分隐私技术得到越来越多的应用。差分隐私是一种对数据隐私安全性的形式化定义,其保证在对全部数据进行建模分析的同时并不泄露个体单条数据的信息。在已有的成熟差分隐私算法中,服务器端首先收集用户的原始数据,然后通过对原始数据加入扰动,以实现差分隐私。然而,大部分用户并不信任服务器端,不希望将自己的原始数据直接上传。在该情况中,互联网公司使用一种本地差分隐私算法来采集数据,使得在用户设备在对原始数据进行加密之后再上传,从而保护用户隐私。一些现有的本地差分隐私算法通常对单次的遥测采集较有效,一些现有的本地差分隐私算法对采集的数据的变化形式有较高的要求。因此,需要一种更有效的数据加密方案和数据分析方案。
技术实现思路
本说明书实施例旨在提供一种更有效的数据加密 ...
【技术保护点】
1.一种数据加密方法,所述方法在数据提供方执行,包括:获取原始数据;通过随机算法将所述原始数据转换为中间数据,其中,所述中间数据取值为多个离散数值中的一个数值,其中,所述随机算法使得所述中间数据的期望值与所述原始数据相对应,其中,所述多个离散数值为位数相同的二进制数值;以及对所述中间数据的每一位进行0与1之间的随机翻转,从而获取所述原始数据的加密数据,其中,所述随机翻转满足差分隐私。
【技术特征摘要】
1.一种数据加密方法,所述方法在数据提供方执行,包括:获取原始数据;通过随机算法将所述原始数据转换为中间数据,其中,所述中间数据取值为多个离散数值中的一个数值,其中,所述随机算法使得所述中间数据的期望值与所述原始数据相对应,其中,所述多个离散数值为位数相同的二进制数值;以及对所述中间数据的每一位进行0与1之间的随机翻转,从而获取所述原始数据的加密数据,其中,所述随机翻转满足差分隐私。2.根据权利要求1所述的数据加密方法,其中所述多个离散数值包括:00、01、10和11。3.根据权利要求1所述的数据加密方法,其中所述随机算法通过基于所述原始数据的随机变量实现。4.根据权利要求1所述的数据加密方法,其中所述随机算法通过随机选取用于所述原始数据的散列函数而实现。5.根据权利要求3所述的数据加密方法,其中,所述多个离散数值与所述原始数据的取值范围中的多个端点分别对应,所述多个端点将所述原始数据的取值范围划分为至少一个区间,其中,所述原始数据落入区间[a,b]中,所述随机算法包括,基于所述原始数据在所述区间[a,b]中的位置,确定将所述原始数据转换为与端点a或b对应的离散数值的概率。6.根据权利要求4所述的数据加密方法,其中,所述多个离散数值与所述原始数据的取值范围中的多个端点分别对应,所述多个端点将所述原始数据的取值范围划分为至少一个区间,其中,所述原始数据落入区间[a,b]中,所述随机算法包括,基于所述原始数据在所述区间[a,b]中的位置,确定选取用于将所述原始数据转换为与端点a或b对应的离散数值的散列函数的概率。7.根据权利要求1所述的数据加密方法,其中,所述差分隐私为∈差分隐私,其中,对所述中间数据的每一位进行0与1之间的随机翻转包括,以概率1/(e∈+1)对所述中间数据的每一位进行0与1之间的随机翻转。8.一种数据分析方法,所述方法在数据需求方执行,包括:从多个数据提供方分别接收多个加密数据,其中,所述多个加密数据分别由各个数据提供方通过权利要求1-7中任一项所述的方法基于各自的原始数据获取,其中,所述原始数据为第一变量的取值;以及基于所述多个加密数据,获取所述第一变量的相关信息的无偏估计。9.根据权利要求8所述的数据分析方法,其中,所述相关信息包括以下任一种:均值、方差、直方图、概率密度。10.根据权利要求8所述的数据分析方法,其中,所述无偏估计的偏差幅度通过无偏估计参数限定。11.一种数据加密装置,所述装置在数据提供方实施,包括:获取单元,配置为,获取原始数据;转换单元,配置为,通过随机算法将所述原始数据转换为...
【专利技术属性】
技术研发人员:李梁,周俊,李小龙,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。