一种基于隐私计算的数据处理方法技术

技术编号:37467310 阅读:14 留言:0更新日期:2023-05-06 09:42
本发明专利技术涉及数据处理,具体涉及一种基于隐私计算的数据处理方法,响应于数据访问请求,从数据库中获取各用户数据集后,生成动态盐值;利用动态盐值对各数据集进行加盐处理,并获取经过加盐处理的各数据集的第一摘要报文;基于数据集计算对应用户的计数向量,对计数向量进行加权聚合,并在加权聚合结果中注入噪音;根据包含噪音的加权聚合结果计算边际分布,并基于边际分布分析不同用户之间的关联关系;将各用户的数据集、各数据集的第一摘要报文、动态盐值,以及不同用户之间的关联关系分析结果发送给客户端;本发明专利技术提供的技术方案能够克服对数据的加密效果较差,无法在保护数据安全的前提下对不同用户的数据集之间的关联关系进行有效分析的缺陷。关系进行有效分析的缺陷。关系进行有效分析的缺陷。

【技术实现步骤摘要】
一种基于隐私计算的数据处理方法


[0001]本专利技术涉及数据处理,具体涉及一种基于隐私计算的数据处理方法。

技术介绍

[0002]隐私计算(Privacycomputing)是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,达到对数据“可用、不可见”的目的;在充分保护数据安全的前提下,实现数据价值的转化和释放。
[0003]目前,隐私计算的参与方通常分为三大类:发起端、数据端以及服务端。发起端一般为数据的需求者,会发送相应的任务请求;数据端一般为数据的提供者,会响应发起端的任务请求,将相应的数据发送至服务端进行运算,服务端再将运算结果发送至发起端。现有技术中,为了规避隐私泄漏也可以省去数据端,通过发起端直接与服务端建立联系。
[0004]现有基于隐私计算的数据处理方法存在以下缺点:一、对数据的加密效果较差,攻击者一旦截取数据很容易解密获取数据;二、不能在保护数据安全的前提下,对不同用户的数据集之间的关联关系进行有效分析。

技术实现思路

[0005](一)解决的技术问题
[0006]针对现有技术所存在的上述缺点,本专利技术提供了一种基于隐私计算的数据处理方法,能够有效克服现有技术所存在的对数据的加密效果较差,无法在保护数据安全的前提下对不同用户的数据集之间的关联关系进行有效分析的缺陷。
[0007](二)技术方案
[0008]为实现以上目的,本专利技术通过以下技术方案予以实现:
[0009]一种基于隐私计算的数据处理方法,包括以下步骤:r/>[0010]S1、响应于数据访问请求,从数据库中获取各用户的数据集后,生成动态盐值;
[0011]S2、利用动态盐值对各数据集进行加盐处理,并获取经过加盐处理的各数据集的第一摘要报文;
[0012]S3、基于数据集计算对应用户的计数向量,对计数向量进行加权聚合,并在加权聚合结果中注入噪音;
[0013]S4、根据包含噪音的加权聚合结果计算边际分布,并基于边际分布分析不同用户之间的关联关系;
[0014]S5、将各用户的数据集、各数据集的第一摘要报文、动态盐值,以及不同用户之间的关联关系分析结果打包发送给客户端。
[0015]优选地,S1中所述响应于数据访问请求,从数据库中获取各用户的数据集后,生成动态盐值,包括:
[0016]根据盐值类型参数,确定本次数据访问请求中盐值的类型格式,并生成对应的动态盐值。
[0017]优选地,S3中对计数向量进行加权聚合,并在加权聚合结果中注入噪音,包括:
[0018]基于计数向量对应数据集的隐私预算与所有数据集的隐私预算最大值的比值,确定计数向量的权值,并对计数向量进行加权聚合,在加权聚合结果中注入拉普拉斯噪音。
[0019]优选地,所述数据集的隐私预算为公开信息。
[0020]优选地,所述拉普拉斯噪音为:
[0021]η=

δ
·
sgn(τ)
·
In(1

2|τ|)
[0022]其中,δ为常系数,τ为区间(

0.5,0.5)内服从均匀分布的连续的随机变量。
[0023]优选地,S4中根据包含噪音的加权聚合结果计算边际分布之后,包括:
[0024]构造似然函数,利用似然函数将数据集的边界问题转换为有约束最大化问题,并利用最大期望算法对边际分布进行校正。
[0025]优选地,S5中将各用户的数据集、各数据集的第一摘要报文、动态盐值,以及不同用户之间的关联关系分析结果打包发送给客户端,包括:
[0026]对各数据集的第一摘要报文和动态盐值进行预设格式的格式化处理,使用SM3算法分别对各用户的数据集、各数据集的第一摘要报文、动态盐值,以及不同用户之间的关联关系分析结果进行加密,并对各项加密内容进行签名。
[0027]优选地,还包括:
[0028]客户端接收到数据包后,对数据包进行验签,确认加密内容的完整性后对各项加密内容进行解密;
[0029]利用动态盐值对各数据集进行加盐处理,并获取各数据集的第二摘要报文;
[0030]对各数据集的第一摘要报文、第二摘要报文进行匹配,以判断各用户的数据集是否为真实数据。
[0031]优选地,所述对各数据集的第一摘要报文、第二摘要报文进行匹配,以判断各用户的数据集是否为真实数据,包括:
[0032]若数据集的第一摘要报文、第二摘要报文完全相同,则判断该数据集为真实数据;否则判断该数据集为篡改数据。
[0033](三)有益效果
[0034]与现有技术相比,本专利技术所提供的一种基于隐私计算的数据处理方法,具有以下有益效果:
[0035]1)响应于数据访问请求,从数据库中获取各用户的数据集后,生成动态盐值,利用动态盐值对各数据集进行加盐处理,并获取经过加盐处理的各数据集的第一摘要报文,根据数据访问请求中的盐值类型参数,能够在每次数据访问时生成不同的动态盐值,利用动态盐值进行数据加密能够有效提升数据的加密效果;
[0036]2)基于数据集计算对应用户的计数向量,对计数向量进行加权聚合,并在加权聚合结果中注入噪音,根据包含噪音的加权聚合结果计算边际分布,并基于边际分布分析不同用户之间的关联关系,通过在加权聚合结果中注入噪音,能够实现对数据安全的有效保护,并且通过计算得到的边际分布能够对不同用户之间的关联关系进行有效分析。
附图说明
[0037]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]图1为本专利技术的流程示意图;
[0039]图2为本专利技术的详细流程示意图。
具体实施方式
[0040]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0041]一种基于隐私计算的数据处理方法,如图1和图2所示,

响应于数据访问请求,从数据库中获取各用户的数据集后,生成动态盐值,具体包括:
[0042]根据盐值类型参数,确定本次数据访问请求中盐值的类型格式,并生成对应的动态盐值。
[0043]②
利用动态盐值对各数据集进行加盐处理,并获取经过加盐处理的各数据集的第一摘要报文。
[0044]上述技术方案,响应于数据访问请求,从数据库中获取各用户的数据集后,生成动态盐值,利用动态盐值对各数据集进行加盐处理,并获取经过加盐处理的各数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于隐私计算的数据处理方法,其特征在于:包括以下步骤:S1、响应于数据访问请求,从数据库中获取各用户的数据集后,生成动态盐值;S2、利用动态盐值对各数据集进行加盐处理,并获取经过加盐处理的各数据集的第一摘要报文;S3、基于数据集计算对应用户的计数向量,对计数向量进行加权聚合,并在加权聚合结果中注入噪音;S4、根据包含噪音的加权聚合结果计算边际分布,并基于边际分布分析不同用户之间的关联关系;S5、将各用户的数据集、各数据集的第一摘要报文、动态盐值,以及不同用户之间的关联关系分析结果打包发送给客户端。2.根据权利要求1所述的基于隐私计算的数据处理方法,其特征在于:S1中所述响应于数据访问请求,从数据库中获取各用户的数据集后,生成动态盐值,包括:根据盐值类型参数,确定本次数据访问请求中盐值的类型格式,并生成对应的动态盐值。3.根据权利要求1所述的基于隐私计算的数据处理方法,其特征在于:S3中对计数向量进行加权聚合,并在加权聚合结果中注入噪音,包括:基于计数向量对应数据集的隐私预算与所有数据集的隐私预算最大值的比值,确定计数向量的权值,并对计数向量进行加权聚合,在加权聚合结果中注入拉普拉斯噪音。4.根据权利要求3所述的基于隐私计算的数据处理方法,其特征在于:所述数据集的隐私预算为公开信息。5.根据权利要求3所述的基于隐私计算的数据处理方法,其特征在于:所述拉普拉斯噪音为:η=

δ
·
sgn(τ)
·
In(1

【专利技术属性】
技术研发人员:廉明
申请(专利权)人:安徽长泰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1