一种基于混洗差分的制造技术

技术编号:39487533 阅读:9 留言:0更新日期:2023-11-24 11:07
本发明专利技术公开了一种基于混洗差分的

【技术实现步骤摘要】
一种基于混洗差分的Web大数据隐私保护方法


[0001]本专利技术属于
Web
大数据隐私保护
,具体为一种基于混洗差分的
Web
大数据隐私保护方法


技术介绍

[0002]随着科技和互联网的不断发展,
Web
网络中的海量数据成为一笔巨大的财富

信息化时代的发展潮流是利用这些数据对各行各业的状态进行分析实现数据共享

然而数据共享时对
Web
大数据进行查询过程中,会导致个人隐私泄露的概率加大

因此,
Web
查询大数据的隐私保护受到普遍重视

[0003]但是常见的隐私保护,仅通过加密数据来今天保护,使得数据在使用过程中,易被非法者通过破解软件窥探,从而引起了使用时的不便


技术实现思路

[0004]本专利技术的目的在于:为了解决上述提出的问题,提供一种基于混洗差分的
Web
大数据隐私保护方法

[0005]本专利技术采用的技术方案如下:一种基于混洗差分的
Web
大数据隐私保护方法,所述基于混洗差分的
Web
大数据隐私保护方法包括以下步骤:
[0006]S1:
电源供电模块
(1)
为整个运行系统提供运行电能之后,整个系统开始工作,
[0007]S2:
用户通过数据集查询模块
(2)
>的录入单元录入用户身份码
A
,同时第二录入单元自行录入登录时间
T、
用户端码
P
,并将用户身份码
A、
登录时间
T、
用户端码
P
分别传输至第一接收模块;第一接收模块接收数据,并将其传输至分析模块;
[0008]S3:
数据集查询模块
(2)
按照数据集的存储位置将数据集内全部记录划分至若干个不相交的数据集子块内,对每个数据集子块内所有记录的相同待查询域中的所有元素构建空间自适应过滤器,将每个元素逐个进行映射

编码后插入到对应空间自适应过滤器中,完成全部空间自适应过滤器的构建;对数据集子块集合中的每个数据集子块进行遍历,得到待查询域中具有目标元素的全部记录;
[0009]S4:
特征数据集构建模块
(3)
依据用户的查询信息构建一个查询数据集;根据最大信息系数和启发式搜索算法,在该查询数据集里,设定特征和类别

特征和特征的关联性;
[0010]S5:
特征数据集构建模块
(3)
将无关性数据构建成特征集;利用基于最大信息系数的特征选择模型,去掉冗余数据;
[0011]S6:
用户通过
Web
查询系统查询数据时,存在数据量多以及查询回合多的问题,是一种批量线性查询过程;为了进一步提高用户对
Web
查询大数据的提取速度,通过融合交替方向乘子法和低秩机制形成的并行梯度下降矩阵分解模型,将分解后的查询数据无关负载矩阵并行处理,减少
Web
查询大数据的查询时间;并行梯度下降矩阵分解模型以矩阵的特性为基础,将
W
分解成多个矩阵,并将这些矩阵分别发放到各个节点上,并完成计算;
[0012]S7:
负载矩阵构建模块
(4)
通过以下步骤完成:
[0013](1)
以用户查询要求为基础,构建初始结果负载矩阵;
[0014](2)
以通过基于最大信息系数的特征选择模型得出关联属性为依据,初始化查询数据的负载矩阵,删去负载矩阵中有关联的数据,形成无关负载矩阵;
[0015](3)
将无关负载矩阵
W
m
×
r
分解成
n
部分,对
n
部分进行并行处理,用
m/n
表示每部分的行数,用
r
表示列数,分步式系统节点数用
n
表示;
[0016](4)
求解每个节点上的分解因子,更新分解系数
β
和迭代次数=
W

AL
;直到
β

1000

τ

0.001
时结束迭代;
[0017]S8:
隐私保护模块
(5)
通过洗牌操作可对用户同带噪数据间的关联性进行打乱操作,增强数据隐私保护性;因此,通过基于混洗差分的洗牌者多维扰动发布模型,实现
Web
查询大数据的隐私保护;由于每一维取值域各不相同,导致隐私收益的分析困难,用全部维度中全部取值的集合表示
RR
机制的扰动域实现同参数化;将并行梯度下降矩阵分解模型后的无关负载矩阵
L
中的查询数据当作用户
ui
的数据,所有用户任选一个属性值并将其发布,根据属性的范围进行扰动;拥有4种属性的数据库,设定每种属性值为2种,将这8种值赋给长度是8的数组,以用户1选择属性1为例,其值等于1,由此得出其在数组中排在4号位,以此类推将8个属性值对应数组的8个位置,通过
RR
机制扰动,第
i
个属性取值域上的真实值通过概率发布,第
i
个属性取值域上的非真实值通过概率发布,其中扰动域用
∑ki
描述;
[0018]S9:
数据发送模块
(6)
根据查询函数计算所述数据子块的相关敏感度,对每个数据子块进行所述
k

相关记录差分隐私保护数据的发送;根据差分隐私组合性质,对所述关联大数据集进行
r

相关块差分隐私的保护,之后即可结束整个隐私保护流程

[0019]在一优选的实施方式中,所述步骤
S3
中,给定待查询域中的某一目标元素,遍历待查询域对应的全部空间自适应过滤器,通过空间自适应过滤器判断对应的数据集子块中是否存在目标元素,获取存在目标元素的数据集子块集合

[0020]在一优选的实施方式中,所述步骤
S4
中,利用
MICFS
对数据集的无关性处理;该过程通过以下5步实现:
[0021](1)

n
条样本的特征
F

{f1,
f2,


f
m

c}
中,确定其原始数据集
D
和空集
B
[0022](2)
求解该特征集中特征
f
i
和类别
...

【技术保护点】

【技术特征摘要】
1.
一种基于混洗差分的
Web
大数据隐私保护方法,其特征在于:所述基于混洗差分的
Web
大数据隐私保护方法包括以下步骤:
S1:
电源供电模块
(1)
为整个运行系统提供运行电能之后,整个系统开始工作,
S2:
用户通过数据集查询模块
(2)
的录入单元录入用户身份码
A
,同时第二录入单元自行录入登录时间
T、
用户端码
P
,并将用户身份码
A、
登录时间
T、
用户端码
P
分别传输至第一接收模块;第一接收模块接收数据,并将其传输至分析模块;
S3:
数据集查询模块
(2)
按照数据集的存储位置将数据集内全部记录划分至若干个不相交的数据集子块内,对每个数据集子块内所有记录的相同待查询域中的所有元素构建空间自适应过滤器,将每个元素逐个进行映射

编码后插入到对应空间自适应过滤器中,完成全部空间自适应过滤器的构建;对数据集子块集合中的每个数据集子块进行遍历,得到待查询域中具有目标元素的全部记录;
S4:
特征数据集构建模块
(3)
依据用户的查询信息构建一个查询数据集;根据最大信息系数和启发式搜索算法,在该查询数据集里,设定特征和类别

特征和特征的关联性;
S5:
特征数据集构建模块
(3)
将无关性数据构建成特征集;利用基于最大信息系数的特征选择模型,去掉冗余数据;
S6:
用户通过
Web
查询系统查询数据时,存在数据量多以及查询回合多的问题,是一种批量线性查询过程;为了进一步提高用户对
Web
查询大数据的提取速度,通过融合交替方向乘子法和低秩机制形成的并行梯度下降矩阵分解模型,将分解后的查询数据无关负载矩阵并行处理,减少
Web
查询大数据的查询时间;并行梯度下降矩阵分解模型以矩阵的特性为基础,将
W
分解成多个矩阵,并将这些矩阵分别发放到各个节点上,并完成计算;
S7:
负载矩阵构建模块
(4)
通过以下步骤完成:
(1)
以用户查询要求为基础,构建初始结果负载矩阵;
(2)
以通过基于最大信息系数的特征选择模型得出关联属性为依据,初始化查询数据的负载矩阵,删去负载矩阵中有关联的数据,形成无关负载矩阵;
(3)
将无关负载矩阵
W
m
×
r
分解成
n
部分,对
n
部分进行并行处理,用
m/n
表示每部分的行数,用
r
表示列数,分步式系统节点数用
n
表示;
(4)
求解每个节点上的分解因子,更新分解系数
β
和迭代次数=
W

AL
;直到
β

1000

τ

0.001
时结束迭代;
S8:
隐私保护模块
(5)
通过洗牌操作可对用户同带噪数据间的关联性进行打乱操作,增强数据隐私保护性;因此,通过基于混洗差分的洗牌者多维扰动发布模型,实现
Web
查询大数据的隐私保护;由于每一维取值域各不相同,导致隐私收益的分析困难,用全部维度中全部取值的集合表示
RR
机制的扰动域实现同参数化;将并行梯度下降矩阵分解模型后的无关负载矩阵
L
中的查询数据当作用户
ui
的数据,所有用户任选一个属性值并将其发布,根据属性的范围进行扰动;拥有4种属性的数据库,设定每种属性值为2种,将这8种值赋给长度是8的数组,以用户1选择属性1为例,其值等于1,由此得出其在数组中排在4号位,以此类推将8个属性值对应数组的8个位置,通过
RR
机制扰动,第
i
个属性取值域上的真实值通过概率发布,第
i
个属性取值域上的非真实值通过概率发
布,其中扰动域用
∑ki
描述;
S9:
数据发送模块
(6)
根据查询函数计算所述数据子块的相关敏感度,对每个数据子块进行所述
k

相关记录差分隐私保护数据的发送;根据差分隐私组合性质,对所述关联大数据集进行
r

相关块差分隐私的保护,之后即可结束整个隐私保护流程
。2.
如权利要求1所述的一种基于混洗差分的
Web
大数据隐私保护方法,其特征在于:所述步骤
S3
中,给定待查询域中的某一目标元素,遍历待查询域对应的全部空间自适应过滤器,通过空间自适应过滤器判断对应的数据集子块中是否存在目标元素,获取存在目标元素的数据集子块集合
。3.
如权利要求1所述的一种基于混洗差分的
Web
大数据隐私保护方法,其特征在于:所述步骤
S4
中,利用
MICFS
对数据集的无关性处理;该过程通过以下5步实现:
(1)

n
条样本的特征
F

{f1,

【专利技术属性】
技术研发人员:廖和芸
申请(专利权)人:知助数智重庆科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1