基于负数据库和深度学习的多元时序数据隐私保护方法技术

技术编号:33772180 阅读:93 留言:0更新日期:2022-06-12 14:24
本发明专利技术公开了一种基于负数据库和深度学习的多元时序数据隐私保护方法,首先对原始数据集中的数据进行预处理,将原始数据转换成定长的二进制串,通过贝叶斯定理和概率统计方法分析基于负数据库的激活函数估算问题,之后采用细粒度更高的负数据库生成算法QK

【技术实现步骤摘要】
基于负数据库和深度学习的多元时序数据隐私保护方法


[0001]本专利技术属于信息安全
,涉及一种多元时序数据隐私保护方法,具体涉及一种基于负数据库和深度学习的多元时序数据隐私保护方法。

技术介绍

[0002]在大数据时代,对海量的数据进行挖掘和分析,提取隐含其中潜在的有价值的信息,极大地提高了社会生产力、方便了人们的生活。时序数据是一种按照时间发生先后顺序排列而成的序列数据。通过对时序数据的分析和预测,可以为决策者提供前瞻性的意见和指导性的策略,以应对未来可能发生的变化;同时也可以发现蕴含在这些时序数据之中的潜在规律,从而可以更好地认识和理解各种科学理论和社会现象。然而,在现实应用中,数据挖掘算法所使用的数据大多都是明文状态,存在较大的隐私泄露风险。因此,在人们对时序数据挖掘的研究取得一定成果的同时,其隐私安全问题也越来越受到广泛的关注。
[0003]目前应用于隐私保护数据挖掘的数据安全技术,已被证明存在一些问题。基于数据扰动的方法较典型的是差分隐私技术,它是通过向敏感数据添加数值类型或者非数值类型的噪音,查询请求公开可见信息的结本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于负数据库和深度学习的多元时序数据隐私保护方法,其特征在于,包括以下步骤:步骤1:将多元时序数据Y={y
1 y2…
y
T
}进行预处理,转化成二进制串其中,n是变量维度,是实数集;步骤2:选取负数据库生成算法QK

hidden,针对步骤1转换的数据生成相应的负数据库NDB={NDB
1 NDB2…
NDB
T
};步骤3:从步骤2中提取负数据库的梗概S={S
1 S2…
S
T
},其中S
i
是NDB
i
的梗概;步骤4:将S输入多元时序数据预测网络,完成基于负数据库的激活函数估算,得到非线性部分神经网络和线性部分自回归模型集成的预测结果,选取满足预设条件的S作为最终的隐私保护数据;所述多元时序数据预测网络,包括卷积神经网络CNN的卷积层与控循环单元网络GRU结合的深度学习模型,将卷积层提取得到的特征按照时间顺序输入到控循环单元网络GRU,捕获时间序列短期和长期的依赖关系,得到下一个时刻的状态向量;同时结合自回归模型AR作为所述多元时序数据预测网络线性层,搭建多元时序数据预测网络;通过所述多元时序数据预测网络,最终得到非线性部分和线性部分集成的预测结果。2.根据权利要求1所述的基于负数据库和深度学习的多元时序数据隐私保护方法,其特征在于:步骤1中,将多元时序数据进行预处理,转化成与最大值相同位数的定长的二进制串。3.根据权利要求1所述的基于负数据库和深度学习的多元时序数据隐私保护方法,其特征在于:步骤2中,所述负数据库生成算法QK

hidden,存储的是由n位二进制串组成的数据集的补集中内容的压缩形式;对于m条最大属性位数为L的隐藏串s,QK

hidden算法在对负数据库中生成不同类型记录的概率p1,p2,

,p
K
进行控制的同时,引入一组取反参数q1,q2,

,q
L
对每一个属性位的取反概率进行控制;其中,参数K是负数据库中每一条记录的确定位个数,r是控制负数据库大小的参数,N=m
×
r,N是负数据库中总条目数;负数据库以概率参数p
i
生成第i种类型的记录,生成第i种类型的记录的方法是按照取反参数选择i个取反位,然后随机选择K

i个取正位,最后加入到负数据库中。4.根据权利要求1所述的基于负数据库和深度学习的多元时序数据隐私保护方法,其特征在于:步骤4中,所述卷积层由若干滤波器组成,宽度为w,高度为n,高度设置为与变量个数相同;第k个滤波器扫过输入矩阵Y,并产生:h
k
=RELU(W
K
*Y+b
k
)
ꢀꢀ
(1)其中,*表示卷积操作,输出值h
k
是一个向量,k是第k个卷积核,RELU即RELU函数,RELU(x)=max(0,x);W
K
是权重矩阵,b
k
是偏置。5.根据权利要求1所述的基于负数据库和深度学习的多元时序数据隐私保护方法,其特征在于:步骤4中,所述控循环单元网络GRU,使用RELU函数作为隐藏更新激活功能;在时刻t的循环单元的隐藏状态为:r
t
=σ(y
t
W
xr
+h
t
‑1W
hr
+b
r
)
ꢀꢀ
(2)u
t
=σ(y
t
W
xu
+h
t
‑1W
hu
+b
u
)
ꢀꢀ
(3)c
t
=RELU(y
t
W
xc
+r
t

(h
t
‑1W
hc
)+b
c
)
ꢀꢀ
(4)
h
t
=(1

u
t
)

h
t
‑1+u
t

c
t
ꢀꢀ
(5)其中,

是元素的乘积,σ是sigmoid函数,y
t
是在时刻t的输入,r
t
是GRU中组件重置门在时刻t的隐藏状态,u
t
是GRU中组件更新门在时刻t的隐藏状态,c
t
是GRU中的候选记忆单元在时刻t的隐藏状态;W
xr
、W
hr
、W
xu
、W
hu
...

【专利技术属性】
技术研发人员:赵冬冬黄雅琪
申请(专利权)人:武汉理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1