【技术实现步骤摘要】
一种数据保护方法、装置、相关设备及系统
[0001]本申请涉及信息安全领域,尤其涉及一种数据保护方法、装置、相关设备及系统。
技术介绍
[0002]为了方便对数据的集中处理和存储,用户数据很多情况下需要上传云端,比如,大数据处理、云存储等等。在用户数据上传云端的时候,也会面临用户隐私泄露、黑客攻击等等数据安全的威胁。当前的解决方案往往是对用户数据进行加密,例如,编码等操作,上传到云端对应解码。然而,若黑客专门针对编解码模型进行攻击,数据安全性依旧较差。
技术实现思路
[0003]本申请实施例公开了一种数据保护方法、装置、相关设备及系统,可以提高用户信息的安全性。
[0004]第一方面,本申请提供了一种数据保护方法,所述方法应用于电子设备,所述电子设备包括数据保护模型,所述数据保护模型包括一个编码器、一个混淆器和一个恢复器:其中,所述混淆器包括N个混淆模块,所述N个混淆模块分别为第1混淆模块、第2混淆模块、
……
、第N混淆模块,所述N为大于1的整数;所述电子设备通过所述编码器对用户数据 ...
【技术保护点】
【技术特征摘要】
1.一种数据保护方法,其特征在于,所述方法应用于电子设备,所述电子设备包括数据保护模型,所述数据保护模型包括一个编码器、一个混淆器和一个恢复器:其中,所述混淆器包括N个混淆模块,所述N个混淆模块分别为第1混淆模块、第2混淆模块、......、第N混淆模块,所述N为大于1的整数;所述电子设备通过所述编码器对用户数据x进行特征抽取,得到特征向量z0,将所述特征向量z0输入到所述恢复器和所述第1混淆模块;所述电子设备通过所述恢复器对第i
‑
1特征向量z
i
‑1进行还原处理,并基于还原数据和用户数据x生成第i噪声δ
i
;将所述δ
i
输入到第i混淆模块;所述电子设备通过所述第i混淆模块将所述第i
‑
1特征向量z
i
‑1和所述第i噪声δ
i
进行叠加,得到第i特征向量z
i
;其中,所述i依次从1到所述N进行取值;在所述i的取值加1之后,重新执行所述通过所述恢复器对第i
‑
1特征向量z
i
‑1进行还原处理的步骤,直到所述i等于所述N,输出所述第N混淆模块得到的第N特征向量z
N
。2.根据权利要求1所述的方法,其特征在于,所述电子设备通过所述编码器对用户数据x进行特征抽取,得到特征向量z0,具体包括:z0=Enc(x,α)其中,所述Enc为第一神经网络模型,所述α是所述第一神经网络模型的编码参数。3.根据权利要求2所述的方法,其特征在于,所述α以第一目标函数的最小值为目标训练而成,或所述α以第二目标函数的最大值为目标训练而成,或所述α以第三目标函数的最大值为目标训练而成;其中,所述第一目标函数是解码数据y
′
和理想输出数据y之间的损失函数;所述第二目标函数是第二神经网络模型输出的还原数据x
′
和用户数据x之间的损失函数;所述第三目标函数是所述第二神经网络模型输出的隐私属性A
′
和理想属性A之间的损失函数;所述解码数据y
′
是基于所述第N特征向量z
N
处理得到的结果;所述理想输出数据y是所述用户数据x经过处理输出的正确结果,所述第二神经网络模型是所述恢复器用于还原用户数据和预测隐私的神经网络,所述还原数据x
′
是所述第二神经网络模型基于特征向量还原出的数据,所述隐私属性A
′
为所述用户数据中用户个人的敏感信息,所述隐私属性A
′
是所述第二神经网络模型基于所述特征向量预测出的用户个人敏感信息;所述理想属性A是所述用户数据x中正确的敏感信息。4.根据权利要求1
‑
3任一项所述的方法,其特征在于,所述电子设备通过所述恢复器对第i
‑
1特征向量z
i
‑1进行还原处理,并基于还原数据生成第i噪声δ
i
,具体包括:其中,所述sDec为第二神经网络模型,所述第二神经网络模型包括对特征向量进行还原的功能,所述sign为符号函数;所述L
rec
为重构损失函数,所述L
rec
用于确定用户数据x和还原数据sDec(z
i
‑1,θ)之间的重构损失;所述θ是所述第二神经网络模型的参数。5.根据权利要求4所述的方法,其特征在于,所述θ以第二目标函数的最小值为目标训练而成,或所述θ以第三目标函数的最小值为目标训练而成;
其中,所述第二目标函数是所述第二神经网络模型输出的还原数据x
′
和用户数据x之间的损失函数;所述第三目标函数是所述第二神经网络模型输出的隐私属性A
′
和理想属性A之间的损失函数;所述第二神经网络模型是所述恢复器用于还原用户数据和预测隐私的神经网络,所述还原数据x
′
是所述第二神经网络模型基于所述特征向量还原出的数据,所述隐私属性A
′
为所述用户数据中用户个人的敏感信息,所述隐私属性A
′
是所述第二神经网络模型基于所述特征向量预测出的用户个人敏感信息;所述理想属性A是所述用户数据x中正确的敏感信息。6.根据权利要求1
‑
5任一项所述的方法,其特征在于,所述电子设备通过所述第i混淆模块将所述第i
‑
1特征向量z
i
‑1和所述第i噪声δ
i
进行叠加,得到第i特征向量zi,具体包括:其中,所述ε为隐私预算,隐私预算用于决定加噪的幅度,所述mask为0
‑
1随机向量。7.根据权利要求6所述的方法,其特征在于,在所述电子设备通过所述第N混淆模块得到第N特征向量z
N
之后,所述方法还包括:所述电子设备通过所述混淆器将所述第N特征向量z
N
更新为:z0+clip(
‑
μ,μ,z
N
‑
z0)其中,所述clip是将叠加的总噪声z
N
‑
z0限定在参数
‑
μ到μ之间的函数,所述
‑
μ为所述clip限定的最小值,所述μ为所述clip限定的最大值,所述μ为正数。8.根据权利要求1
‑
7任一项所述的方法,其特征在于,所述恢复器包括N个恢复模块,所述N个恢复模块分别为第1恢复模块,第2恢复模块,
……
,第N恢复模块,所述电子设备通过所述恢复器对第i
‑
1特征向量z
i
‑1进行还原处理,并基于还原数据和用户数据x生成第i噪声δ
i
;将所述δ
i
输入到所述第i混淆模块,具体包括:所述电子设备通过第i恢复器对第i
‑
1特征向量z
i
‑1进行还原处理,并基于还原数据和用户数据x生成第i噪声δ
i
;将所述δ
i
输入到所述第i混淆模块。9.根据权利要求1
‑
8任一项所述的方法,其特征在于,所述方法还包括:所述电子设备获取反馈信息label,所述反馈信息label用于表征用户反馈的正确解码数据,所述反馈信息label与所述特征向量z
N
一一对应;所述电子设备向云端设备发送反馈信息label;所述特征向量z
N
和反馈信息label用于所述云端设备对解码器进行监督训练,更新所述解码器的解码参数。10.一种数据保护方法,其特征在于,所述方法应用于云端设备,所述云端设备包括数据保护模型,所述数据保护模型包括一个解码器:所述云端设备获取来自电子设备的第N特征向量z
N
;所述云端设备通过所述解码器对所述第N特征向量z
N
进行预测处理,得到解码数据y
k
:y
k
=Dec
k
(z
N
,β
k
)其中,所述Dec
k
为第三神经网络模型,所述β
k
为所述第三神经网络模型的参数。11.根据权利要求10所述的方法,其特征在于,所述β
k
以第一目标函数的最小值为目标训练而成;所述第一目标函数是解码数据y
′
和理想输出数据y之间的损失函数,所述理想输出数据y是用户数据x经过所述解码器输出的正确结果,所述解码数据y
′
是所述解码器基于所述第N特征向量z
N
处理得到的结果。
12.根据权利要求10或11所述的方法,其特征在于,所述方法还包括:所述云端设备接收来自终端设备的反馈信息label,将所述解码数据y
k
和所述反馈数据label作为训练样本,对所述解码器进行监督训练,并将解码器参数β
k
更新为训练后的参数。13.一种数据保护装置,所述装置为电子设备,其特征在于,所述装置包括一个编码器、一个混淆器和一个恢复器,其中:所述混淆器的所述混淆器包括N个混淆模块,所述N个混淆模块分别为第1混淆模块、第2混淆模块、
…...
【专利技术属性】
技术研发人员:王宇然,桂韬,张奇,陆劲竹,丁勇,张轶博,
申请(专利权)人:复旦大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。