【技术实现步骤摘要】
基于动态神经网络的医疗隐私数据识别方法
[0001]本专利技术属于安全网络
,更进一步涉及一种医疗隐私数据识别方法,可用于数据脱敏、基因诊断、疾病预防。
技术介绍
[0002]医疗数据只有经过分析处理,才能将其中对于疾病的诊断、治疗和医学研究方面有价值的知识和规则挖掘出来,从而帮助进行基因工程、疾病治疗、病群特性的研究。然而,医疗数据作为个体最主要的识别符,其包含了大量的个人隐私敏感信息,比如某种疾病倾向和家族病史信息,故医疗数据的使用引起了广泛的隐私关注。医疗数据利用的局限主要体现在两个方面,一是医疗数据利用的安全性取决于攻击者所掌握的背景知识多少,二是无法提供一种严格的数学证明来衡量其隐私保护程度。医疗隐私数据识别是一个非常关键的研究课题。当攻击者得到带噪声的数据后,需要有效的技术限制攻击者对原数据的推导能力,使得攻击者无法通过观察计算结果而获取准确的个体信息。另外,医疗隐私数据也存在非独立同分布的情况,其全局表征程度也影响结果的准确性。医疗隐私数据识别可以应用于数据脱敏,支持敏感数据自动发现并生成数据字典,保留原 ...
【技术保护点】
【技术特征摘要】
1.一种基于动态神经网络的医疗隐私数据识别方法,其特征在于,包括:A)从医疗隐私数据库中依次采集原始数据p、目标数据q,从原始数据p中选取易受攻击数据r,在易受攻击数据r上加入服从拉普拉斯分布的随机噪声,得到差分隐私数据μ;B)从差分隐私数据μ中提取特征向量γ,根据特征向量γ计算得到嵌入数据z,并根据嵌入数据z计算得到特征数据s;C)根据特征数据s通过正参考模型法计算得到参考数据ξ;D)构建标记数据t:D1)将目标数据q加入到参考数据ξ中得到联合数据u;D2)根据联合数据u,分别利用联合建模法和联邦学习法计算得到建模数据j和联邦数据g,并用这两种数据组成标记数据t;E)对标记数据t分别按照70%,20%,10%进行抽取,组成训练样本集,测试样本集,验证样本集,获得验证样本集中的真实标签值a;F)构建依次由输入层,隐藏层,输出层级联组成的动态神经网络;G)设置最大迭代轮次数为100,将训练样本集和测试样本集输入到动态神经网络中,利用动态学习方法进行动态神经网络的训练,直到动态神经网络达到最大迭代轮次数,得到训练好的动态神经网络;H)将验证样本集中标记数据输入到已经训练好的动态神经网络中,得到医疗隐私数据识别结果。2.根据权利要求1所述的方法,其特征在于,A)中服从拉普拉斯分布的随机噪声,表示如下:其中,v表示服从拉普拉斯分布的随机噪声,λ表示位置参数,m表示尺度参数。3.根据权利要求1所述的方法,其特征在于,B)中从差分隐私数据μ中提取特征向量γ,根据特征向量γ计算得到嵌入数据z,根据嵌入数据z计算得到特征数据s,实现如下:B1)根据差分隐私数据μ计算聚类簇:其中,μ表示差分隐私数据;B2)根据聚类簇计算特征向量:其中,k表示特征类别数,β表示特征函数,λ表示平滑参数;B3)根据特征向量γ计算得到嵌入数据:z=α(γ,θ),其中,α表示嵌入函数,θ表示嵌入参数;B4)根据嵌入数据z计算得到特征数据:其中,f表示特征函数,δ表示类别参数,表示标准参数。4.根据权利要求1所述的方法,其特征在于,C)中根据特征数据s通过正参考模型法计算得到参考数据ξ,实现如下:
C1)将特征数据s变换为行正交数据τ;C2)根据行正交数据τ计算得到参考数据:其中,表示优化率,c表示分类行参数,c
′
表示与c不同行的分类行参数,d表示分类列参数。5.根据权利要求1所述的方法,其特征在于,D2)根据联合数据u,分别利用联合建模法和联邦学习法计算得到建模数据j和联邦数据g,实现如下:D2.1)根据联合数据u求出对应的因子矩阵参数梯度R;D2.2)...
【专利技术属性】
技术研发人员:朱笑岩,张琳杰,冯鹏斌,马建峰,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。