一种基于信息瓶颈的医学图像脱敏方法技术

技术编号：40533718 阅读：9 留言：0更新日期：2024-03-01 13:55

本发明专利技术属于信息技术的图像编码技术领域，更具体地，涉及一种基于信息瓶颈的医学图像脱敏方法。所述方法包括获取患者隐私数据以及对应的数据标签；设计PM模型，所述PM模型包括特征提取模块、特征分布变换模块和特征对抗性重构模块；将患者隐私数据输入PM模型映射为查询数据，并通过优化函数进行优化；将数据集输入医学云模型，输出查询数据标签；利用分割学习的方法更新PM。本发明专利技术解决了现有技术中患者在不依赖医学云端服务器的情况下无法定义自己的PM，泄露患者隐私的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于信息技术的图像编码，更具体地，涉及一种基于信息瓶颈的医学图像脱敏方法。

技术介绍

1、医学数据的分析对于医学研究和临床诊断具有重要意义。然而，医学数据中往往包含患者的敏感信息，包括患者的面部信息、ct信息等。这些信息的泄露可能会侵犯患者的隐私权。因此，医学图像数据脱敏在医学研究、临床诊断和医疗数据共享等方面具有重要意义。

2、mlaas的工作流程需要患者向医学云端服务商提供隐私数据，这可能会带来隐私问题。为了解决由于mlaas中隐私查询数据的需求而引起的隐私问题，已经做了许多努力。目前的隐私保护机器学习方法通常是通过操纵数据像素、颜色通道或数据特征来防止隐私泄露。zhang等人使用属性混淆和属性对抗网络来生成隐藏各种属性的扰动图像，同时保留了人脸验证的效用。wang等人提出了一种分析网络，该网络执行隐私—效用权衡分析，以识别对人脸图像可视化重要但对保持高识别精度不重要的通道。mi等人利用人类和模型之间的感知差异，在隐私数据中修剪人类可感知的低频成分，以隐藏视觉信息。

3、中国专利技术专利cn56579010a公开了一种针对医疗敏感数据的安全应用方法、设备及存储介质，方法包括：基于预设的敏感识别算法，对待应用医疗数据源中的待抽取数据进行敏感信息识别，以确定待抽取数据中的敏感实体；基于敏感实体对应的敏感信息类型，确定对应的脱敏规则进行脱敏处理，并将脱敏处理后的结果数据上传到可信执行环境中。

4、然而，现有的方法要求医学服务提供商向患者提供隐私保护方法（pm），患者在进行查询之前，使用

技术实现思路

1、本专利技术旨在克服上述现有技术的至少一种缺陷，提供一种基于信息瓶颈的医学图像脱敏方法，以解决现有技术中解决患者隐私保护等问题。

2、本专利技术详细的技术方案如下：

3、s1、获取患者隐私数据x以及x对应的数据标签y。

4、s2、设计pm模型，所述pm模型包括特征提取模块、特征分布变换模块和特征对抗性重构模块；

5、所述特征提取模块提取与患者隐私数据最相关医学特征；

6、所述特征分布变换模块用于将最相关医学特征z映射到分布q中，将患者隐私数据的原分布映射到新的分布q中，对原数据进行隐私保护；

7、所述特征对抗性重构模块用于将分布q中的数据重构为医学云模型所接受的服务格式，进一步稀释特征。

8、s3、将患者隐私数据x输入pm模型映射为查询数据x'，并通过优化函数进行优化：

9、（1）；

10、公式（1）中，是使后面的公式即l1+l2+达到最小值时的变量的取值；l1和l2分别是患者隐私数据的正则化项和效用正则化项；是自定义优化因子；

11、优化l1，即最小化隐私数据x和查询数据x'的互信息：

12、（2）；

13、公式（2）中， i表示互信息， φ是将x映射到x'的函数，即 φ（x）=x'；

14、对于l2：

15、（3）；

16、公式（3）中，dkl代表最小化和二者之间的kl散度距离，k（）为医学云模型对查询数据x'的处理函数；为x的原始分布；为x'在低维空间的分布；z为患者隐私数据x的最相关医学特征；

17、将x映射到x'时，保证x≠x'并且k（x）=k（x'），将l2广义化为：

18、（4）；

19、公式（4）中，y'是对应x'输出的查询数据标签，pf是医学云模型的输出所在分布，d表示距离度量。

20、所述s3具体包括：

21、s31、将患者隐私数据x利用信息瓶颈特征提取最相关医学特征z；

22、利用信息瓶颈对患者隐私数据x中与患者疾病最相关的医学特征提取为特征z，将其他无关特征扭曲、抹除，最大程度保护患者隐私；

23、信息瓶颈可以帮助医学云服务尽可能将医疗数据中与医疗服务相关的特征提取出来，筛选其他无关的特征，被筛选的特征也包含隐私信息（如背景信息、病症信息等），最大程度保护患者隐私。

24、s32、将最相关医学特征z映射到分布q中；

25、优选的，q表示正态分布，则，其中，分别代表均值和方差，θ是q的决定性参数，即为均值和方差。

26、s33、当分布q的决定性参数θ被确定时，从q（θ）中随机采样得到低维特征z'；对于相同的输入x，每个采样的z'可以不同，这种随机抽样过程进一步增强了隐私保护效果，但直接将z'发送到医学服务器可能会导致两个问题：

27、第一，医学服务器所需的数据格式与z'不一致；

28、第二，z'可能仍然包含与隐私相关的信息；

29、因此，通过进一步对抗性地将z'重构为x'来解决这两个问题。

30、s34、将低维特征z'对抗性重构为查询数据x'，由查询数据x'构成训练医学云模型的数据集；

31、对z'进行逆重构，进一步增大了x和x'在高维和低维空间中的表示差距，有效地减少了x和x'之间的互信息：

32、

33、（5）；

34、公式（5）中，e表示为均值，是最大化z'与x'在高维和低维的信息差异，d1是高维空间中z'与x'的差异，d2是低维空间中z'与x'的差异；fe是特征提取。

35、s4、将数据集输入医学云模型，输出查询数据标签y'：

36、。

37、s5、利用分割学习的方法更新pm；

38、pm模型构建完成后，仍需要对其进行训练，以确保隐私效用的权衡，医学云端可以与患者合作培训pm，但他们不想向用户公开自己的云模型；患者无法访问医学云端的y和y'输出，同样，用户也不希望将他们的pm提交给云端进行训练，因此，我们利用分割学习来促进更新过程。

39、与现有技术相比，本专利技术的有益效果为：

40、1.本专利技术提出一种基于信息瓶颈的医学图像脱敏方法，不依赖任何第三方，利用分割学习的方法，患者端在本地进行训练，训练的时候需要医学云端进行辅助，不需要可信第三方的参与，进一步增强了患者的隐私保护。

41、2.本专利技术提出一种基于信息瓶颈的医学图像脱敏方法，建立了中间的pm模型，将患者隐私数据转化为查询数据，能够使用户隐私数据在本地，可不借助原来的隐私数据而使用查询数据获取服务；并且本专利技术仅关注患者隐私数据中最相关的部分，不需要对其他冗余信息进行处理，相比于其他方法具有很好的隐私效用权衡，更加高效，所需要的时间和空间都相对低。

本文档来自技高网...

【技术保护点】

1.一种基于信息瓶颈的医学图像脱敏方法，其特征在于，包括；

2.根据权利要求1所述的一种基于信息瓶颈的医学图像脱敏方法，其特征在于，所述优化函数包括：

3.根据权利要求2所述的一种基于信息瓶颈的医学图像脱敏方法，其特征在于，所述S3具体包括：

4.根据权利要求1所述的一种基于信息瓶颈的医学图像脱敏方法，其特征在于，所述利用分割学习的方法更新PM模型具体包括：

【技术特征摘要】

1.一种基于信息瓶颈的医学图像脱敏方法，其特征在于，包括；

2.根据权利要求1所述的一种基于信息瓶颈的医学图像脱敏方法，其特征在于，所述优化函数包括：

3.根据权利要求2所述...

【专利技术属性】
技术研发人员：崔磊，孙守岳，吴峰，张英志，高龙翔，曲悠扬，顾树俊，
申请(专利权)人：山东省计算中心国家超级计算济南中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人