一种基于匿名化算法的结构化医学数据共享隐私保护方法技术

技术编号:41882839 阅读:41 留言:0更新日期:2024-07-02 00:37
本发明专利技术公开了一种基于匿名化算法的结构化医学数据共享隐私保护方法,涉及隐私保护技术领域,包括:确定结构化医学数据集中需要进行匿名化的所有属性,采用MSAK匿名算法第一次聚类将原始数据集划分为多个第一子数据集,分离第一子数据集的离群值,形成第二子数据集和第一待分配元组集合;第二次聚类对每个第二子数据集聚类,生成多个由相似元组构成的聚类簇,判断聚类簇的大小和过远元组剪裁,形成第一聚类簇集合、第二聚类簇集合和第二待分配元组集合;在所有聚类簇的基础上进行第三次聚类,将所有待分配元组分配到第一聚类簇集合、第二聚类簇集合中,用聚类中心取代聚类簇内所有元组,生成满足隐私保护模型的等价类,实现数据的匿名化。

【技术实现步骤摘要】

本专利技术涉及隐私保护,更具体的说是涉及一种基于匿名化算法的结构化医学数据共享隐私保护方法


技术介绍

1、目前,随着大数据和医疗信息化建设的发展,数据共享成为了大数据利用和学术研究过程中的重要环节。医学数据涉及许多个人的生命健康安全相关信息,如何在医学数据共享过程中,实现有效的隐私保护是一个值得研究和探索的问题。近年来,各国人员都在不断加强对医学数据共享隐私保护的研究,包括数据收集、数据保存和数据使用等环节的隐私保护问题。在数据收集阶段就应该完成对医学数据的匿名化处理,保证匿名化后的数据不能复原且不能被重新识别或关联是数据隐私保护的共同要求。

2、然而,匿名化处理往往会造成较大的数据质量下降。因为医学数据具有安全性、准确性、海量性、异质性和复杂性等特点,导致现有的匿名化算法在医学数据的匿名化处理过程表现较差,造成信息损失较多。

3、因此,如何提供一种基于匿名化算法的结构化医学数据共享隐私保护方法,尽可能地在满足隐私保护要求的前提下,减少信息损失,保留更多的数据质量是本领域技术人员亟需解决的问题。


>

技术实本文档来自技高网...

【技术保护点】

1.一种基于匿名化算法的结构化医学数据共享隐私保护方法,其特征在于,包括:

【技术特征摘要】

1.一种基于匿名化算法的结构化医学数据...

【专利技术属性】
技术研发人员:钱庆唐明坤吴思竹
申请(专利权)人:中国医学科学院医学信息研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1