电子病历发布隐私保护方法技术

技术编号：29674316 阅读：38 留言：0更新日期：2021-08-13 21:56

本发明专利技术公开了一种电子病历发布隐私保护方法，包括如下步骤：S1、初始化电子病历原始二维数据表T及与该表对应的数据元标识；S2、计算每两条记录之间的距离，形成另一个二维数据表D；S3、将第一条记录与剩余记录之间的距离按从小到大排序，得到数组array；S4、第一条记录array[0]与剩余记录距离最远的并且未聚类的记录array[n‑1]设为t

全部详细技术资料下载

【技术实现步骤摘要】
电子病历发布隐私保护方法
本专利技术涉及一种电子病历发布隐私保护方法。
技术介绍
随着信息和网络技术发展，医疗数据多以电子化的形式在多个机构之间分布，出于临床诊断、科研及教学的需要，其中以电子病历为核心的医疗信息的分享、复制和传播越来越频繁，医疗数据中包含的个人隐私信息的泄露问题也变得日益重要而不容忽视。医疗卫生机构通常将电子病历以数据表的形式进行对外发布，数据表中使用标识属性ID、准标识属性QI、敏感属性SA、其他属性Other构成一条记录刻画每一个个体。例如，在电子病历中，身份证号是标识属性，性别、年龄划分为准标识属性，疾病则是敏感属性。基于聚类的匿名化技术的基本思想是：首先将原始数据表根据一定的距离度量公式划分为若干个簇，其中簇内的记录相关，簇之间的记录不相关；然后将每个簇内记录的准标识属性泛化为相同的属性值，生成等价类，从而实现数据表的匿名化。常见的隐私保护模型有K-匿名模型和L-多样性模型。下面对泛化、等价组、K-匿名模型、L-多样性模型等基本概念给出定义。附图1是一张简化的...

【技术保护点】
1.一种电子病历发布隐私保护方法，其特征在于包括如下步骤：/nS1、初始化电子病历原始二维数据表T及与该表对应的数据元标识；/nS2、计算每两条记录之间的距离，形成另一个二维数据表D，两条记录之间的距离是将准标识属性和敏感属性这两个不同性质的属性统一映射到实数域中，然后计算准标识属性和敏感属性取值的距离之和；/nS3、将第一条记录与剩余记录之间的距离按从小到大排序，得到数组array；/nS4、第一条记录array[0]与剩余记录距离最远的并且未聚类的记录array[n-1]设为t

【技术特征摘要】
1.一种电子病历发布隐私保护方法，其特征在于包括如下步骤：
S1、初始化电子病历原始二维数据表T及与该表对应的数据元标识；
S2、计算每两条记录之间的距离，形成另一个二维数据表D，两条记录之间的距离是将准标识属性和敏感属性这两个不同性质的属性统一映射到实数域中，然后计算准标识属性和敏感属性取值的距离之和；
S3、将第一条记录与剩余记录之间的距离按从小到大排序，得到数组array；
S4、第一条记录array[0]与剩余记录距离最远的并且未聚类的记录array[n-1]设为tmax，依据表D，查找与记录tmax距离最近、次近的记录，排除第一条记录、已聚类的记录以及其本身，直到满足k条，则k条记录就是一个簇；
S5、重复执行步骤S4，直至数组array中还未聚类的记录剩余k-1条，则聚类完成，所有记录都被分配到合适的簇中；
S6、对所有簇进行逐条泛化后发布。

2.如权利要求1所述的电子病历发布隐私保护方法，其特征在于，
步骤S2中将准标识属性和敏感属性这两个不同性质的属性统一映射到实数域的方法如下，
数值型属性数据之间的距离：设准标识属性V为数值型属性并且在实数域上是连...

【专利技术属性】
技术研发人员：李法珍，王永起，金健，焦正坤，张振雷，
申请(专利权)人：同智伟业软件股份有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人