一种医院数据隐私保护方法及装置制造方法及图纸

技术编号:35423683 阅读:10 留言:0更新日期:2022-11-03 11:25
本发明专利技术涉及医疗数据隐私处理技术领域,更具体的说,涉及一种医院数据隐私保护方法及装置。本方法包括:步骤S1、将需要共享的医疗数据中的隐私数据进行选择并标记,标记隐私数据中的可识别符、特殊病种和病人特殊身份;步骤S2、将标记后的数据,根据使用场景进行分类集合,形成公用数据集、有限数据集和可识别数据集;步骤S3、分别对公用数据集、有限数据集和可识别数据集进行不同程度的隐私数据保护处理;步骤S4、将处理后的公用数据集、有限数据集和可识别数据集应用于不同的使用场景。本发明专利技术通过针对不同的应用场景将数据库的数据去标识化,有效降低数据隐私泄露的可能性,保障数据共享价值可用,提升数据共享应用的安全性和操作性。性。性。

【技术实现步骤摘要】
一种医院数据隐私保护方法及装置


[0001]本专利技术涉及医疗数据隐私处理
,更具体的说,涉及一种医院数据隐私保护方法及装置。

技术介绍

[0002]医疗数据共享应用价值巨大,基于区域健康信息平台的健康医疗大数据正在逐步开放共享。
[0003]然而,这些数据涉及患者个人隐私和公共利益,因此需要进行特殊的隐私保护。特别是随着《个人信息保护法》出台,更是对于个人信息的处理与利用提出了更高要求。
[0004]目前对医疗数据的处理并没有考虑到数据隐私保护与数据共享之间的平衡问题。中国专利技术专利CN201910522671.7提出了一种医疗数据处理方法、装置以及系统,所述方法包括利用医疗数据处理装置中所包括的与所述医疗数据对应的医疗数据处理模型组件对接收的医疗数据执行处理,获取与所述医疗数据对应的医疗诊断信息。上述专利技术可以在保证医疗数据隐私性的情况下获取到针对医疗数据的医疗诊断信息,但是没有揭示如何进行医疗数据共享。
[0005]因此,如何在医疗数据共享应用与数据隐私有效保护之间达到平衡,是目前急需解决问题。

技术实现思路

[0006]本专利技术的目的是提供一种医院数据隐私保护方法及装置,解决现有技术中医疗数据共享应用与数据隐私有效保护之间难以达到平衡的问题。
[0007]为了实现上述目的,本专利技术提供了一种医院数据隐私保护方法,包括以下步骤:
[0008]步骤S1、将需要共享的医疗数据中的隐私数据进行选择并标记,标记隐私数据中的可识别符、特殊病种和病人特殊身份;
[0009]步骤S2、将步骤S1中标记后的数据,根据使用场景进行分类集合,形成公用数据集、有限数据集和可识别数据集;
[0010]步骤S3、分别对公用数据集、有限数据集和可识别数据集进行不同程度的隐私数据保护处理;
[0011]对公用数据集中的数据进行去标记化处理,对处理后的数据进行重实别测试以判断隐私数据关联度是否满足要求;
[0012]对有限数据集中的标记数据进行加密和泛化,同时将数据密级进行区分标注;
[0013]对可识别数据集的隐私数据不进行保护处理;
[0014]步骤S4、将步骤S3处理后的公用数据集、有限数据集和可识别数据集应用于不同的使用场景。
[0015]在一实施例中,所述步骤S1中隐私数据的可识别符包含证件信息、账户信息、生物识别信息及身体部分图片信息;
[0016]所述步骤S1中隐私数据的特殊病种包含性生殖相关疾病、传染性疾病、心理疾病、恶性肿瘤、遗传性疾病、肛门疾病、罕见病及其他不治之症;
[0017]所述步骤S1中隐私数据的病人特殊身份包含孕产妇和恶性肿瘤患者。
[0018]在一实施例中,所述步骤S2中的使用场景包括科研院所、医院和患者;
[0019]所述步骤S4进一步包括:
[0020]将步骤S3处理后的公用数据集用于科研研究应用场景,将步骤S3处理后的有限数据集用于医院调阅场景,将可识别数据集用于患者使用场景。
[0021]在一实施例中,所述步骤S3的去标记化处理,进一步包括:
[0022]去除识别符,年龄泛化;
[0023]诊断计数小于第一计数值的资料做隐私化处理;
[0024]删除姓名、住院号、电话、出院日期和出院诊断信息;
[0025]插入患者序号列;
[0026]年龄泛化为年龄段;
[0027]转归结果以特定数字代替;
[0028]单个计数小于预设数量的诊断科室以特殊符号的科室进行代替。
[0029]在一实施例中,所述步骤S3对处理后的数据进行重实别测试,进一步包括:
[0030]将去标记化前的隐私数据记为X={x1,x2,....x
n
};
[0031]将去标记后的隐私数据记为Y={y1,y2,...y
n
};
[0032]根据相似度对比公式进行相似度对比,对应的表达式为:
[0033][0034]其中,p
i
为第i个去标记化前的隐私数据与其去标记后的隐私数据的相似度,n为隐私数据总数量;
[0035]当有任一项相似度p
i
小于预设阈值,则认为处理后的医疗数据隐私数据和处理前的医疗数据隐私数据关联度不满足要求,重新进行去标记化处理。
[0036]在一实施例中,所述步骤S3中对标记数据进行加密,进一步包括对标记数据按照数据密级和颗粒度进行区分标注;
[0037]所述数据密级根据可识别符、特殊病种和病人特殊身份进行区分定义;
[0038]所述颗粒度根据不同详细程度资料的隐私级别进行分类,包括概要级资料、摘要级资料和详细级资料:
[0039]所述概要级资料为医院数据的部分名称概要;
[0040]所述摘要级资料为小结报告类材料;
[0041]所述详细级资料为详细病例类材料。
[0042]在一实施例中,所述步骤S4中将步骤S3处理后的有限数据集用于医院调阅场景,进一步包括:
[0043]通过将医生的科室、职称、诊疗组与数据密级、颗粒度进行匹配,设置医生调阅数据的权限。
[0044]在一实施例中,所述步骤S4中,将步骤S3处理后的公用数据集用于科研研究应用
场景,进一步包括:
[0045]对于不同数据密级的隐私数据通过不同传递方式进行数据传输。
[0046]在一实施例中,所述步骤S4中,将步骤S3处理后将可识别数据集用于患者使用场景,进一步包括:
[0047]患者输入相关身份信息,使用可识别数据集,查询与患者自身相关的健康医疗信息。
[0048]在一实施例中,所述步骤S4中,患者输入相关身份信息,进一步还包括:注册身份信息,关联实名制手机号信息,设置账号密码;
[0049]所述步骤S4中,查询与患者自身相关的健康医疗信息,进一步还包括:
[0050]对可查询信息进行内容限制;
[0051]对可查询信息进行时间限制;
[0052]对可查询信息进行操作权限的限制。
[0053]为了实现上述目的,本专利技术提供了一种医院数据隐私保护装置,包括:
[0054]存储器,用于存储可由处理器执行的指令;
[0055]处理器,用于执行所述指令以实现如上述任一项所述的方法。
[0056]为了实现上述目的,本专利技术提供了一种计算机可读介质,其上存储有计算机指令,其中当计算机指令被处理器执行时,执行如上述任一项所述的方法。
[0057]本专利技术提出的一种医院数据隐私保护方法及装置,通过针对不同的应用场景将数据库的数据去标识化,达到医疗数据共享应用与数据隐私有效保护之间的平衡,同时有效降低数据隐私泄露的可能性,保障数据共享价值可用,有效提升数据共享应用的安全性和操作性。
附图说明
[0058]本专利技术上述的以及其他的特征、性质和优势将通过下面结合附图和实施例的描述而变的更加明显,在附图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医院数据隐私保护方法,其特征在于,包括以下步骤:步骤S1、将需要共享的医疗数据中的隐私数据进行选择并标记,标记隐私数据中的可识别符、特殊病种和病人特殊身份;步骤S2、将步骤S1中标记后的数据,根据使用场景进行分类集合,形成公用数据集、有限数据集和可识别数据集;步骤S3、分别对公用数据集、有限数据集和可识别数据集进行不同程度的隐私数据保护处理;对公用数据集中的数据进行去标记化处理,对处理后的数据进行重实别测试以判断隐私数据关联度是否满足要求;对有限数据集中的标记数据进行加密和泛化,同时将数据密级进行区分标注;步骤S4、将步骤S3处理后的公用数据集、有限数据集和可识别数据集应用于不同的使用场景。2.根据权利要求1所述的医院数据隐私保护方法,其特征在于,所述步骤S1中隐私数据的可识别符包含证件信息、账户信息、生物识别信息及身体部分图片信息;所述步骤S1中隐私数据的特殊病种包含性生殖相关疾病、传染性疾病、心理疾病、恶性肿瘤、遗传性疾病、肛门疾病、罕见病及其他不治之症;所述步骤S1中隐私数据的病人特殊身份包含孕产妇和恶性肿瘤患者。3.根据权利要求1所述的医院数据隐私保护方法,其特征在于,所述步骤S2中的使用场景包括科研院所、医院和患者;所述步骤S4进一步包括:将步骤S3处理后的公用数据集用于科研研究应用场景,将步骤S3处理后的有限数据集用于医院调阅场景,将可识别数据集用于患者使用场景。4.根据权利要求1所述的医院数据隐私保护方法,其特征在于,所述步骤S3的去标记化处理,进一步包括:去除识别符,年龄泛化;诊断计数小于第一计数值的资料做隐私化处理;删除姓名、住院号、电话、出院日期和出院诊断信息;插入患者序号列;年龄泛化为年龄段;转归结果以特定数字代替;单个计数小于预设数量的诊断科室以特殊符号的科室进行代替。5.根据权利要求1所述的医院数据隐私保护方法,其特征在于,所述步骤S3对处理后的数据进行重实别测试,进一步包括:将去标记化前的隐私数据记为X={x1,x2,....x
n
};将去标记后的隐私数据记为Y={y1,y2,...y
n
};根据相似度对比公式进行相似度对比,对应的表达式为:
其中,p
i

【专利技术属性】
技术研发人员:于广军马诗诗王志刚
申请(专利权)人:上海蓬海涞讯数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1