【技术实现步骤摘要】
一种满足差分隐私约束的临床路径建立及优化方法
[0001]本专利技术涉及医疗数据处理领域,具体涉及一种满足差分隐私约束的临床路径建立及优化方法。
技术介绍
[0002]临床路径是指针对特定疾病建立的一种标准化的治疗模式和治疗程序,它将诊疗过程分为若干阶段,规定了每个阶段所用的诊疗项目,是提高临床治疗护理质量、提高医疗质量和控制医疗成本的有效途径。传统临床路径大都由专家研讨制定,从循证医学角度出发,它们在一定程度上缺少数据的支持。随着医疗信息化的迅猛发展,各地积累了大量的医疗数据。数据挖掘技术能充分利用已有数据的信息,为临床路径的制定提供参考和指导,使临床路径的制定更具科学性和合理性。因此,基于数据挖掘技术从海量医学数据中挖掘生成临床路径得到了越来越多的关注。
[0003]虽然已有大量基于数据挖掘的临床路径建立的相关技术和方法,但这些方法还存在以下问题:没有关注患者医疗数据的隐私泄露问题。如图1所示,可信的数据管理员通过对患者真实数据进行预处理,建立患者序列数据集,然后对序列数据集做序列模式挖掘,将挖掘结果(频繁序列模式)通过数据查询接口给第三方研究人员。不可信研究人员通过对频繁序列模式进行评估选择,建立临床路径。在这种场景中,由于患者共享的医疗数据是个体敏感信息,即使医疗机构发布给第三方研究机构是真实数据的统计信息,恶意的攻击者结合已有的背景知识,通过重新识别攻击、链接攻击等手段,借助匿名数据的统计分析值的变化,也能推断出某个患者的患病信息。为此,亟需对临床路径建立问题中的用户数据隐私进行保护。
[0
【技术保护点】
【技术特征摘要】
1.一种满足差分隐私约束的临床路径建立及优化方法,其特征在于,包括以下步骤:获取目标疾病患者的住院治疗项目及时间信息,建立目标疾病对应的匿名治疗项目序列数据集;统计所述匿名治疗项目序列数据集中不同治疗项目间的同现频率,根据所述同现频率得到匿名治疗项目序列数据集中每个治疗项目的原子拓展项目和序列拓展项目,并对各原子拓展项目和各序列拓展项目添加第一差分隐私噪声;扫描所述匿名治疗项目序列数据集,建立所述匿名治疗项目序列数据集对应的1
‑
序列的垂直列表,对1
‑
序列的垂直列表添加第二差分隐私噪声;基于添加第二差分隐私噪声后的1
‑
序列的垂直列表,找出噪声支持度大于支持度阈值的1
‑
序列模式记为频繁1
‑
序列模式;以频繁1
‑
序列模式为基础,递归调用候选序列模式生成过程生成候选路径集合,利用添加第一差分隐私噪声后的原子拓展项目和序列拓展项目对生成的候选路径集合进行剪枝,并对剪枝后的候选路径集合添加第三差分隐私噪声;基于添加第三差分隐私噪声后的候选路径集合,找出噪声支持度大于支持度阈值的候选路径集合作为频繁k
‑
序列模式,k≥2;将频繁n
‑
序列模式通过查询接口提供给不可信临床路径研究人员,n≥1。2.根据权利要求1所述的满足差分隐私约束的临床路径建立及优化方法,其特征在于,所述第一差分隐私噪声为Laplace(b),Laplace(b)表示噪声尺度参数为b的拉普拉斯噪声,ω2表示匿名治疗项目序列数据集最长序列中包含的最大候选2
‑
序列数,|C2|表示挖掘中真实的候选2
‑
序列数,ε表示设定隐私保护强度,α为隐私预算分配比例,0<α<1。3.根据权利要求1所述的满足差分隐私约束的临床路径建立及优化方法,其特征在于,所述第二差分隐私噪声为m代表频繁序列的最大长度;Δf表示计算候选1
‑
序列的全局敏感度,为添加或删除任一序列后对候选1
‑
序列数带来的最大变化量,ε表示设定隐私保护强度,α为隐私预算分配比例,0<α<1。4.根据权利要求1所述的满足差分隐私约束的临床路径建立及优化方法,其特征在于,所述第三差分隐私噪声为m代表频繁序列的最大长度;Δf表示计算候选k
‑
序列的全局敏感度,为添加或删除任一序列后对候选k
‑
序列数带来的最大变化量,ε表示设定隐私保护强度,α为隐私预算分配比例,0<α<1。5.根据权利要求3所述的满足差分隐私约束的临床路径建立及优化方法,其特征在于,所述对1
‑
序列的垂直列表添加第二差分隐私噪声,包括:正噪声扰动处理:根据1
‑
序列垂直列表结构特点,对表头节点的真实计数值添加正向的拉普拉斯噪声,同时根据噪声量对1
‑
序列垂直列表项添加dummy虚假节点,每个dummy结点项包含dummy SID和dummy TID;负噪声扰动处理:根据1...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。