当前位置: 首页 > 专利查询>河南大学专利>正文

一种满足差分隐私约束的临床路径建立及优化方法技术

技术编号:33920145 阅读:19 留言:0更新日期:2022-06-25 20:54
本发明专利技术涉及一种满足差分隐私约束的临床路径建立及优化方法,属于医疗数据处理领域。该方法包括以下步骤:获取目标疾病患者的住院治疗项目及时间信息,建立匿名治疗项目序列数据集,并对其中的各原子拓展项目和各序列拓展项目添加第一差分隐私噪声;扫描建立匿名治疗项目序列数据集对应的1

【技术实现步骤摘要】
一种满足差分隐私约束的临床路径建立及优化方法


[0001]本专利技术涉及医疗数据处理领域,具体涉及一种满足差分隐私约束的临床路径建立及优化方法。

技术介绍

[0002]临床路径是指针对特定疾病建立的一种标准化的治疗模式和治疗程序,它将诊疗过程分为若干阶段,规定了每个阶段所用的诊疗项目,是提高临床治疗护理质量、提高医疗质量和控制医疗成本的有效途径。传统临床路径大都由专家研讨制定,从循证医学角度出发,它们在一定程度上缺少数据的支持。随着医疗信息化的迅猛发展,各地积累了大量的医疗数据。数据挖掘技术能充分利用已有数据的信息,为临床路径的制定提供参考和指导,使临床路径的制定更具科学性和合理性。因此,基于数据挖掘技术从海量医学数据中挖掘生成临床路径得到了越来越多的关注。
[0003]虽然已有大量基于数据挖掘的临床路径建立的相关技术和方法,但这些方法还存在以下问题:没有关注患者医疗数据的隐私泄露问题。如图1所示,可信的数据管理员通过对患者真实数据进行预处理,建立患者序列数据集,然后对序列数据集做序列模式挖掘,将挖掘结果(频繁序列模式)通过数据查询接口给第三方研究人员。不可信研究人员通过对频繁序列模式进行评估选择,建立临床路径。在这种场景中,由于患者共享的医疗数据是个体敏感信息,即使医疗机构发布给第三方研究机构是真实数据的统计信息,恶意的攻击者结合已有的背景知识,通过重新识别攻击、链接攻击等手段,借助匿名数据的统计分析值的变化,也能推断出某个患者的患病信息。为此,亟需对临床路径建立问题中的用户数据隐私进行保护。
[0004]差分隐私模型是目前学术界和工业界广泛采用的数据隐私保护模型。相比于近年来的k

匿名、l

多样性和t

紧密性等需要基于特殊攻击假设和背景知识的隐私保护技术,差分隐私因其能够防止攻击者拥有任意背景知识下的攻击并提供有力的隐私保护,受到了极大关注并被广泛研究。差分隐私的主要思想是保证任意添加和删除数据集中的一条数据,算法计算结果不会受到太大的影响,从而实现个体隐私保护的目的。差分隐私的主要实现机制是噪声机制,主要包括拉普拉斯噪声机制、高斯机制和指数机制。为实现某种数据分析任务的差分隐私保护要求,需根据计算分析任务的敏感度和隐私预算添加满足拉普拉斯分布或高斯分布的噪声,以实现数据的差分隐私保护。
[0005]临床路径实际上是针对某种疾病的一系列检查、治疗以及护理行为按照时间先后顺序组成的一个序列。因此,临床路径的挖掘问题可以被转化为频繁序列模式挖掘问题。基于差分隐私的临床路径建立的关键问题是在序列模式挖掘过程中添加满足差分隐私约束的噪声。根据差分隐私的实现原理,需对序列模式挖掘处理过程添加随机噪声扰动处理,但存在以下问题:一是某些序列模式挖掘算法由于出现多次扫描原始敏感数据集造成隐私泄露风险增加,使得实现同等隐私保护度需要添加更多噪声,降低临床路径的准确性。二是序列模式挖掘过程中生成的候选临床路径数太大,任意添加或删除一个患者的治疗项目序列
数据后,对候选临床路径数带来的变动太大,为掩盖这种变化,实现用户数据隐私保护,所需添加的噪声量太多,严重降低了临床路径生成的准确度。

技术实现思路

[0006]为了解决现有方法存在的隐私化生成的临床路径的准确性较低的问题,本专利技术提供了一种满足差分隐私约束的临床路径建立及优化方法的技术方案,包括以下步骤:
[0007]获取目标疾病患者的住院治疗项目及时间信息,建立目标疾病对应的匿名治疗项目序列数据集;
[0008]统计所述匿名治疗项目序列数据集中不同治疗项目间的同现频率,根据所述同现频率得到匿名治疗项目序列数据集中每个治疗项目的原子拓展项目和序列拓展项目,并对各原子拓展项目和各序列拓展项目添加第一差分隐私噪声;
[0009]扫描所述匿名治疗项目序列数据集,建立所述匿名治疗项目序列数据集对应的1

序列的垂直列表,对1

序列的垂直列表添加第二差分隐私噪声;基于添加第二差分隐私噪声后的1

序列的垂直列表,找出噪声支持度大于支持度阈值的1

序列模式记为频繁1

序列模式;
[0010]以频繁1

序列模式为基础,递归调用候选序列模式生成过程生成候选路径集合,利用添加第一差分隐私噪声后的原子拓展项目和序列拓展项目对生成的候选路径集合进行剪枝,并对剪枝后的候选路径集合添加第三差分隐私噪声;基于添加第三差分隐私噪声后的候选路径集合,找出噪声支持度大于支持度阈值的候选路径集合作为频繁k

序列模式,k≥2;将频繁n

序列模式通过查询接口提供给不可信临床路径研究人员,n≥1。
[0011]进一步地,所述第一差分隐私噪声为Laplace(b),Laplace(b)表示噪声尺度参数为b的拉普拉斯噪声,ω2表示匿名治疗项目序列数据集最长序列中包含的最大候选2

序列数,|C2|表示挖掘中真实的候选2

序列数,ε表示设定隐私保护强度,α为隐私预算分配比例,0<α<1。
[0012]进一步地,所述第二差分隐私噪声为m代表频繁序列的最大长度;Δf表示计算候选1

序列的全局敏感度,为添加或删除任一序列后对候选1

序列数带来的最大变化量,ε表示设定隐私保护强度,α为隐私预算分配比例,0<α<1。
[0013]进一步地,所述第三差分隐私噪声为m代表频繁序列的最大长度;Δf表示计算候选k

序列的全局敏感度,为添加或删除任一序列后对候选k

序列数带来的最大变化量,ε表示设定隐私保护强度,α为隐私预算分配比例,0<α<1。
[0014]进一步地,所述对1

序列的垂直列表添加第二差分隐私噪声,包括:
[0015]正噪声扰动处理:根据1

序列垂直列表结构特点,对表头节点的真实计数值添加正向的拉普拉斯噪声,同时根据噪声量对1

序列垂直列表项添加dummy虚假节点,每个dummy结点项包含dummy SID和dummy TID;
[0016]负噪声扰动处理:根据1

序列垂直列表结构特点,对表头节点的真实计数值添加负向的拉普拉斯噪声,同时根据噪声量对1

序列垂直列表中的节点记录进行删除,并设计
一个用来记录每个模式IDList中删除的记录的删除项列表。
[0017]进一步地,所述以频繁1

序列模式为基础,递归调用候选序列模式生成过程生成候选路径集合,利用添加第一差分隐私噪声后的原子拓展项目和序列拓展项目对生成的候选路径集合进行剪枝,并对剪枝后的候选路径集合添加第二差分隐私噪声;基于添加第二差分隐私噪声后的候选路径集合,找出噪声支持度大于支持度阈值的候选路径集合作为频繁k
...

【技术保护点】

【技术特征摘要】
1.一种满足差分隐私约束的临床路径建立及优化方法,其特征在于,包括以下步骤:获取目标疾病患者的住院治疗项目及时间信息,建立目标疾病对应的匿名治疗项目序列数据集;统计所述匿名治疗项目序列数据集中不同治疗项目间的同现频率,根据所述同现频率得到匿名治疗项目序列数据集中每个治疗项目的原子拓展项目和序列拓展项目,并对各原子拓展项目和各序列拓展项目添加第一差分隐私噪声;扫描所述匿名治疗项目序列数据集,建立所述匿名治疗项目序列数据集对应的1

序列的垂直列表,对1

序列的垂直列表添加第二差分隐私噪声;基于添加第二差分隐私噪声后的1

序列的垂直列表,找出噪声支持度大于支持度阈值的1

序列模式记为频繁1

序列模式;以频繁1

序列模式为基础,递归调用候选序列模式生成过程生成候选路径集合,利用添加第一差分隐私噪声后的原子拓展项目和序列拓展项目对生成的候选路径集合进行剪枝,并对剪枝后的候选路径集合添加第三差分隐私噪声;基于添加第三差分隐私噪声后的候选路径集合,找出噪声支持度大于支持度阈值的候选路径集合作为频繁k

序列模式,k≥2;将频繁n

序列模式通过查询接口提供给不可信临床路径研究人员,n≥1。2.根据权利要求1所述的满足差分隐私约束的临床路径建立及优化方法,其特征在于,所述第一差分隐私噪声为Laplace(b),Laplace(b)表示噪声尺度参数为b的拉普拉斯噪声,ω2表示匿名治疗项目序列数据集最长序列中包含的最大候选2

序列数,|C2|表示挖掘中真实的候选2

序列数,ε表示设定隐私保护强度,α为隐私预算分配比例,0<α<1。3.根据权利要求1所述的满足差分隐私约束的临床路径建立及优化方法,其特征在于,所述第二差分隐私噪声为m代表频繁序列的最大长度;Δf表示计算候选1

序列的全局敏感度,为添加或删除任一序列后对候选1

序列数带来的最大变化量,ε表示设定隐私保护强度,α为隐私预算分配比例,0<α<1。4.根据权利要求1所述的满足差分隐私约束的临床路径建立及优化方法,其特征在于,所述第三差分隐私噪声为m代表频繁序列的最大长度;Δf表示计算候选k

序列的全局敏感度,为添加或删除任一序列后对候选k

序列数带来的最大变化量,ε表示设定隐私保护强度,α为隐私预算分配比例,0<α<1。5.根据权利要求3所述的满足差分隐私约束的临床路径建立及优化方法,其特征在于,所述对1

序列的垂直列表添加第二差分隐私噪声,包括:正噪声扰动处理:根据1

序列垂直列表结构特点,对表头节点的真实计数值添加正向的拉普拉斯噪声,同时根据噪声量对1

序列垂直列表项添加dummy虚假节点,每个dummy结点项包含dummy SID和dummy TID;负噪声扰动处理:根据1...

【专利技术属性】
技术研发人员:梁文娟梁松涛
申请(专利权)人:河南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1