一种基于医疗大数据的隐私保护数据挖掘系统及方法技术方案

技术编号:20392678 阅读:20 留言:0更新日期:2019-02-20 03:59
本发明专利技术公开了一种基于医疗大数据的隐私保护数据挖掘系统及方法,系统包括客户端与服务端两部分;服务端由公共卫生数据中心PBDC和省级区域卫生云平台PHCP组成;客户端HC为各区域三级及以下医院机构信息系统;公共卫生数据中心PBDC用于管理存储的医疗信息数据,公共卫生数据中心PBDC由若干分布式高性能存储设备组成,通过协同作业的方式在逻辑上构成一个数据中心,对各省级区域卫生云平台PHCP提供数据管理服务;省级区域卫生云平台PHCP由一系列服务器集群组成,用于对各市地三级及以下医院提供统一的资源调度、响应请求服务;各区域三级及以下医院机构信息系统,用于在需要查询相关医疗信息数据时向省级区域卫生云平台PHCP发起服务请求。

【技术实现步骤摘要】
一种基于医疗大数据的隐私保护数据挖掘系统及方法
本专利技术属于信息安全
,涉及一种隐私保护数据挖掘系统及方法,具体涉及针对医疗大数据隐私保护的需要,通过结合数据挖掘、非交互零知识证明、分布式技术的隐私保护数据挖掘系统及方法。技术背景随着现代医疗信息化的建设,基础医疗信息化设施日趋成熟,当前医疗信息系统HIS(HospitalInformationSystem)主要包括医学影像信息系统PACS(PictureArchivingandCommunicationSystems)、临床信息系统CIS(ClinicalInformationSystem)、放射学信息系统RIS(RadiologyInformationSystem)、实验室信息系统LIS(LaboratoryInformationSystem)。目前,其发展状态已经由完整的医院信息系统阶段过渡到远程医疗阶段。基于互联网的远程医疗将各大医疗信息资源相互共享互通,以一种高效的方式协同提供医疗服务。随着海量大数据时代的到来,海量数据的分析与挖掘技术使得智慧云医疗的概念应运而生。智慧云医疗利用医疗大数据、云计算等关键技术,实现了了优质医疗资源共享,满足了医疗行业对更好数据的需求。然而,在享受医疗信息共享所带来便利的同时,隐私安全问题阻碍着智慧医疗的发展。医疗数据隐私虽然受到一些传统隐私保护手段保护,例如匿名化、引入噪声、数据脱敏、权限限制等手段等,可是其无法适应当前大数据时代下智慧医疗行业的各种需求。具体来说,传统隐私保护手段不适用于医疗信息数据挖掘,甚至会因大数据超强的分析能力而面临失效。大数据环境下的医疗信息共享导致隐私泄露问题也成为了信息安全领域研究的热点。对于这类问题,目前已存在一些解决方案,例如隐私保护的数据挖掘技术等。简单来说数据挖掘主要是以一种高效的方式从海量的数据中搜索出重要信息的方式,具体的算法由于应用场景的不同可以按需选择。隐私保护的数据挖掘旨在数据挖掘的基础上利用密码学等信息安全相关技术,设计出既能满足隐私安全需求又能合理搜索信息的新方法。相似度是一种数据挖掘中常用的手段,基于此方法设计的现有方案大多无法满足较高安全需求下的应用,例如一个伪造的数据拥有者可以利用虚假的数据套取病人的隐私信息,黑客利用攻击手段将不可信的医疗信息提供给医生等。
技术实现思路
针对医疗大数据隐私保护的需要,本专利技术通过结合数据挖掘、非交互零知识证明、分布式技术,提出了一种基于医疗大数据的隐私保护数据挖掘系统及方法。本专利技术的系统所采用的技术方案是:一种基于医疗大数据的隐私保护数据挖掘系统,其特征在于:包括客户端与服务端两部分;所述服务端由公共卫生数据中心PBDC和省级区域卫生云平台PHCP组成;所述客户端HC为各区域三级及以下医院机构信息系统;所述公共卫生数据中心PBDC用于管理存储的医疗信息数据,所述公共卫生数据中心PBDC由若干分布式高性能存储设备组成,通过协同作业的方式在逻辑上构成一个数据中心,对各省级区域卫生云平台PHCP提供数据管理服务;所述省级区域卫生云平台PHCP由一系列服务器集群组成,用于对各市地三级及以下医院提供统一的资源调度、响应请求服务;所述各区域三级及以下医院机构信息系统为HIS(PACS、CIS、RIS、LIS(“HIS”与“PACS、CIS、RIS、LIS),用于在需要查询相关医疗信息数据时向所述省级区域卫生云平台PHCP发起服务请求。本专利技术的方法所采用的技术方案是:一种基于医疗大数据的隐私保护数据挖掘方法,其特征在于,包括以下步骤:步骤1:初始化隐私保护数据挖掘系统;步骤2:本地数据承诺;步骤3:在线数据挖掘。本专利技术方法与现有的技术相比有如下的优点和有益效果:1.本专利技术能确保客户端在得到结果的同时不会向服务端泄露自己提供的样例;2.本专利技术能确保恶意的客户端不能伪造虚假的样例来获取匹配结果;3.本专利技术针对医疗大数据环境下提供高效的安全样例匹配方法。附图说明图1:本专利技术实施例的系统模型图;图2:本专利技术实施例的方法流程图。具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。请见图1,本专利技术提供的一种基于医疗大数据的隐私保护数据挖掘系统,包括客户端与服务端两部分。服务端由公共卫生数据中心PBDC和省级区域卫生云平台PHCP组成,客户端HC为各区域三级及以下医院机构信息系统。公共卫生数据中心的主要负责管理存储海量的医疗信息数据,具体指的是电子健康记录(electronichealthrecord,EHR)、各种医学影像(包括核磁、CT、DR、超声、各种X光机等设备产生的图像)等,其在物理上是由海量的分布式高性能存储设备组成,通过协同作业的方式在逻辑上构成一个数据中心,对各省级云平台提供数据管理服务。省级区域云平台由一系列服务器集群组成,主要任务是对各市地三级及以下医院提供统一的资源调度、响应请求等服务。各区域三级及以下医院机构信息系统主要是HIS(包括PACS、CIS、RIS、LIS),主要负责在需要查询相关医疗信息数据时向省级云平台发起服务请求。请见图2,本专利技术提供的一种基于医疗大数据的隐私保护数据挖掘方法,包括以下步骤:步骤1:初始化隐私保护数据挖掘系统;步骤1.1:省级区域卫生云平台PHCP生成零知识证明全局参数,并将全局参数对各区域三级及以下医院机构信息系统和公共卫生数据中心PBDC公开;本实施例中,各省级区域卫生云平台PHCP选取大素数q,生成阶为q的群G,从群G中选取生成元g,以及整数域Zq,以及哈希函数H:{0,1}*→Zq,并设置全局参数(Zq,G,q,g),其中,所述哈希函数用于将任意长度的0、1串映射到整数域Zq;公开全局参数(Zq,G,q,g),以及哈希函数H:{0,1}*→Zq,将全局参数对各区域三级及以下医院机构信息系统和公共卫生数据中心PBDC公开,并定期更新;步骤1.2:各区域三级及以下医院机构信息系统在向省级区域卫生云平台PHCP发送查询请求时,首先整理本地样例数据。本实施例中,样例数据整理为元组的形式{a1,..,ak},其中a1与ak分别表示不同的信息类型,例如病人的疾病类型、症状的关键词等。步骤2:本地数据承诺;步骤2.1:各区域三级及以下医院机构信息系统使用全局参数对样例数据构建承诺;本实施例中,从整数域Zq随机选择vi,i∈1,...,k,构成元组{v1,..,vk},采用零知识证明构造样例承诺,具体包括:ri′=vi-c′ai,i∈1,...,k;其中,Xi′与以生成元g为底数,vi与ai为指数;Xi包含第一信息元组{a1,..,ak},包含随机选取的元组{y1,...,ym};样例承诺记为:β′=(c′,{(r′i,X′i)|i∈1,...,k});步骤2.2:公共卫生数据中心PBDC使用全局参数对存储的数据构造承诺;本实施例中,公共卫生数据中心PBDC使用全局参数对存储所有的数据关键词元组按照id号构造承诺;存储的数据关键词元组记作{b1,...,bm}id,其中id号为存储数据的单元标识,从整数域Zq随机选择wj,j∈1,...,m,构成元组{w1,.本文档来自技高网
...

【技术保护点】
1.一种基于医疗大数据的隐私保护数据挖掘系统,其特征在于:包括客户端与服务端两部分;所述服务端由公共卫生数据中心PBDC和省级区域卫生云平台PHCP组成;所述客户端HC为各区域三级及以下医院机构信息系统;所述公共卫生数据中心PBDC用于管理存储的医疗信息数据,所述公共卫生数据中心PBDC由若干分布式高性能存储设备组成,通过协同作业的方式在逻辑上构成一个数据中心,对各省级区域卫生云平台PHCP提供数据管理服务;所述省级区域卫生云平台PHCP由一系列服务器集群组成,用于对各市地三级及以下医院提供统一的资源调度、响应请求服务;所述各区域三级及以下医院机构信息系统,用于在需要查询相关医疗信息数据时向所述省级区域卫生云平台PHCP发起服务请求。

【技术特征摘要】
1.一种基于医疗大数据的隐私保护数据挖掘系统,其特征在于:包括客户端与服务端两部分;所述服务端由公共卫生数据中心PBDC和省级区域卫生云平台PHCP组成;所述客户端HC为各区域三级及以下医院机构信息系统;所述公共卫生数据中心PBDC用于管理存储的医疗信息数据,所述公共卫生数据中心PBDC由若干分布式高性能存储设备组成,通过协同作业的方式在逻辑上构成一个数据中心,对各省级区域卫生云平台PHCP提供数据管理服务;所述省级区域卫生云平台PHCP由一系列服务器集群组成,用于对各市地三级及以下医院提供统一的资源调度、响应请求服务;所述各区域三级及以下医院机构信息系统,用于在需要查询相关医疗信息数据时向所述省级区域卫生云平台PHCP发起服务请求。2.根据权利要求1所述的基于医疗大数据的隐私保护数据挖掘系统,其特征在于:所述医疗信息数据包括电子健康记录、各种医学影像。3.一种基于医疗大数据的隐私保护数据挖掘方法,其特征在于,包括以下步骤:步骤1:初始化隐私保护数据挖掘系统;步骤2:本地数据承诺;步骤3:在线数据挖掘。4.根据权利要求3所述的基于医疗大数据的隐私保护数据挖掘方法,其特征在于,步骤1的具体实现包括以下子步骤:步骤1.1:省级区域卫生云平台PHCP生成零知识证明全局参数,并将全局参数对各区域三级及以下医院机构信息系统和公共卫生数据中心PBDC公开;步骤1.2:各区域三级及以下医院机构信息系统在向省级区域卫生云平台PHCP发送查询请求时,首先整理本地样例数据。5.根据权利要求4所述的基于医疗大数据的隐私保护数据挖掘方法,其特征在于:步骤1.1中,各省级区域卫生云平台PHCP选取大素数q,生成阶为q的群G,从群G中选取生成元g,以及整数域Zq,以及哈希函数H:{0,1}*→Zq,并设置全局参数(Zq,G,q,g),其中,所述哈希函数用于将任意长度的0、1串映射到整数域Zq;公开全局参数(Zq,G,q,g),以及哈希函数H:{0,1}*→Zq,将全局参数对各区域三级及以下医院机构信息系统和公共卫生数据中心PBDC公开,并定期更新;步骤1.2中,样例数据整理为元组的形式{a1,..,ak},其中a1与ak分别表示不同的信息类型。6.根据权利要求5所述的基于医疗大数据的隐私保护数据挖掘方法,其特征在于,步骤2的具体实现包括以下子步骤:步骤2.1:各区域三级及以下医院机构信息系统使用全局参数对样例数据构建承诺;步骤2.2:公共卫生数据中心PBDC使用全局参数对存储的数据构造承诺。7.根据权利要求6所述的基于医疗大数据的隐私保护数据挖掘方法,其特征在于:步骤2.1中,从整数域Zq随机选择vi,i∈1,...,k,构成元组{v1,..,vk},采用零知识证明构造样例承诺,具体包括:r′i=vi-c′ai,i∈1,.....

【专利技术属性】
技术研发人员:张明武冷文韬陈文倩黄嘉骏
申请(专利权)人:湖北工业大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1