一种多中心数据查询方法及系统技术方案

技术编号:37196243 阅读:9 留言:0更新日期:2023-04-20 22:54
本发明专利技术公开了一种多中心数据查询方法及系统,采用分布式架构在各数据中心的本地服务器上部署数据管理层,各数据中心获取到数据查询请求后,通过对应本地服务器上部署的数据管理层将数据查询请求转发到一个或多个目标数据中心,并将各目标数据中心查询得到的数据集返回到接收数据查询请求的本地数据中心的数据管理层中进行集成,从而获取集成多个数据中心返回数据的集成试验数据。心返回数据的集成试验数据。心返回数据的集成试验数据。

【技术实现步骤摘要】
一种多中心数据查询方法及系统


[0001]本专利技术涉及多中心数据集成领域,具体涉及一种多中心数据查询方法及系统。

技术介绍

[0002]在医疗试验领域,当前主流技术都是使用EDC以及其他周边软件系统支持试验的数据电子化和在线管理。这些系统内存储了大量的敏感的个人隐私数据,包括但不限于姓名、身份认证信息、血型、DNA信息等。各国个地区对于敏感数据有特定的政策,包括什么数据可以跨域访问、什么数据可以在服务器端保留、什么数据可以跨过传播等。例如GDPR(通用数据保护条例)、中国人类遗传资源采集审批等都有相关领域的敏感数据政策。
[0003]在业界,当前各个国家、地区或者机构主要是通过独立部署的情况实现数据采集。即在一个国家(地区)内部部署数据库和服务器,该数据库或者服务器只提供在该国家(地区)内的临床医学试验的支持。而对于多国(地区)多中心的临床医学试验,只能通过数据导出、线下审批、线下合并的方式来实现数据的查看和跨域集成。但是这种独立部署、线下集成的方式带来很多数据管理方面的问题,包括:
[0004]1、在多国多中心的部署带来的数据割裂导致试验组织者无法管理和查看试验在多国多中心的进度、无法合并受试者数据形成统一的试验报告(CSR)。
[0005]2、多国多中心的部署下的数据同步需要通过一系列线下操作完成,这些线下操作带来了更多的隐私暴露的风险,例如数据遗漏、丢失、错误的风险以及数据时效性等。

技术实现思路

[0006]以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
[0007]本专利技术的目的在于解决上述问题,提供了一种多中心数据查询方法及系统,采用分布式架构在各数据中心的本地服务器上部署数据管理层,各数据中心获取到数据查询请求后,通过对应本地服务器上部署的数据管理层将数据查询请求转发到一个或多个目标数据中心,并将各目标数据中心查询得到的数据集返回到接收数据查询请求的本地数据中心的数据管理层中进行集成,从而获取集成多个数据中心返回数据的集成试验数据。
[0008]本专利技术的技术方案为:
[0009]本专利技术还提供一种多中心数据查询方法,包括以下步骤:
[0010]接收数据查询请求;
[0011]基于数据查询请求确定目标数据中心,并将数据查询请求转发到对应的目标数据中心;
[0012]目标数据中心根据接收到数据查询请求进行数据查询,并对查询得到的数据进行清洗,得到数据集;
[0013]将目标数据中心返回的数据集进行集成,获取集成试验数据。
[0014]根据本专利技术的多中心数据查询方法的一实施例,所述多中心数据查询方法根据数据请求信息向一个或多个数据中心发送数据查询请求;其中,所述多中心数据查询方法基于分布式架构在各数据中心对应的本地服务器上分别部署数据管理层,各数据中心获取到数据查询请求后,通过对应服务器上部署的数据管理层将数据查询请求转发到一个或多个目标数据中心,并将各目标数据中心查询得到的数据集返回到接收数据查询请求的本地数据中心的数据管理层中进行集成,从而获取集成试验数据。
[0015]根据本专利技术的多中心数据查询方法的一实施例,所述数据服务请求信息包括试验类型和数据查询范围;其中,接收数据查询请求的本地数据中心获取到数据查询请求后,通过对应的本地服务器上部署的数据管理层分析数据查询请求,从而获取对应的试验类型和数据查询范围。
[0016]根据本专利技术的多中心数据查询方法的一实施例,本地数据中心的数据管理层获取到数据查询请求对应的试验类型和数据查询范围后,根据试验类型获取对应的路由配置信息;其中,所述路由配置信息存储于本地路由管理表中,包括不同试验类型的参与国家地区信息以及各参与国家地区配置的服务器数目和服务器地址,本地数据中心的数据管理层获取到对应的路由配置信息后,根据数据查询范围选择一个或多个数据中心作为目标数据中心,然后根据路由配置信息将数据查询请求发送到对应的目标数据中心。
[0017]根据本专利技术的多中心数据查询方法的一实施例,所述目标数据中心包括本地数据中心和远程数据中心;其中,所述目标数据中心获取到数据查询请求后,根据接收到数据查询请求查询对应服务器上的数据,然后采用对应服务器上的敏感信息过滤策略对数据进行清洗,获取数据清洗后的数据集。
[0018]根据本专利技术的多中心数据查询方法的一实施例,所述敏感信息过滤策略包括敏感信息数据元以及敏感信息过滤判断逻辑;其中,所述目标数据中心根据对应服务器上的敏感信息数据元以及敏感信息过滤判断逻辑对查询得到的数据进行清洗,然后将清洗后的数据集发送到接收数据查询请求的本地数据中心的数据管理层中进行集成,得到集成试验数据。
[0019]根据本专利技术的多中心数据查询方法的一实施例,本地数据中心的数据管理层获取到各目标数据中心返回的数据集后,将各目标数据中心返回的数据集进行合并,然后根据各数据集的排序因子对合并后的数据进行排序,得到集成试验数据。
[0020]本专利技术提供一种多中心数据查询系统,基于分布式架构,将请求接收模块、请求分析模块、请求转发模块、数据过滤模块、数据集成模块组成数据管理层分别部署多个各数据中心对应的本地服务器上;其中,
[0021]所述请求接收模块用于接收数据查询请求,并将获取到的数据查询请求发送到数据分析模块;
[0022]所述请求分析模块获取到数据查询请求后,通过分析数据查询请求确定目标数据中心,并将获取到的目标数据中心发送到请求转发模块;
[0023]所述请求转发模块根据接收到的目标数据中心将数据查询请求转发到对应的目标数据中心;其中,所述目标数据中心根据接收到的数据查询请求查询对应服务器上的数据,并将查询得到的数据发送到数据过滤模块;
[0024]所述数据过滤模块用于清洗目标数据中心查询得到的数据,并将清洗后的数据集发送到数据集成模块;
[0025]所述数据集成模块用于对目标数据中心返回的数据集进行集成,获取集成试验数据。
[0026]根据本专利技术的多中心数据查询系统的一实施例,所述多中心数据查询系统根据数据请求信息向一个或多个数据中心发送数据查询请求;其中,各数据中心获取到数据查询请求后,通过对应服务器上部署的数据管理层将数据查询请求转发到一个或多个目标数据中心,并将各目标数据中心查询得到的数据集返回到接收数据查询请求的本地数据中心的数据管理层中进行集成,从而获取集成试验数据。
[0027]根据本专利技术的多中心数据查询系统的一实施例,所述数据服务请求信息包括试验类型和数据查询范围;其中,接收数据查询请求的本地数据中心通过本地服务器上数据管理层的请求接收模块接收数据查询请求,并将获取到的数据查询请求发送到数据分析模块中进行分析,从而获取对应的试验类型和数据查询范围。
[002本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多中心数据查询方法,其特征在于,包括以下步骤:接收数据查询请求;基于数据查询请求确定目标数据中心,并将数据查询请求转发到对应的目标数据中心;目标数据中心根据接收到数据查询请求进行数据查询,并对查询得到的数据进行清洗,得到数据集;将目标数据中心返回的数据集进行集成,获取集成试验数据。2.根据权利要求1所述的多中心数据查询方法,其特征在于,所述多中心数据查询方法根据数据请求信息向一个或多个数据中心发送数据查询请求;其中,所述多中心数据查询方法基于分布式架构在各数据中心对应的本地服务器上分别部署数据管理层,各数据中心获取到数据查询请求后,通过对应服务器上部署的数据管理层将数据查询请求转发到一个或多个目标数据中心,并将各目标数据中心查询得到的数据集返回到接收数据查询请求的本地数据中心的数据管理层中进行集成,从而获取集成试验数据。3.根据权利要求2所述的多中心数据查询方法,其特征在于,所述数据服务请求信息包括试验类型和数据查询范围;其中,接收数据查询请求的本地数据中心获取到数据查询请求后,通过对应的本地服务器上部署的数据管理层分析数据查询请求,从而获取对应的试验类型和数据查询范围。4.根据权利要求3所述的多中心数据查询方法,其特征在于,本地数据中心的数据管理层获取到数据查询请求对应的试验类型和数据查询范围后,根据试验类型获取对应的路由配置信息;其中,所述路由配置信息存储于本地路由管理表中,包括不同试验类型的参与国家地区信息以及各参与国家地区配置的服务器数目和服务器地址,本地数据中心的数据管理层获取到对应的路由配置信息后,根据数据查询范围选择一个或多个数据中心作为目标数据中心,然后根据路由配置信息将数据查询请求发送到对应的目标数据中心。5.根据权利要求4所述的多中心数据查询方法,其特征在于,所述目标数据中心包括本地数据中心和远程数据中心;其中,所述目标数据中心获取到数据查询请求后,根据接收到数据查询请求查询对应服务器上的数据,然后采用对应服务器上的敏感信息过滤策略对数据进行清洗,获取数据清洗后的数据集。6.根据权利要求5所述的多中心数据查询方法,其特征在于,所述敏感信息过滤策略包括敏感信息数据元以及敏感信息过滤判断逻辑;其中,所述目标数据中心根据对应服务器上的敏感信息数据元以及敏感信息过滤判断逻辑对查询得到的数据进行清洗,然后将清洗后的数据集发送到接收数据查询请求的本地数据中心的数据管理层中进行集成,得到集成试验数据。7.根据权利要求6所述的多中心数据查询方法,其特征在于,本地数据中心的数据管理层获取到各目标数据中心返回的数据集后,将各目标数据中心返回的数据集进行合并,然后根据各数据集的排序因子对合并后的数据进行排序,得到集成试验数据。8.一种多中心数据查询系统,其特征在于,基于分布式架构,将请求接收模块、请求分析模块、请求转发模块、数据过滤模块、数据集成模块组成数据管理层分别部署于多个数据中心对应的本地服务器上;其中,所述请求接收模块用于接收数据查询请求,并将获取到的数据查询请求发送到数据分
析模块;所述请求分析模块获取到数据查询请求后,通...

【专利技术属性】
技术研发人员:陈力捷徐鹏程刘可嘉
申请(专利权)人:上海耀乘健康科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1