当前位置: 首页 > 专利查询>雨果专利>正文

一种分布式多模型数据库体系结构的管理系统和方法技术方案

技术编号:39123530 阅读:9 留言:0更新日期:2023-10-23 14:47
本发明专利技术涉及一种分布式多模型数据库体系结构,其中数据库体系结构包括多个用户微服务,这些用户微服务被配置为创建、存储和管理图形数据库,图形数据库包含与连接到用户微服务的预存关系数据库关联的与用户相关的数据;一种分布式多模型数据库体系结构的管理系统,其中管理系统包括用户界面、多个配置文件微服务、键值数据库和中间件;并给出了分布式多模型数据库体系结构的管理方法。型数据库体系结构的管理方法。型数据库体系结构的管理方法。

【技术实现步骤摘要】
【国外来华专利技术】一种分布式多模型数据库体系结构的管理系统和方法


[0001]本专利技术涉及一种分布式多模型数据库体系结构,其中数据库体系结构包括多个用户微服务,这些用户微服务被配置为创建、存储和管理图形数据库,图形数据库包含与连接到用户微服务的预存关系数据库关联的与用户相关的数据;一种分布式多模型数据库体系结构的管理系统,其中管理系统包括用户界面、多个配置文件微服务、键值数据库和中间件;并给出了分布式多模型数据库体系结构的管理方法。

技术介绍

[0002]如今,数据的分析、处理和开发是一个蓬勃发展的
,正如该领域领先公司的成功所表明的那样,此领域在未来几年具有巨大的增长前景。尽管人们在分析消费习惯的数据方面付出了很多努力,但其他潜在的应用却很少受到关注;例如,医学数据就是这样。每个患者都有诊断、治疗、临床测试和其他有价值和敏感数据的终身记录,这些数据由医疗机构或患者自己存储了几十年。作为一种非常长期的信息存储,这些记录包括不同的格式,从带有医生手写笔记的物理硬拷贝到最新的数字格式。
[0003]此外,这些记录通常分散在不同医院的不同仓库中,有时属于不同的司法管辖区。即使在同一家医院,不同类型的数据也存储在根据不同医疗标准设计的不同服务器上,因此这些服务器中的每一个都有自己的数据架构和通信协议(DICOM、LOINC、RxNORM、SNOMED CT等);此外,这些系统中的每一个都由不同的提供商开发和维护,这给数据集成带来了更多的可变性和复杂性。无论这些记录是作为单个患者还是作为一个群体,这种数据碎片化往往是收集、更新或研究这些记录的严重障碍。进行数据聚合和转换时由于需要配置缓存、中间数据湖和规模数据库以及处理服务器,而这些数据集成或数据联接通常发生在应用程序级别,所以使得数据管理复杂、低效且非常昂贵。
[0004]应该考虑的是,如果补充测试(如放射学或实验室分析)提供的定量数据与患者的其他临床记录数据相关,则这些数据更有价值;事实上,数据的值与可以建立的有意义的关系的数量成正比。因此,希望具有一个数据库,该数据库允许对包括在患者记录中的不同变量之间的关系进行简单的搜索和更新。
[0005]通常,大多数数据库(BD)被构造为关系数据库(RDB);当涉及到表达数据元素之间的关系时,这些关系数据库变得特别复杂和僵化,尤其是在复杂关系的情况下,例如,当需要从两个或多个相关的数据库表(多级联接)中获取信息时;而且,这些多级连接很难进行水平缩放。联接可以有效地从现有的数据库表中计算统计信息,但对于大型数据集来说,多级联接过于复杂。如果需要分析大量数据,则有必要枚举所有相关的实体元组:“枚举方法的成本接近于实体集的笛卡尔乘积,它随着所涉及的实体集的数量呈指数级增长(Oliver和Zhensong,2015;Das et al.,2015),(Vicknair et al.,2010;Partner et al.,2014)”。
[0006]一种可能的方法是在图形数据库(GDB)中构建患者数据。这样的GDB可以处理数据相关性的真正复杂性。此外,大多数机器学习(ML)算法在矢量化实现中工作得更好,例如图形数据库的矢量化实现,这种实现令使用库并行处理数据变得更容易;由于GDB通常使用亲
和矩阵来表示,因此它们与矢量化机器学习应用程序共享相同的结构。此外,图中的函数可以表示为向量,这带来了另一个优势:图分析算法可以直接在图形数据库中实现,允许ML和图分析技术在同一环境中执行,从而可以密切合作,例如通过向ML算法提供作为预测变量计算的图形度量;因此,可以使用相同的环境来进行信息分析和高效搜索,甚至分区搜索,从而维护患者信息的隐私。
[0007]尽管RDB针对数据聚合进行了优化,但其他非关系数据库侧重于数据的数量和属性;例如,GDB针对数据连接进行了优化:与其他模型相比,GDB的设计是为了处理高水平的数据复杂性,部分原因是数据的结构不是预先固定的。但所有这些并非都是优势,GDB的成本也更高,而且在生产环境或服务中执行复杂操作的工具更少。Santis,Sandro等人的“用Java和Node将Monolith进化为微服务”的文件讲述了如何将传统的Java EE应用程序分解为单独的微服务,并提供了一组代码项目,说明了过程中的各种步骤。

技术实现思路

[0008]在本专利技术的第一个方面中,本专利技术提供了一种分布式多模型数据库体系结构的管理系统,分布式多模型数据库体系结构包括:多个用户微服务,每个用户微服务与存储在各自服务器上的多个预存关系数据库相连接,每个用户微服务都与一个用户关联,用户微服务被配置为创建、存储和管理包含有节点和边缘的图形数据库,图形数据库包含与连接到用户微服务的预存关系数据库关联的与用户相关的数据;
[0009]每个用户微服务包括一个加密文件,该加密文件通过用户微服务进行解密,加密文件包含创建和存储带有与相关用户相关的数据的图形数据库的指令,每个用户微服务存储在连接到用户微服务的预存关系数据库的服务器上,以及图形数据库被配置为仅通过用户微服务访问;
[0010]其中管理系统存储在云服务器上,管理系统包括:
[0011]用户界面;
[0012]多个配置文件微服务,其中每个配置文件微服务都与单个不同用户关联,其中每个配置文件微服务与至少另一个配置文件微服务连接,并且每个配置文件微服务被配置为解密与配置文件微服务相关联的用户微服务的加密文件;
[0013]键值数据库,与配置文件微服务连接,配置为存储每个图形数据库的具有哈希函数的位置数据、配置文件微服务的具有哈希函数的位置数据和用户微服务的具有哈希函数的位置数据,以及
[0014]中间件,被配置为连接用户微服务和配置文件微服务。
[0015]该管理系统提供对存储在多个先前存在的分布式独立多模型数据库中的数据的集中访问,具有高度的安全性,并且数据的合法所有者不会失去所有权;该数据库体系结构为每个预先存在的数据库或节点提供了多个用户微服务,这些微服务负责创建专门与从预先存在的数据库中与用户相关的数据相关的用户特定图形数据库(GDB),并管理与管理系统的访问和通信。图形数据库中的数据存储在现有数据库服务器上并加密。管理系统仅被授权访问用户的微服务,并接收加密数据,而无法访问先前存在的数据库中的其他数据;因此,实现了高水平的安全性。
[0016]每个配置文件微服务都与一个用户关联,该用户最好拥有或正式授权访问先前存
在的数据库中的某些数据。在传统的安排中,如果托管数据库的实体允许,用户将能够访问单个数据库并手动提取相关信息。这造成了两个主要问题:第一,一旦允许用户访问数据库,他就可以访问数据库中的任何记录,包括其他用户的敏感数据,从而危及数据库的隐私和安全;第二,用户必须手动请求并从每个单独的数据库中提取相关数据;因此,从多个数据库中提取数据将花费时间和资源。
[0017]本专利技术克服了这些困难,并提供了一种通过用户界面具有单一认证过程的集中式数据库管理系统、具有索引的键值数据库,以及处理管理系统和分布式本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种分布式多模型数据库体系结构(20)的管理系统(1),其特征在于,所述分布式多模型数据库体系结构(20)包括:多个用户微服务(11),每个所述用户微服务(11)与存储在各自服务器(31)上的多个预存关系数据库(30)相连接,每个所述用户微服务(11)都与一个用户关联,所述用户微服务(11)被配置为创建、存储和管理包含有节点和边缘的图形数据库(12),所述图形数据库(12)包含与连接到所述用户微服务(11)的所述预存关系数据库(30)关联的与用户相关的数据;每个用户微服务包括一个加密文件(13),该加密文件通过所述用户微服务(11)进行解密,加密文件包含创建和存储带有与相关用户相关的数据的图形数据库(12)的指令,每个用户微服务(11)存储在连接到所述用户微服务(11)的预存关系数据库(30)的服务器(31)上,以及所述图形数据库(12)被配置为仅通过用户微服务(11)访问;其中管理系统(1)存储在云服务器(10)上,管理系统(1)包括:用户界面(2),多个配置文件微服务(3),其中每个配置文件微服务(3)都与单个不同用户关联,其中每个配置文件微服务(3)与至少另一个配置文件微服务(3)连接,并且每个配置文件微服务(3)被配置为解密与配置文件微服务(3)相关联的用户微服务(11)的加密文件(13),键值数据库(4),与配置文件微服务(3)连接,配置为存储每个图形数据库(12)的具有哈希函数的位置数据、配置文件微服务(3)的具有哈希函数的位置数据和用户微服务(11)的具有哈希函数的位置数据,以及中间件(5),被配置为连接用户微服务(11)和配置文件微服务(3)。2.根据权利要求1所述的管理系统(1),其特征在于,所述用户界面(2)是基于Web的用户界面。3.根据权利要求1所述的管理系统(1),其特征在于,所述键值数据库(4)被配置为分布式账本。4.根据权利要求1所述的管理系统(1),其特征在于,所述键值数据库(4)包括用公钥加密算法加密的键值对。5.根据权利要求1所述的管理系统(1),其特征在于,所述键值数据库(4)包括键值数据库管理器。6.根据权利要求1所述的管理系统(1),其特征在于,所述管理系统(1)还包括由所述中间件(5)控制的低可用性备份数据库。7.根据权利要求1所述的管理系统(1),其特征在于,所述中间件(5)部分存储在存储有所述预存关系数据库(30)的所述服务器(31)中。8.根据权利要求1所述的管理系统(1),其特征在于,所述中间件(5)被配置为对等网络。9.根据权利要求1所述的管理系统(1),其特征在于,所述中间件(5)被配置为在所述图形数据库(12)的节点之间进行无主异步复制。10.根据权利要求1所述的管理系统(1),其特征在于,所述中间件(5)被配置为根据预设的循环顺序执行多播查询。11.根据权利要求1所述的管理系统(1),其特征在于,至少一个所述配置文件微服务
(3)包括一个中间数据库,所述中间数据库被配置为存储所述图形数据库(12)的数据、存储所述用户微服务(11)的利用哈希函数确定的存储地址和/或被配置为存储解密密钥。12.一种计算机系统,包括云服务器(10),所述云服务器(10)被配置为存储并运行如权利要求1

11任一项所述的管理系统(1)。13.一种分布式多模型数据库体系结构(20),其特征在...

【专利技术属性】
技术研发人员:雨果
申请(专利权)人:雨果
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1