【技术实现步骤摘要】
基于图结构的数据虚拟化系统、方法、装置、设备及介质
[0001]本专利技术涉及数据处理领域,尤其涉及一种基于图结构的数据虚拟化系统、方法、装置、设备及介质。
技术介绍
[0002]随着大数据和云计算技术的发展,各行各业的数据呈现爆发式增长,数据虚拟化在原有的系统或软件框架上新增数据虚拟层,将所有数据源抽象或者映射后,成为一个面向领域的统一数据访问层,屏蔽了传统数据库、分布式云、大数据等多元异构数据源的多样性和复杂性,使得用户能够像访问单一数据源的数据表一样访问所有数据,在不迁移数据,不复制数据,不通过ETL加工数据或者额外的存储需求就可以实时查看和分析,这样提供了数据处理的便捷性,可以为企业带来实时的具有洞察力的结果,更快速响应和做出相应的决策。
[0003]在现有实现方式中,申请号为201811534934.8(专利名称为一种数据虚拟化及查询方法、装置)公开了一种数据虚拟化及查询方法、装置,该数据虚拟化方法包括:从数据库中采集多种数据,根据数据及其属性构建数据字典;获取常用词库词典和行业术语词库中的词汇信息;根据词汇信息及数据字典中的数据及其映射关系构建数据语义层;申请号为201510117882.4(专利名称为用于端到端云服务数据库虚拟化及管理的架构和方法)公开了一种用于端到端云数据库虚拟化及管理的架构和方法。该架构包括构建于虚拟机之上的中央虚拟数据库虚拟化模块、多个云服务、多个分布式子虚拟数据库虚拟化模块以及多个多媒体虚拟数据库虚拟化,中央虚拟数据库虚拟化模块设置有服务器信息数据库和客户端信息数据库,服 ...
【技术保护点】
【技术特征摘要】
1.一种基于图结构的数据虚拟化系统,其特征在于,通过图结构实现数据虚拟化的元数据管理,所述基于图结构的数据虚拟化系统包括:元数据管理模块、虚拟视图SQL引擎、数据ETL模块、数据缓存模块和数据服务处理模块;其中,所述元数据管理模块用于根据设置条件进行数据虚拟视图的元数据配置,并管理维护元数据关系,所述元数据管理模块采用图方式组织元数据关系,所述图方式采用G(V,E)表示,其中,顶点V包含数据源V
source
、表V
table
、字段V
field
、规则V
rule
和用户组V
group
,元数据关系图的边E包含映射E
map
、所属E
affiliation
、集成E
inte
和读权限E
read
;所述虚拟视图SQL引擎用于对SQL语句进行解析,并根据元数据关系图构建各个数据源的子查询SQL,获其他数据读取参数;所述数据ETL模块根据子查询SQL或者其他数据读取参数进行数据提取;所述数据缓存模块用于对查询结果进行数据缓存;所述数据服务处理模块用于接收数据查询、统计请求,并经过其他模块处理后将提取的数据组合成虚拟视图。2.如权利要求1所述的基于图结构的数据虚拟化系统,其特征在于,所述数据ETL模块还用于对数据查询结果的哈希获取与传输,所述数据缓存模块在每次查询后将数据查询结果更新至数据缓存,并在每次接收到查询指令时对缓存数据进行查询。3.一种基于图结构的数据虚拟化方法,其特征在于,应用于权利要求1或2所述的基于图结构的数据虚拟化系统,所述基于图结构的数据虚拟化方法包括:根据元数据配置参数配置元数据关系图,并根据元数据关系图初始化缓存数据表;接收用户端发送的虚拟视图查询请求,并解析请求参数,得到虚拟视图SQL;将虚拟视图SQL转化为SQL查询语句;根据请求参数,在缓存和数据节点上执行所述SQL查询语句,得到集合数据;将所述集合数据形成虚拟视图反馈给所述用户端。4.如权利要求3所述的基于图结构的数据虚拟化方法,其特征在于,所述将虚拟视图SQL转化为SQL查询语句包括:步骤H1:根据元数据关系图将查询SQL中的字段加上表域描述符,生成的SQL入队列SqlQueue;步骤H2:读取SqlQueue队列首的SQL,若包含聚合函数,则将查询SQL中的组group和聚合函数进行拆解变换,并形成AGGREGATE执行动作入栈,并将变换后的SQL入队列SqlQueue,否则,则将原SQL重入队列SqlQueue,跳转至步骤H3,其中,拆解变换是将聚类函数查询拆解成完整数据查询和数据聚合两部分;步骤H3:读取SqlQueue队列首的SQL,若包含联合查询join,则将SQL分解为若干SQL查询语句,并形成JOIN执行动作入栈,将分解后的若干SQL依次入队列SqlQueue;否...
【专利技术属性】
技术研发人员:陈晓红,曹文治,胡东滨,杨俊丰,彭晗,
申请(专利权)人:湖南红普创新科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。