一种异构数据源统一联合查询方法技术

技术编号：17994596 阅读：38 留言：0更新日期：2018-05-19 11:47

本发明专利技术属于电力系统数据库技术领域，公开了一种异构数据源统一联合查询方法。本发明专利技术获得数据源接口，对标准SQL进行语法解析，生成SQL执行计划，执行SQL计划，将不同数据源的数据加载到内存中，对已加载的数据进行并行计算，返回计算结果到客户端。本发明专利技术减少了查询各异构数据源时所需的连接次数，能够在特定业务场景下满足对各异构数据源中进行联合查询的需求。

A unified joint query method for heterogeneous data sources

The invention belongs to the technical field of power system database, and discloses a unified joint query method for heterogeneous data sources. The invention obtains the data source interface, parsing the standard SQL syntax, generating the SQL execution plan, executing the SQL plan, loading the data of different data sources into the memory, calculating the loaded data in parallel, returning the calculation results to the client. The invention reduces the number of connections required to query heterogeneous data sources, and can meet the demand for joint query in heterogeneous data sources in a specific business scenario.

全部详细技术资料下载

【技术实现步骤摘要】
一种异构数据源统一联合查询方法
本专利技术属于电力系统数据库
，具体是涉及一种异构数据源统一联合查询方法。
技术介绍
随着智能电网技术的不断发展，电网企业发挥数据资源的战略资产作用，关键在于提升海量数据的管理和支撑能力，实现信息共享，为企业管理提供运营决策分析支持。然而，电网海量数据多源各异，表现为多种异构数据源并存的局面。所谓异构数据源，既包括Oracle、MySQL、Postgresql、SybaseIQ等传统关系型数据库，同时还包括Cassandra、HBase、Hive等NoSQL及数据仓库。面对庞大的数据量以及各异的数据源，往往需要使用各数据源提供的连接客户端进行单独访问，无法使用一个连接对多个数据源进行同时访问，也无法在一次连接中将不同的数据源中的数据进行关联。因此，传统的访问方式，无法满足多数据源大数据快速实时查询计算的性能要求。
技术实现思路
本专利技术目的是：针对现有技术的不足，提供一种异构数据源统一联合查询方法。该方法能够在一次连接中，对不同的异构数据源进行统一访问，甚至可以在一次连接中，对多异构数据源中的不同数据进行关联查询，满足电网大数据查询访问时高性能、易用性、可扩展性的需求。具体地说，本专利技术是采用以下技术方案实现的，包括以下步骤：1)在对各异构数据源进行查询操作前，如果异构数据源支持schema、table、column的时候，遍历异构数据源中所有的schema、table、column以及其他的元数据信息，如果异构数据源不支持schema、table、column的时候，将异构数据源的数据映射到查询中间件中的schema...
一种异构数据源统一联合查询方法

【技术保护点】
一种异构数据源统一联合查询方法，其特征在于，包括以下步骤：1）在对各异构数据源进行查询操作前，如果异构数据源支持schema、table、column的时候，遍历异构数据源中所有的schema、table、column以及其他的元数据信息，如果异构数据源不支持schema、table、column的时候，将异构数据源的数据映射到查询中间件中的schema、table、column中，再通过查询中间件中的schema、table、column遍历异构数据源中所有的元数据信息；2）查询客户端向查询中间件提交查询语句，所述查询语句为需要执行的SQL语句；当得到SQL语句时，查询中间件会将SQL语句组装成一个请求，发送给负责解析请求的解析模块；3）解析模块对收到的请求进行解析，所述解析包括词法分析、语法分析和语义分析，最终生成整个SQL语句的执行计划；4）将生成的整个SQL语句的执行计划转换为查询任务，分配空闲的工作节点去执行对应查询任务的计算任务，从而将各异构数据源的数据加载至内存；5）每当查询任务产生一定的计算结果，查询中间件就向查询客户端返回相应的计算结果，直到查询客户端获得了所有的计算结果。...

【技术特征摘要】
1.一种异构数据源统一联合查询方法，其特征在于，包括以下步骤：1）在对各异构数据源进行查询操作前，如果异构数据源支持schema、table、column的时候，遍历异构数据源中所有的schema、table、column以及其他的元数据信息，如果异构数据源不支持schema、table、column的时候，将异构数据源的数据映射到查询中间件中的schema、table、column中，再通过查询中间件中的schema、table、column遍历异构数据源中所有的元数据信息；2）查询客户端向查询中间件提交查询语句，所述查询语句为需要执行的SQL语句；当得到SQL语句时，查询中间件会将SQL语句组装成一个请求，发送给负责解析请求的解析模块；3）解析模块对收到的请求进行解析，所述解析包括词法分析、语法分析和语义分析，最终生成整个SQL语句的执行计划；4）将生成的整个SQL语句的执行计划转换为查询任务，分配空闲的工作节点去执行对应查询任务的计算任务，从而将各异构数据源的数据加载至内存；5）每当查询任务产生一定的计算结果，查询中间件就向查询客户端返回相应的计算结果，直到查询客户端...

【专利技术属性】
技术研发人员：张珂珩，李贤慧，何世春，何阳，孔炜，张高坤，
申请(专利权)人：江苏瑞中数据股份有限公司，南瑞集团有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人