【技术实现步骤摘要】
【国外来华专利技术】对外部驻留数据执行存储器中列分析查询
本公开涉及数据库集成。本文提出的技术用于使用存储器中(in-memory)列向量来处理关系数据库管理系统(RDBMS)外部的数据,以及将外部数据与RDBMS本机的关系表数据进行逻辑联接。
技术介绍
企业数据库用户的重要业务用例需要集成数据竖井(silo),诸如RDBMS中的公司数据(例如销售记录)和临时数据,诸如Hadoop分布式文件系统(HDFS)中的点击流。例如,会计师可能需要集成来自两个竖井的数据的报告。数据科学家可能想要编写集成来自两个竖井的数据的诸如利用在线分析处理(OLAP)的探索性查询。但是,提取/传输/加载(ETL)工具远远不是无缝的,并且可能需要各种自定义脚本和适配器来完成任何可能有助于集成的暂存(staging)和重新格式化。例如,ETL通常需要实际上将外部数据复制到关系数据库表中,以使数据可被查询访问。由于外部数据(例如大数据)的潜在价值,尤其是与关系数据相关联时,ETL的花费通常是值得的。大数据具有内在价值,但必须发现它。存在从数据中获取价值的多种定量和调查技术,从发现消费者的偏好或情绪,到按地点提供相关报价,或用于识别将要发生故障的装备。技术上的突破是数据存储和计算的成本呈指数下降,从而产生了大量数据,从这些大量数据来对整个数据集进行统计分析是可能的。采样对于可行性不再是必要的。该技术突破使得能够进行准确和精确得多的决策。但是,寻找价值还需要新的发现流程,其中涉及聪明而有见识的分析师、业务用户和执行人员。例如,一个大数据挑战是人类挑战,该挑战是学 ...
【技术保护点】
1.一种方法,包括:/n维护数据字典,所述数据字典用于:/n持久存储在数据库管理系统DBMS中的本机数据,以及/n未持久存储在DBMS中的外部数据;/n通过与DBMS的连接从客户端接收查询;/n基于数据字典将外部数据加载到驻留在DBMS的随机存取存储器中的存储器中列向量中;/n基于数据字典和存储器中列向量来执行查询,其中执行所述查询包括对所述外部数据执行一个或多个基于向量的数据库操作;/n通过所述连接向客户端返回查询的结果;/n其中所述方法由一个或多个计算机执行。/n
【技术特征摘要】
【国外来华专利技术】20170930 US 62/566,386;20180919 US 16/135,7481.一种方法,包括:
维护数据字典,所述数据字典用于:
持久存储在数据库管理系统DBMS中的本机数据,以及
未持久存储在DBMS中的外部数据;
通过与DBMS的连接从客户端接收查询;
基于数据字典将外部数据加载到驻留在DBMS的随机存取存储器中的存储器中列向量中;
基于数据字典和存储器中列向量来执行查询,其中执行所述查询包括对所述外部数据执行一个或多个基于向量的数据库操作;
通过所述连接向客户端返回查询的结果;
其中所述方法由一个或多个计算机执行。
2.如权利要求1所述的方法,还包括通过将外部数据的第二版本加载到所述存储器中列向量中来刷新所述存储器中列向量。
3.如权利要求1所述的方法,其中:
所述存储器中列向量是第一存储器中列向量;
所述方法还包括通过将外部数据的第二版本加载到第二存储器中列向量中来替换所述存储器中列向量。
4.如权利要求3所述的方法,其中替换所述存储器中列向量还包括删除第一存储器中列向量。
5.如权利要求3所述的方法,其中替换所述存储器中列向量还包括同时将第一存储器中列向量和第二存储器中列向量保留在DBMS的随机存取存储器中。
6.如权利要求1所述的方法,其中所述外部数据包括分布式数据集的分区。
7.如权利要求6所述的方法,其中所述数据字典声明包括所述分区和持久存储在DBMS中的第二分区的所述分布式数据集的多个分区。
8.如权利要求1所述的方法,其中执行查询包括基于查询和数据字典执行所述存储器中列向量与本机数据的数据联接。
9.如权利要求8所述的方法,其中执行数据联接是基于编码字典的,所述编码字典描述本机数据和外部数据的相同编码。
10.如权利要求8所述的方法,其中数据联接基于联接组,所述联接组基于本机数据和外部数据。
11.如权利要求8所述的方法,还包括将值聚合操作应用于数据联接。
12.如权利要求1所述的方法,其中所述加载响应于第一查询,并且所述执行响应于第二查询。
13.如权利要求1所述的方法,其中:
所述存储器中列向量是第一存储器中列向量;
所述方法还包括通过以下方式加载驻留在DBMS的随机存取存储器中的存储器中表:
将第二外部数据加载到第二存储器中列向量中,以及
将存储器中表定义为包含第一存储器中列向量和第二存储器中列向量。
14.如权利要求13所述的方法,其中:
将外部数据加载到第一存储器中列向量中是响应于第一查询的,以及
将第二外部数据加载到第二存储器中列向量中是响应于第二查询的。
15.如权利要求13所述的方法,还包括:响应于仅移除存储器中表的命令,删除第一存储器中列向量。<...
【专利技术属性】
技术研发人员:R·麦克尼科尔,X·华,A·霍洛伟,S·查万,J·卡普,M·科尔根,T·拉希里,
申请(专利权)人:甲骨文国际公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。