The invention relates to a data warehouse for storage memory ranks database machine conversion method, which comprises the following steps: constructing data warehouse machine memory storage model in database machine architecture, using the dimension table for centralized storage, distribution of the fact table storage strategy; storage engine; set up the ranks of the storage model conversion strategy; real-time OLAP one machine database query processing on the task decomposition for the master node in fact table rows, columns of data cache and cache shadow storage server node fact table OLAP main block distributed query processing tasks, to achieve real-time data processing based on OLAP analysis. The invention realizes the conversion of the row storage record of the transaction processing engine into the column storage record of the analysis engine efficiently, and supports the OLAP analysis processing on the real-time data. The invention is suitable for the memory storage data warehouse integrated machine, and the row and column storage structure in the updating operation converts the application scene.
【技术实现步骤摘要】
面向数据库一体机的内存数据仓库行列存储转换实现方法
本专利技术涉及一种内存数据仓库存储转换方法,特别是关于一种面向数据库一体机的内存数据仓库行列存储转换实现方法。
技术介绍
随着大内存、多核处理器等硬件技术和内存数据库技术的发展,内存OLAP处理性能不断提高,大数据内存实时分析处理成为主流的技术。传统的事务处理引擎通常采用行存储模型,优化更新操作性能,而分析处理则通常采用列存储引擎,优化数据访问和处理性能。当前主流数据库开始支持事务处理引擎和分析处理引擎集成技术,如OracleDatabasein-memory,SQLserver2016等既支持事务处理,也支持分析处理。但当前主要的实现技术是为事务处理引擎增加一个列存储引擎加速分析处理性能,列存储引擎可以看作是事务处理引擎的影子数据(shadowdata),支持或不支持数据同步更新,主要技术难点是事务处理引擎的行存储结构数据如何高效地转换为列存储结构数据。列存储引擎不仅要按列存储数据,还需要通过数据压缩技术进一步提高列存储引擎的数据存储和处理效率。当前代表性的技术,如SAPHANA采用L1行存储引擎、L2非压缩列存储引擎和采用数据压缩的主存储列引擎来支持实时OLAP分析处理,在事务型行数据转换为分析型列数据时还需要解决列压缩以及字典表更新等问题,需要处理复杂的数据转换问题。在面向数据库一体机架构的内存数据仓库系统中,少量高端服务器组成的高性能服务器集群和大量中低端服务器组成的存储服务器集群提供了不对称的存储和计算性能,不仅需要解决实时更新数据的行列存储结构转换任务,还需要根据数据库一体机的硬件架构特点将事 ...
【技术保护点】
一种面向数据库一体机的内存数据仓库行列存储转换实现方法,其特征在于包括以下步骤:1)构建内存数据仓库一体机存储模型:在数据库一体机架构上,采用维表集中存储,事实表分布存储策略;2)设置存储引擎;3)设置行列存储模型转换策略;4)在数据库一体机上的实时OLAP查询处理任务分解为在主节点事实表行缓存中未进行列转换的行组、影子数据列缓存以及存储服务器节点事实表主分片上的分布式OLAP查询处理任务,实现基于实时数据上的OLAP分析处理。
【技术特征摘要】
1.一种面向数据库一体机的内存数据仓库行列存储转换实现方法,其特征在于包括以下步骤:1)构建内存数据仓库一体机存储模型:在数据库一体机架构上,采用维表集中存储,事实表分布存储策略;2)设置存储引擎;3)设置行列存储模型转换策略;4)在数据库一体机上的实时OLAP查询处理任务分解为在主节点事实表行缓存中未进行列转换的行组、影子数据列缓存以及存储服务器节点事实表主分片上的分布式OLAP查询处理任务,实现基于实时数据上的OLAP分析处理。2.如权利要求1所述的面向数据库一体机的内存数据仓库行列存储转换实现方法,其特征在于:所述步骤1)中,数据仓库中的维表集中存储于数据库一体机高性能服务器集群,维表采用多维关系模型,即维表记录映射为维度成员,维表主键映射为维度坐标。3.如权利要求2所述的面向数据库一体机的内存数据仓库行列存储转换实现方法,其特征在于:在维表增加一个删除标志列D_Flag,逻辑标识删除的维记录,该维记录对应的主键值能分配给新插入的维记录。4.如权利要求1所述的面向数据库一体机的内存数据仓库行列存储转换实现方法,其特征在于:所述步骤1)中,事实表在数据库一体机架构中采用分布式存储策略,事实表以水平分片方式存储在存储服务器集群节点,事实表分片采用列存储,列按照优化的行数划分为列分片,列分片作为列数据压缩存储单位。5.如权利要求1所述的面向数据库一体机的内存数据仓库行列存储转换实现方法,其特征在于:所述步骤2)中,具体设置方法如下:2.1)维表采用行存储引擎,利用成熟的事务型内存数据库系统支持插入、修改或删除的更新操作;维表上的查询为选择和投影操作,当维表较大且查询选择率较低时,为维属性创建位图索引;2.2)事实表存储分为两种类型:2.2.1)在数据库一体机高性能服务器集群维表存储引擎中设置事实表缓存,用于缓存插入的行存储结构事实表记录,同时设置一个内存列存储结构事实表缓存,用于实现事实表记录的内存行列转换;2.2.2)主要事实表数据以水平分片方式存储于存储服务器集群;事实表存储采用列存储,事实表列按优化配置参数划分为列分片,每个列分片是一个独立的列数据压缩存储单位,独立设置列分片压缩算法及相关压缩元数据。6.如权利要求1所述的面向数据库一体机的内存数据仓库行列存储转换实现方法,其特征在于:所述步骤3)中,具体设置方法如下:3.1)维表映射为维度,在OLAP查询处理时维表映射为一个向量列,表示OLAP查询在维表上的选择和投影操作结果;当维表用数据库存储时,设置维表主键列为AUTO_INCREMENT类型,自动为维表分配连续的主键值,删除的记录产生缺失的主键值;3.2)事实表数据的行列转换包括从高性能服务器集群事实表缓存到列缓存,从列缓存到闪存,从高性能服务器集群闪存到存储服务器集群闪存,从存储服务器闪存到内存,从内存行组到内存压缩列分片。7.如权利要求6所述的面向数据库一体机的内存数据仓...
【专利技术属性】
技术研发人员:张延松,王珊,杜小勇,
申请(专利权)人:中国人民大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。