一种面向HTAP的分布式数据库智能混合存储方法技术

技术编号：21913924 阅读：20 留言：0更新日期：2019-08-21 12:25

本发明专利技术公开了一种面向HTAP的分布式数据库智能混合存储方法，该包括：通过数据导入系统获取数据源中的数据，并存储于HTAP数据库的存储引擎中，其中，存储引擎由多个存储节点组成，每个存储节点的数据以列族的数据组织格式进行存储；中心节点根据历史OLAP、OLTP的工作负载情况，采用基于密度的聚类分区算法对存储引擎中的数据布局进行优化重组分析，进而获得最优数据布局。本发明专利技术以列族的方式对HTAP数据库中的数据进行组织，并根据中心节点计算出的最优存储布局动态地调整列族中的数据，而最优的存储布局是通过基于密度的聚类算法通过聚类结果得出使得具有相当访问频率的列属于同一列族，即经常被访问的列属于同一列族。

An Intelligent Hybrid Storage Method for HTAP-Oriented Distributed Database

全部详细技术资料下载

【技术实现步骤摘要】
一种面向HTAP的分布式数据库智能混合存储方法
本专利技术涉及在HTAP的业务场景下，通过机器学习分析历史业务和最近业务的工作负载情况，动态地对存储引擎数据布局重组的
，具体涉及一种面向HTAP的分布式数据库智能混合存储方法。
技术介绍
HTAP数据库是一款同时支持联机事务处理(OLTP)和联机分析处理(OLAP)两种业务类型的分布式数据库产品，由于OLAP和OLTP系统具有非常不同的特性，存储引擎中数据以行的形式存储对OLTP友好，以列的形式存储对OLAP更友好。但如果同时更好地支持高效查询的OLAP和实时性要求高的OLTP，那么存储引擎的数据组织格式便起着至关重要的作用。目前，peloton的存储使用tile的数据组织形式，即一个表中由多个tilegroup组成，一个tilegroup由多个physicaltile组成，一个physicaltile类似表的水平/垂直分区。peloton的数据库系统属于单机系统，将数据全部放到一个存储节点上，然后只对这一个存储节点的数据进行布局的优化及重组。但这种数据组织形式存在一些劣势：单机系统的容量和吞吐量都很小、性能低，无法应对越来越大的业务量，无论是计算能力还是存储能力，都不能较好地支持大数据时代的HTAP业务。而应用于HTAP数据存储上，peloton现有使用的k-means聚类算法对统计的数据进行聚类分析的分区算法存在一些劣势：1、需要调参：聚类数k、旧样本的权重w，(1)、在计算之前需要先对聚类数k进行初始化，但是k值的选取很不好把握，而且k值的选取会直接影响到聚类效果，需要对k进行调参，除此之外，强...

【技术保护点】
1.一种面向HTAP的分布式数据库智能混合存储方法，其特征在于，存储方法包括：通过数据导入系统获取数据源中的数据，并存储于HTAP数据库的存储引擎中，其中，存储引擎由多个存储节点组成，每个存储节点的数据以列族形式进行数据存储；中心节点根据OLAP、OLTP业务请求，采用基于密度的聚类分区算法对存储引擎中的数据布局进行优化重组分析，进而获得最优数据布局。

【技术特征摘要】
1.一种面向HTAP的分布式数据库智能混合存储方法，其特征在于，存储方法包括：通过数据导入系统获取数据源中的数据，并存储于HTAP数据库的存储引擎中，其中，存储引擎由多个存储节点组成，每个存储节点的数据以列族形式进行数据存储；中心节点根据OLAP、OLTP业务请求，采用基于密度的聚类分区算法对存储引擎中的数据布局进行优化重组分析，进而获得最优数据布局。2.根据权利要求1所述的一种面向HTAP的分布式数据库智能混合存储方法，其特征在于，每个存储节点的数据以列族形式进行数据组织，其中，数据布局因素包括列族的数量、列族中列的数量。3.根据权利要求2所述的一种面向HTAP的分布式数据库智能混合存储方法，其特征在于，所述基于密度的聚类分区算法DenStream采用两阶段处理框架，包括在线阶段和离线阶段，根据历史查询样本和最近历史查询样本的数据分布情况生成簇的个数，簇的个数作为每个存储节点的列族数量，并采用衰减窗口对不同时间的查询样本进行加权，来控制历史查询样本的权重，进而控制最后的聚类结果是偏向于旧查询样本还是最近的查询样本，并获得最优数据布局的聚类结果。4.根据权利要求3所述的一种面向HTAP的分布式数据库智能混合存储方法，其特征在于，中心节点根据OLAP、OLTP业务请求，采用基于密度的聚类分区算法DenStream对存储引擎中的数据布局进行优化重组分析，进而获得最优数据布局，具体包括：客户端将OLAP、OLTP业务请求发到中心节点，...

【专利技术属性】
技术研发人员：段翰聪，刘长红，姚入榕，闵革勇，梁戈，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人