【技术实现步骤摘要】
本专利技术计算机数据存储领域,更具体地,涉及一种面向云数据分析服务场景的数据块索引结构及其构建方法。
技术介绍
1、当前云计算、云数据分析场景中广泛使用存算分离架构,即将计算资源(比如计算集群)从存储侧分离处理以实现多种资源的独立扩展。比如一个典型的在亚马逊云上部署分析服务的方式,是使用amazon ec2的虚拟机搭建计算集群(作为计算侧),而把数据存储在亚马逊对象存储s3(存储侧)上。同时,为了最大化数据吞吐同时最小化io操作数,数据块(包含来自一个数据集的数万到数百万条数据)通常作为访问远端存储侧的最小单元(最小的数据过滤单元)。
2、为了缓解计算与存储分离产生的高额数据传输时延,云厂商广泛使用数据过滤技术(data skipping),通过过滤当前分析任务无关的数据块来减少数据的读取量,从而减少数据传输时延。
3、目前的数据过滤技术主要有三种:第一种是小物化聚合(smallmaterialaggregate),其通过为每个数据块独立维护轻量的元数据信息来判断相应数据块是否被当前任务所需要,其代表就是zone
...【技术保护点】
1.一种面向云数据分析服务场景的数据块索引结构,其特征在于,
2.一种根据权利要求1所述的面向云数据分析服务场景的数据块索引结构的构建方法,其特征在于,包括如下步骤:
3.根据权利要求2所述的面向云数据分析服务场景的数据块索引结构的构建方法,其特征在于,步骤(1)包括以下子步骤:
4.根据权利要求2或3所述的面向云数据分析服务场景的数据块索引结构的构建方法,其特征在于,步骤(2)包括以下子步骤:
5.根据权利要求2至4中任意一项所述的面向云数据分析服务场景的数据块索引结构的构建方法,其特征在于,步骤(3)包括以下子步骤:
6.根...
【技术特征摘要】
1.一种面向云数据分析服务场景的数据块索引结构,其特征在于,
2.一种根据权利要求1所述的面向云数据分析服务场景的数据块索引结构的构建方法,其特征在于,包括如下步骤:
3.根据权利要求2所述的面向云数据分析服务场景的数据块索引结构的构建方法,其特征在于,步骤(1)包括以下子步骤:
4.根据权利要求2或3所述的面向云数据分析服务场景的数据块索引结构的构建方法,其特征在于,步骤(2)包括以下子步骤:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。