【技术实现步骤摘要】
本专利技术属于数据处理,具体涉及一种基于时间维度的数据预处理方法、单元、数据存储、查询方法。
技术介绍
1、传统数据库对带有时间字段海量数据进行分组查询分析时,如oracle通常需要扫描当前表所有的数据,当然我们可以通过对分组字段建立复合索引优化需要扫描的数据量,但是如果分组字段中有时间字段,并且对时间字段中有按分、时、天、周、月或年等分组查询要求时,可能就需要建立多个复合索引,此操作会造成大量数据冗余,以及非时间分组字段会有大量重复比较。
2、由此可以看出,传统数据库在进行海量数据分组查询时,如果分组字段中有时间字段时,并且对时间字段有多种时间粒度查询要求时,建立复合索引查询优化成本较高。
技术实现思路
1、专利技术目的:为解决传统数据库在进行海量数据分组查询,以及当分组字段中有时间字段时,并且对时间字段有多种时间粒度查询要求时,建立复合索引查询优化成本较高等问题,本专利技术提出了一种基于时间维度针对海量数据分析场景预处理优化方法和系统,通过为每一组关键字字段都映射了唯一id
...【技术保护点】
1.一种基于时间维度的数据预处理方法,其特征在于:包括:
2.根据权利要求1所述的一种基于时间维度的数据预处理方法,其特征在于:所述关键字段由一个或多个字段组成,所述时间字段有且只有一个字段。
3.根据权利要求1所述的一种基于时间维度的数据预处理方法,其特征在于:所述索引文件块数量为1。
4.一种基于时间维度的数据预处理模型,其特征在于:包括索引文件块和多个数据文件块;
5.根据权利要求4所述的一种基于时间维度的数据预处理模型,其特征在于:所述关键字段由一个或多个字段组成,所述时间字段有且只有一个字段。
6.
...【技术特征摘要】
1.一种基于时间维度的数据预处理方法,其特征在于:包括:
2.根据权利要求1所述的一种基于时间维度的数据预处理方法,其特征在于:所述关键字段由一个或多个字段组成,所述时间字段有且只有一个字段。
3.根据权利要求1所述的一种基于时间维度的数据预处理方法,其特征在于:所述索引文件块数量为1。
4.一种基于时间维度的数据预处理模型,其特征在于:包括索引文件块和多个数据文件块;
5.根据权利要求4所述的一种基于时间维度的数据预处理模型,其特征在于:所述关键字段由一个或多个字段组...
【专利技术属性】
技术研发人员:姜久文,付新,邓哲,吴道钟,张东,
申请(专利权)人:达梦数据技术江苏有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。