一种时序数据的聚合优化处理方法技术

技术编号：20044581 阅读：43 留言：0更新日期：2019-01-09 04:03

一种时序数据的聚合优化处理方法,包括将时序数据库文件划分为数据块文件和块索引文件；按照计算的起止时间段扫描块索引文件，将符合时间段条件和其他过滤条件的数据块抽出来后，根据每个数据块在数据块文件里的偏移量进行排序；按照排序后的数据块便宜量扫描数据文件，对每个数据块进行指定的计算后，将计算结果汇总,该方法无论是对于单一时间序列数据的读取，还是对于多个时间序列的聚合操作，都只需要打开一次数据文件进行扫描即可完成，大幅提升整体性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种时序数据的聚合优化处理方法
本专利技术涉及数据处理领域，具体涉及一种时序数据的聚合优化处理方法。
技术介绍
时序数据是指时间序列数据，是一种按照时间顺序记录的数据列，有专门的时序数据库来处理时序数据的存储和查询。现有技术中，通常一个时序数据库里包含有多个时间序列数据，除单一时间序列数据的读取之外，通常需要将多个时间序列数据进行聚合计算操作。通常的做法是将每个时间序列单独处理，得到结果，放在缓存里，然后将结果汇总聚合。然而，相对于每个时间序列都需要扫描一次数据库文件，多个时间序列，就要打开并扫描多次数据库文件，这样导致磁盘IO次数大增，影响系统性能。
技术实现思路
本专利技术的目的在于克服现有技术的不足，提供一种时序数据的聚合优化处理方法，通过这种方法，无论是对于单一时间序列数据的读取，还是对于多个时间序列的聚合操作，都只需要扫描一次数据文件即可完成，这样大幅减少磁盘IO次数，提升整体性能。本专利技术提供了一种时序数据的聚合优化处理方法，其包括如下步骤：将时序数据库文件划分为数据文件和索引文件；按照计算的起止时间段扫描索引文件，将符合时间段条件的所有需要聚合的时间序列的索引块抽出来后，根据索引块里记录的数据文件偏移量进行排序；按照排序后的索引块顺序扫描数据文件，对每个数据块进行指定的读取和计算后，将计算结果汇总。进一步地，索引块排序时，偏移量小的排在前。进一步地，数据文件包含多个时间序列的数据块。进一步地，索引文件记录每个时间序列的数据块的信息。进一步地，索引文件里，每个时间序列，都有一个索引汇总信息块，以及一到多个索引块。索引汇总信息块包含时间序列的ID，...

【技术保护点】
1.一种时序数据的聚合优化处理方法，其特征在于，包括如下步骤：将时序数据库文件划分为数据文件和索引文件；按照计算的起止时间段扫描索引文件，将符合时间段条件的所有需要聚合的时间序列的索引块抽出来后，根据索引块里记录的数据文件偏移量进行排序；按照排序后的索引块顺序扫描数据文件，对每个数据块进行指定的读取和计算后，将计算结果汇总。

【技术特征摘要】
1.一种时序数据的聚合优化处理方法，其特征在于，包括如下步骤：将时序数据库文件划分为数据文件和索引文件；按照计算的起止时间段扫描索引文件，将符合时间段条件的所有需要聚合的时间序列的索引块抽出来后，根据索引块里记录的数据文件偏移量进行排序；按照排序后的索引块顺序扫描数据文件，对每个数据块进行指定的读取和计算后，将计算结果汇总。2.如权利要求1所述的方法，其特征在于：索引块排序时，偏移量小的排在前。3.如权利要求1所述的方法，其特征在于：数据文件包含多个时间序列的数据块。4.如权利要求1-3任一项所述的方法，其特征在于：索引文件记录每个时间序列的数据块的信息。5.如权利要求4所述的方法，其特征在于：索引文件里，每个时间序列，都有一个索引汇总信息块，以及一到多个索引块。索引汇总信息块包含时间序列的ID，数据块的个数。6.如权利要求3或5所述的方法，其特征在于：每个时间序列有一到多个索引块，每一个数据块有一个对应的索引块，该索引块包含了数据块在数据文件里的偏移量，开始时间、结束时间、记录...

【专利技术属性】
技术研发人员：廖浩均，关胜亮，程洪泽，陶建辉，
申请(专利权)人：北京涛思数据科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人