一种面向流式时序数据的数据索引方法技术

技术编号：21398918 阅读：60 留言：0更新日期：2019-06-19 06:58

本发明专利技术提出一种面向流式时序数据的数据索引方法，包括以下步骤：步骤1，建立整体数据索引结构，所述结构为在B+树的非根和非叶子结点再增加指向兄弟的指针的B*树；步骤2，批量资源申请及索引优化；步骤3，进行触发式树结构切分与合并。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向流式时序数据的数据索引方法
本专利技术涉及一种数据索引方法，主要涉及到一种面向流式时序数据的数据索引方法。
技术介绍
伴随着虚拟化、云计算等前沿互联网技术的飞速发展及广泛应用，大量移动便携终端和传感器设备被布设在世界的各个角落，充当起信息搜集及获取的角色。特别是在近几年，倡导万物互联的“物联网”概念被提出，通过实时网络相互连接的移动传感器网络在军事、经济、医疗等领域已被大量应用，并取得了可观的实用价值。然而，随着海量流式时序数据信息的获取与处理，虽然一方面拓展了数据规模，有利于数据隐含特征的监测与检测，便于挖掘数据流固有的本质规律；但在另一方面，时序数据的检索、存储、管理等底层数据功能却面临着十分严峻的挑战。例如，四十余万美国纽约的出租车在安装了相关GPS等传感器设备后，其每分钟会生成上亿条的实时车辆行驶数据，传统关系型数据库将难以实时对如此数量级的数据进行读写，而当前分布式数据库也需大量的计算与存储资源才能满足上述的数据处理需求。为了解决此类问题，大量面向时序数据的数据库系统被提出，其中以InfluxDB、OpenTSDB等为代表的时序数据库也已被大量应用，并一定程度上缓解了时序数据的读写问题。此类系统为了提升自身工作效率，普遍对各自数据库系统中的数据索引模块进行了针对性的优化，这主要是由于数据读写的主要压力均体现在数据索引上。其中，有别于传统的B+树结构索引，现有最适于管理时序数据的索引结构为LSM(log-structuredmerge)树，其通过将数据索引按照写入时间的先后顺序分别放置在内存、硬盘以响应不同频率的读写请求，进而通过设置的阈值...

【技术保护点】
1.一种面向流式时序数据的数据索引方法，其特征在于，包括以下步骤：步骤1，建立整体数据索引结构，所述结构为在B+树的非根和非叶子结点再增加指向兄弟的指针的B*树；步骤2，批量资源申请及索引优化；步骤3，进行触发式树结构切分与合并。

【技术特征摘要】
1.一种面向流式时序数据的数据索引方法，其特征在于，包括以下步骤：步骤1，建立整体数据索引结构，所述结构为在B+树的非根和非叶子结点再增加指向兄弟的指针的B*树；步骤2，批量资源申请及索引优化；步骤3，进行触发式树结构切分与合并。2.如权利要求1所述的方法，其特征在于，所述步骤2中，所述批量资源申请的方式为，时序数据的B*树构建方式变为批量追加形式，所有新插入B*树的数据在最右的叶子节点上，新数据的插入时直接将所述新数据批量链接在叶子节点链表的末尾。3.如权利要求2所述的方法，其特征在于，所述索引优化的方式为，在数据索引中的所有的子树分别构造了布隆过滤器。4.如权利要求3所述的方法，其特征在于，所述步骤3中，所述切分的具体方式为，索引结构基于数据冷热程度的...

【专利技术属性】
技术研发人员：李建欣，邰振赢，李晨，司靖辉，韦冠宇，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人