当前位置: 首页 > 专利查询>张真专利>正文

一种大数据分布式存储及并行索引系统的构建方法技术方案

技术编号：12255259 阅读：113 留言：0更新日期：2015-10-28 18:22

本发明专利技术公开了一种大数据分布式存储及并行索引系统的构建方法，数据在建立及存储的同时，还建立有数据立方索引，所述数据立方索引中插入有B+树结构；将数据分布式入库到各个数据节点上，每个数据节点分别对该节点上的数据独立的建立索引，多个B+树结构堆叠在一起，与数据存储形成一个完整的数据立方结构；每一条新的记录只需要插入到B+树结构中；当新的记录到来时，将新的数据记录对应的一条索引记录插入到所有的字段索引中本发明专利技术所设计的大数据分布式存储及并行索引系统的构建方法，构建后的系统通过索引查询的方法，能够提高在云计算中海量数据检索的速度，降低资源浪费，节省时间，同时保障云计算系统内数据的安全。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及分布式大数据的云计算领域，特别是一种大数据分布式存储及并行索引系统的构建方法。
技术介绍
当今社会中，信息数据呈爆炸化的增长，而爆炸化的数据增长导致了数据存储困难、检索复杂和可靠性降低等多重问题，云计算和云存储技术的出现，为海量数据的处理与存储提供了有效的解决途径。现有技术中，通常的云计算解决方案利用Hadoop(-种分布式系统基础架构）的HDFS(-种分布式文件系统）虽然能够方便的实现海量数据存储，同时有效防止单点故障，避免不必要的损失，但是，在HDFS上进行数据检索时，常用的方法是开启全局搜索 MapReduce(大规模数据并行运算），这需要完整过滤一遍HDFS上存储的所有数据；然而在云计算中，尤其是在海量数据情况下，该方案会对系统资源造成巨大的浪费，耗费大量的时间，其工作效率也因此大大降低，这显然不是一个适合投入现实生产环境的方式，同时也是本专利技术所要针对解决的重要问题。
技术实现思路
本专利技术所要解决的技术问题是，克服现有技术的缺点，提供一种大数据分布式存储及并行索引系统的构建方法，构建后的系统通过索引查询的方法，能够提高在云计算中海量数据检索的速度，降低资源浪费，节省时间，同时保障云计算系统内数据的安全。为了解决以上技术问题，本专利技术提供一种大数据分布式存储及并行索引系统的构建方法，数据在建立及存储的同时，还建立有数据立方索引，所述数据立方索引中插入有B+ 树结构。本专利技术进一步限定的技术方案是：进一步的，前述的大数据分布式存储及并行索引系统的构建方法，将数据分布式入库到各个数...

【技术保护点】
一种大数据分布式存储及并行索引系统的构建方法，其特征在于，数据在建立及存储的同时，还建立有数据立方索引，所述数据立方索引中插入有B+树结构。

【技术特征摘要】

【专利技术属性】
技术研发人员：张真，
申请(专利权)人：张真，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人