HBase二级索引构建装置和方法制造方法及图纸

技术编号：12338382 阅读：63 留言：0更新日期：2015-11-18 11:12

本发明专利技术提供了一种HBase二级索引构建装置，包括：数据复制单元，用于通过主从集群的架构，将写入主集群的数据，以异步方式复制到从集群；数据更新单元，用于获取从集群中复制得到的数据，对相应的索引数据进行更新处理；索引文件生成单元，用于基于更新处理后的索引数据，部署批处理服务，生成索引文件。本发明专利技术还提供了一种HBase二级索引构建方法。通过本发明专利技术的技术方案，可以在现有的索引构建方式基础上，充分利用单对象类型完成多对象类型的索引构建，建立多对象类型元数据参与的面向复杂类型索引构建的通用、统一构建思路。

全部详细技术资料下载

【技术实现步骤摘要】
【专利说明】HBase 二级索引构建装置和方法
本专利技术涉及计算机
，具体地，涉及一种HBase 二级索引构建装置和一种HBase 二级索引构建方法。
技术介绍
HBase是一个列存数据库，每行数据只有一个主键-RowKey，无法依据指定列的数据进行检索。查询时需要通过RowKey进行检索，然后查看指定列的数据是什么，效率低下。在实际应用中，我们经常需要根据指定列进行检索，或者几个列进行组合检索，这就提出了建立HBase 二级索引的需求。目前的HBase二级索引构建方案主要有两种。第一种方案是将索引数据单独存储为一张表，通过HBase Coprocessor生成并访问索引数据。第二种方案是将索引数据与源数据存储在相同的Reg1n里，索引数据定义为一个单独的列族，也是利用Coprocessor来生成并访问索引数据。对于第一种方案，源数据表与索引表的数据一致性很难保证，访问两张不同的表也会增加10开销和远程调用的次数。对于第二种方案，单表的数据容量会急剧增加，对同一 Reg1n里的多个列族进行Split或Merge等操作时可能会造成数据丢失或不一致。因此，需要一种新的索引构建技术，可以在现有的索引构建方式基础上，充分利用单对象类型完成多对象类型的索引构建，建立多对象类型元数据参与的面向复杂类型索引构建的通用、统一构建思路。
技术实现思路
本专利技术正是基于上述问题，提出了一种新的索引构建技术，可以在现有的索引构建方式基础上，充分利用单对象类型完成多对象类型的索引构建，建立多对象类型元数据参与的面向复杂类型索引构建的通用、统一构建思路。有鉴于此，本专...

【技术保护点】
一种HBase二级索引构建装置，其特征在于，包括：数据复制单元，用于通过主从集群的架构，将写入主集群的数据，以异步方式复制到从集群；数据更新单元，用于获取从集群中复制得到的数据，对相应的索引数据进行更新处理；索引文件生成单元，用于基于更新处理后的索引数据，部署批处理服务，生成索引文件。

【技术特征摘要】

【专利技术属性】
技术研发人员：费英林，
申请(专利权)人：用友网络科技股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人