基于Hbase行健的高性能查询方法和装置制造方法及图纸

技术编号：14884466 阅读：32 留言：0更新日期：2017-03-25 00:12

本申请提供了一种基于Hbase行健的高性能查询方法和装置，所述方法包括：接收用户输入的m个对Hbase表的查询条件及其逻辑关系；根据预设的元数据表信息解析出每个查询条件对应的查询列、查询条件值及其运算符；获取Hbase表中每一行的行健，根据预设的元数据表信息对行健进行分解，得到每个查询条件中的对应查询列的比对值，将比对值与查询条件值根据运算符进行比较运算，生成查询条件的比较结果；以及，根据逻辑关系汇总所有查询条件的比较结果，将汇总后的比较结果为真的行健对应的行数据返回给用户。本申请通过上述手段，能够在保证高性能的同时实现HBase多条件细粒度的过滤查询。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据库
，特别地，涉及一种基于Hbase行健的高性能查询方法和装置。
技术介绍
Hadoop数据库（HBase，HadoopDatabase）是一种分布式、可伸缩的非关系型（NoSQL，NotOnlySQL）数据库，它构建在Hadoop基础设施之上，依托于Hadoop的迅猛发展，HBase在大数据领域的应用越来越广泛，成为目前NoSQL数据库中表现最耀眼，呼声最高的产品之一。HBase的表数据按行健（Rowkey）进行字典排序，Rowkey实际上是数据表的一级索引（PrimaryIndex），Rowkey在HBase中以B+树的结构形式有序存储，扫描效率较高，但在面对多条件组合查询时，仍存在不便。虽然Hbase提供了一些针对Rowkey、列、列簇的过滤器（Filter），可以实现组合、比较等查询方式，但是多Filter的组合过滤是要在HBase里进行多次数据扫描，速度缓慢、组合麻烦、效率低下，经常无法满足查询要求。另外，虽然可以借助批处理或者其他方式建立HBase的二级索引数据，但是在插入主数据时需要伴随插入多份二级索引从而较大程度的降低了写入性能。对于一些轻量级的条件搜索场景，二级搜索显得过于浪费资源，而且每次创建新的表后，需要重新编写代码来支持。
技术实现思路
本申请提供一种基于Hbase行健的高性能查询方法和装置，用于解决现有Hbase无法在保持高性能优势的条件下支持多条件查询的问题。本申请公开的一种基于Hbase行健的高性能查询方法，所述行健包括按预设结构排列的n个查询列的数据，所述方法包括：接收用户输入的m个对Hbase表的查询条件...
基于Hbase行健的高性能查询方法和装置

【技术保护点】
一种基于Hbase行健的高性能查询方法，其特征在于，所述行健包括按预设结构排列的n个查询列的数据，所述方法包括：接收用户输入的m个对Hbase表的查询条件及其逻辑关系；根据预设的元数据表信息解析出每个查询条件对应的查询列、查询条件值及其运算符；获取所述Hbase表中每一行的行健，根据预设的元数据表信息对所述行健进行分解，得到每个查询条件中的对应查询列的比对值，将所述比对值与查询条件值根据所述运算符进行比较运算，生成所述查询条件的比较结果；以及，根据所述逻辑关系汇总所有查询条件的比较结果，将汇总后的比较结果为真的行健对应的行数据返回给用户；其中，n≥m≥1。

【技术特征摘要】
1.一种基于Hbase行健的高性能查询方法，其特征在于，所述行健包括按预设结构排列的n个查询列的数据，所述方法包括：接收用户输入的m个对Hbase表的查询条件及其逻辑关系；根据预设的元数据表信息解析出每个查询条件对应的查询列、查询条件值及其运算符；获取所述Hbase表中每一行的行健，根据预设的元数据表信息对所述行健进行分解，得到每个查询条件中的对应查询列的比对值，将所述比对值与查询条件值根据所述运算符进行比较运算，生成所述查询条件的比较结果；以及，根据所述逻辑关系汇总所有查询条件的比较结果，将汇总后的比较结果为真的行健对应的行数据返回给用户；其中，n≥m≥1。2.根据权利要求1所述的方法，其特征在于，所述预设的元数据表包括Hbase表名、列名、列类型和偏移地址。3.根据权利要求2所述的方法，其特征在于，所述行健的预设结构为：n个查询列的数据之间以0x00为分隔符隔开；所述根据预设的元数据表信息分解对所述行健进行分解，得到每个查询条件对应查询列的比对值，具体包括：根据每个查询列的列类型获得相应查询列的字节长度Leni；根据所述查询条件中对应查询列在行健中的排列位置k、以及位于该查询列之前各查询列的字节长度，计算该第k个查询列在行健中的偏移量Offsetk，然后从该偏移量Offsetk处读取长度为Lenk字节的数据，作为该查询列的比对值。4.根据权利要求2所述的方法，其特征在于，所述查询条件包括列名分片数组、偏移地址分片数组、第一条件值分片数组、第二条件值分片数组和运算符分片数组，每个分片数组的长度为m；根据预设的元数据表信息解析出每个查询条件对应的查询列、查询条件值，具体包括：根据待查询Hbase表名和预设的元数据表获取所述Hbase表的列名、列类型和偏移地址；根据所述列名的偏移地址从所述列名分片数组中分解获得每个查询条件的查询列的列名；根据所述查询列的列名获得对应的列类型，并根据列类型计算对应查询条件值的偏移地址；根据所述查询条件值的偏移地址从所述第一条件值分片数组和第二条件值分片数组中分解获得每个查询条件的查询条件值。5.根据权利要求2所述的方法，其特征在于，所述预设的元数据表还包括是否倒序。6.根据权利要求1所述的方法，其特征在于，所述运算符包括等于、不等于、大于、小于和介于查询条件值一与查询条件值二之间。7.根据权利要求1所述的方法，其特征...

【专利技术属性】
技术研发人员：兰斌，陈奋，邱毓彬，
申请(专利权)人：厦门服云信息科技有限公司，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人