【技术实现步骤摘要】
一种hbaes多可选条件快速查询方法
本专利技术涉及hbase技术,尤其涉及一种hbaes多可选条件快速查询方法。
技术介绍
Hbase是运行在Hadoop上的NoSQL数据库,它是一个分布式的和可扩展的大数据仓库,也就是说HBase能够利用HDFS的分布式处理模式,并从Hadoop的MapReduce程序模型中获益。这意味着在一组商业硬件上存储许多具有数十亿行和上百万列的大表。除去Hadoop的优势,HBase本身就是十分强大的数据库,它能够融合key/value存储模式带来实时查询的能力,以及通过MapReduce进行离线处理或者批处理的能力,Hbase能够让你在大量的数据中快速查询记录,也可以从中获得综合分析报告。HBase本身只提供基于行键和全表扫描的查询,而行键索引单一,对于多维度的查询困难,并且效率极低。可以使用建立hbase二级索引的方法,不过此方法较为复杂,无形中增加了开发难度。
技术实现思路
本专利技术的目的是克服现有技术存在的缺陷,提出了一种hbaes多可选条件快速查询方法。对行键进行优化设计,使用hbaseAPIscan与rowFilter的方法 ...
【技术保护点】
一种hbaes多可选条件快速查询方法,其特征在于,步骤S1,根据数据源文件的数据量对hbase中相关的表进行预分区,得到特定的预分区区域;步骤S2,根据具体的业务场景,将待查询条件分为查询必选条件和查询可选条件;步骤S3,将查询必选条件和查询可选条件以特定分隔符分隔,并组合为hbase行键得到组合行键,必选条件放于行键左侧,可选条件放于行键右侧;步骤S4,将数据文件与设计的行键加载入hbase表中;步骤S5,使用hbase API的scan方法,并设置扫描条件起始行startRow、结束行endRow;步骤S6,使用行键过滤器对行键进行正则表达式匹配;步骤S7,S5与S6结 ...
【技术特征摘要】
1.一种hbaes多可选条件快速查询方法,其特征在于,步骤S1,根据数据源文件的数据量对hbase中相关的表进行预分区,得到特定的预分区区域;步骤S2,根据具体的业务场景,将待查询条件分为查询必选条件和查询可选条件;步骤S3,将查询必选条件和查询可选条件以特定分隔符分隔,并组合为hbase行键得到组合行键,必选条件放于行键左侧,可选条件放于行键右侧;步骤S4,将数据文件与设计的行键加载入hbase表中;步骤S5,使用hbase...
【专利技术属性】
技术研发人员:尹青山,段成德,于治楼,
申请(专利权)人:济南浪潮高新科技投资发展有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。