一种基于HBase的智能交通领域卡口数据存储方法技术

技术编号：13050325 阅读：60 留言：0更新日期：2016-03-23 15:56

本发明专利技术涉及一种基于HBase的智能交通领域卡口数据存储方法，本发明专利技术方法结合HBase自身的特点，融合卡口数据的读写场景，对主表、二次索引表进行定制化Rowkey设计，以便于相关业务的快速高效查询，使得查询结果能全局按时间倒序排列，为数据的进一步统计分析及研判奠定良好的基础。解决了目前智能交通行业海量卡口数据的高性能并发读写要求法。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于智能交通领域，具体涉及一种基于HBase的智能交通领域卡口数据存储方法。
技术介绍
随着交通工具的大力普及与各种交通设施的巨增，交通系统所面临的数据压力也成几何倍数的增长。面对如此海量的数据压力，Hadoop作为大数据处理领域的首选技术框架，在企业中得到了大量的应用。而其中的HBase以高性能高吞吐量的特性成为了大数据存储的首选技术目标。那么如何有效地利用HBase的特性，充分发挥其集群性能，实现数据的高效检索。HBase是将数据按照表、行和列进行存储，其数据类型只有字符串，而要想访问其中的数据，只有单个Rowkey访问、通过Rowkey的Range访问、通过全表扫描Rowkey这3 种方式，它不支持条件查询和Orderby等查询。同时，由于HBase是分布式数据库，采用LSM设计解决了磁盘随机写的问题（即使用了顺序写盘的方式）。在高并发的数据写入时会按照Rowkey分配相应的Region，若 Rowkey本身存在时间或其他的顺序则会出现单台机器繁忙而其他服务器相对空闲的情况，从而影响集群整体性能。因此，对于Rowkey还需要进行散列化设计，以避免热点现象。
技术实现思路
为了解决目前智能交通行业海量卡口数据的高性能并发读写要求，本专利技术提供一种基于HBase的智能交通领域卡口数据存储方法。此方法结合HBase自身的特点，融合卡口数据的读写场景，对表进行定制化Rowkey设计，以便于相关业务的快速高效查询，使得查询结果能全局按时间倒序排列，为数据的进一步统计分析及研判奠定良好的基础。本专利技术的技术...

【技术保护点】
一种基于HBase的智能交通领域卡口数据存储方法，其特征在于：包括以下步骤：1】建立主表：根据业务需要，将卡口数据的主要字段按一定顺序组合成主表Rowkey，并按照主表Rowkey的编码顺序存储；列族中的特定列存储为所有字段组合成的JSON格式串；2】建立二次索引表：将主表中查询性能低的字段或不支持查询的字段组合成索引Rowkey，并按照索引Rowkey的编码顺序存储，同时在索引Rowkey前加哈希散列，列族中的列存储为主表Rowkey。

【技术特征摘要】

【专利技术属性】
技术研发人员：周海舰，岩涛，赵青，朱博，
申请(专利权)人：西安翔迅科技有限责任公司，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人