一种Hbase数据库的通用高性能数据写入方法技术

技术编号：11323449 阅读：143 留言：0更新日期：2015-04-22 12:04

本发明专利技术公开一种Hbase数据库的通用高性能数据写入方法，其能够避免了数据干扰和并发安全隐患，避免了因HTable数据写入速率慢的原因导致队列数据阻塞,保证了队列的数据可以持续不断的输出。这种Hbase数据库的通用高性能数据写入方法，使用数据分发机制,平均分发多份数据,不同表的数据有不同的数据处理对象,HTable对象数组均为此对象的局部变量；每份数据一一对应一个HTable对象数组；每份数据写入多个缓冲区中,然后HTable对象数组读取已经写好的缓冲区来进行入库操作；HTable对象数组写入数据的过程中对使用的缓冲区加上线程锁,未写入缓冲区的数据绕开加上线程锁的缓冲区而写一个新的缓冲区。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机数据处理的
，具体地涉及，主要用于大数据写入Hbase数据库。
技术介绍
HBase是一个分布式的、面向列的开源数据库，利用HBase技术可在廉价PCServer上搭建起大规模结构化存储集群。HBase是Google Bigtable的开源实现，类似Google Bigtable利用GFS作为其文件存储系统，HBase利用Hadoop HDFS作为其文件存储系统；Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用HadoopMapReduce来处理HBase中的海量数据；Google Bigtable利用Chubby作为协同服务，HBase利用Zookeeper作为对应。在数据写入Hbase数据库方面，现有技术大多采用常见的生产者消费者模式，因生产消费线程之间抢夺同步锁，尤其在多线程下更为明显，这就严重影响了入库效率。还有的现有技术是使用Hbase数据库自带工具import功能进行数据导入，这样效率较低。并且现有技术在大量数据入库的情况下会阻塞Hbase的reg1nserver客户端，造成reg1nserver 宕机或者 zookeeper 超时。
技术实现思路
本专利技术的技术解决问题是:克服现有技术的不足，提供，其能够避免了数据干扰和并发安全隐患，避免了因HTable数据写入速率慢的原因导致队列数据阻塞，保证了队列的数据可以持续不断的输出。本专利技术的技术解决方案是:这种Hbase数据库的通用高性能数据写入方法，使用数据分发机制，平均分发多份数据，不同表的数据有不同的数据处理对象...
一种Hbase数据库的通用高性能数据写入方法

【技术保护点】
一种Hbase数据库的通用高性能数据写入方法，其特征在于：使用数据分发机制,平均分发多份数据,不同表的数据有不同的数据处理对象,HTable对象数组均为此对象的局部变量；每份数据一一对应一个HTable对象数组；每份数据写入多个缓冲区中,然后HTable对象数组读取已经写好的缓冲区来进行入库操作；HTable对象数组写入数据的过程中对使用的缓冲区加上线程锁,未写入缓冲区的数据绕开加上线程锁的缓冲区而写一个新的缓冲区。

【技术特征摘要】

【专利技术属性】
技术研发人员：曹宇，
申请(专利权)人：北京中交兴路车联网科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人