一种基于HBase高扩展性数据库设计方法技术

技术编号：11808964 阅读：73 留言：0更新日期：2015-08-01 01:03

本发明专利技术公开了一种基于多节点备份的HBase数据高并发访问的方法，当HBase中存在长时间存在并鲜有更改的热点数据存在时，主动为热点数据制作两个及以上替身。当数据发生更改时，更改操作执行于数据本体，并将更改操作同步到各个替身。当读取数据时，主动将读取申请平衡地分配到各个替身数据所在节点，以保证数据读取的高并发性，减少热点数据成为瓶颈的可能，同时降低因为热点数据汇聚造成存储节点过热的可能性，从而提高数据的读写速度，保证系统的稳定性和性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于大数据领域，更具体地涉及一种非关系数据库中热点数据的高并发读取的解决方案，尤其涉及一种基于HBase高扩展性的数据库设计方案。非关系型数据库是指有别于传统的关系型数据库的一种新型数据库，在海量数据存储、高并发访问支持等方面表现出很好的性能。HBase，也就是Hadoop Database，是一种基于列存储的非关系型数据库。HBase是Apache Hadoop的子项目，在Hadoop架构中处于结构化存储层:下层需要依托分布式文件系统HDFS ;为上层的MapReduce计算模块提供高性能、高可靠、高可扩展性、基于列存储的分布式存储系统。HBase可以存储结构化数据，也可以存储半结构化或者非结构化的数据。当前HBase采用数据单备份的存储策略，通过HReg1n分裂的方式来解决单个热点数据的问题。当数据较少更新时，由于数据无法达到分裂的要求，从而使得通过分裂的策略来解决热点数据不可实现。而热点数据造成数据读取的瓶颈使得整个系统的性能大幅度下降，而当热点数据在同一个存储节点聚集时，对该存储节点造成巨大压力，从而使得热点数据带来的负面影响大幅度扩大。
技术实现思路
本专利技术所要解决的技术问题是，提供一种能够解决热点数据造成读取瓶颈的基于HBase的数据高并发读取的方法。为了解决上述技术问题，本专利技术是通过以下技术方案来实现的: ，在HBase中存在热点数据时，首先为热点数据制作多份替身，并将替身转移与原始数据存储位置不同的多个不同存储节点上，依靠多个替身数据分布在不同节点的特性，放大热点的数据的并发性，减小原始节点的读取压力。进一步地...

【技术保护点】
一种基于HBase高扩展性数据库设计方法，其特征在于在HBase中存在热点数据时，首先为热点数据制作多份替身，并将替身转移与原始数据存储位置不同的多个不同存储节点上，并主动平衡多个替身数据之间的读取请求；在原始数据发生更改时，主动同步各个替身数据。

【技术特征摘要】

【专利技术属性】
技术研发人员：杨峰，周学海，庄航，卢坤，李昌龙，孙明明，
申请(专利权)人：苏州星熙数据科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人