一种数据存储复制方法及其存储复制系统技术方案

技术编号:13825988 阅读:69 留言:0更新日期:2016-10-13 01:08
本发明专利技术属于数据存储复制领域,特别涉及一种数据存储复制方法及其存储复制系统。本发明专利技术包括有用于对数据进行查询的主数据集群和用于对数据进行分布式计算的从数据集群,前端传感器将采集到的数据存储于主数据集群的第一分布式数据库中,然后第一分布式数据库向从数据集群中的第二分布式数据库中进行所述数据的复制,所述从数据集群利用内部的分布式计算系统对数据执行分布式计算算法;因此本发明专利技术使用两个集群来分别承担对数据的查询和分布式计算的工作,因此本发明专利技术保证了日常查询请求效率较高,用户的体验效果较好,而且读写和运算的资源量较小,系统可靠性和稳定性均较高。

【技术实现步骤摘要】

本专利技术属于数据存储复制领域,特别涉及一种数据存储复制方法及其存储复制系统
技术介绍
Hadoop是一个Java语言开发的针对集群上大数据集分布式存储和分布式运算开源的软件框架,用户可以利用Hadoop轻松地组织计算机资源,从而搭建自己的分布式计算平台,并且可以充分利用集群的计算和存储能力,完成海量的数据处理,HBase是Hadoop的分布式数据库,用于更改对大数据提供随机、实时的读写访问功能,具有开源、分布式、可扩展及面向列存储的特点。现有技术中通常使用一个集群来承担对数据的查询和分布式计算的工作,因此会导致大规模分布式计算在运行的过程中日常查询请求效率下降甚至请求失败,而且所需读写和运算的资源量较大,系统可靠性和稳定性较低,因此,亟需提出一种可以将数据的查询和分布式计算区分开的系统来解决上述问题。
技术实现思路
本专利技术为了克服上述现有技术的不足,提供了一种数据存储复制方法,本方法将分布式数据库的存储查询运算和分布式计算分离,因此保证了日常查询请求效率较高。为实现上述目的,本专利技术采用了以下技术措施:一种数据存储复制方法,具体包括以下步骤:S1、采集传感器将采集到的数据存储于主数据集群的第一分布式数据库,所述第一分布式数据库设计所述数据的存储策略;S2、所述第一分布式数据库将所述数据复制到从数据集群中的第二分布式数据库;S3、所述从数据集群利用内部的分布式计算系统对所述数据执行分布式
计算算法;S4、所述分布式计算系统将分布式的计算结果输出。优选的,步骤S1中的所述第一分布式数据库设计所述数据的存储策略,具体步骤包括:S11、所述第一分布式数据库将所述数据所存在的数据表的主键自动建立索引;S12、将用于查询的字段设置为所述数据表的主键,若所述字段不具备唯一性,则在所述字段上添加序列号。优选的,所述步骤S2中的数据复制具体包括以下步骤:S21、所述第一分布式数据库向所述第二分布式数据库发送数据写入日志,即所述第一分布式数据库向第二分布式数据库写入数据的同时记录数据的操作和内容;S22、所述第二分布式数据库根据数据写入日志写入数据。进一步的,所述数据的复制采用主推送的架构模式。本专利技术还提供了一种数据存储复制方法的存储复制系统,本系统包括所述主数据集群和所述从数据集群,其中,主数据集群,所述主数据集群的输入端接收所述前端传感器所采集到的数据;从数据集群,用于对所述数据进行分布式计算,所述从数据集群的输入端连接所述主数据集群的输出端。优选的,所述主数据集群包括第一分布式数据库,所述第一分布式数据库的输出端连接从数据集群的输入端。优选的,所述从数据集群包括所述第二分布式数据库和分布式计算系统,所述第二分布式数据库的输入端连接第一分布式数据库的输出端,第二分布式数据库的输出端连接所述分布式计算系统的输入端,分布式计算系统的输出端输出分布式的计算结果至数据库中。进一步的,所述第一分布式数据库、第二分布式数据库均为HBase分布式数据库。进一步的,所述分布式计算系统为MapReduce分布式计算系统。本专利技术的有益效果在于:1)、本专利技术包括有用于对数据进行查询的主数据集群和用于对数据进行分布式计算的从数据集群,前端传感器将采集到的数据存储于主数据集群的第一分布式数据库中,然后第一分布式数据库向从数据集群中的第二分布式数据库中进行所述数据的复制,所述从数据集群利用内部的分布式计算系统对数据执行分布式计算算法;因此本专利技术使用两个集群来分别承担对数据的查询和分布式计算的工作,因此本专利技术保证了日常查询请求效率较高,用户的体验效果较好,而且读写和运算的资源量较小,系统可靠性和稳定性均较高。2)、数据的复制具体步骤包括所述第一分布式数据库向所述第二分布式数据库发送数据写入日志,即所述第一分布式数据库向第二分布式数据库写入数据的同时记录数据的操作和内容;所述第二分布式数据库根据数据写入日志写入数据,因此当第二分布式数据库写入数据失败时可以进行回滚操作,当数据库出现故障时,可以对数据进行恢复;且数据的复制采用主推送的架构模式,因此本复制方法是异步的,从数据集群在进行分布式计算时会具备一定的滞后性,可以根据实际情况来选择合理的运行时间,保证了分析的完整性。3)、所述第一分布式数据库、第二分布式数据库均为HBase分布式数据库,HBase分布式数据库是一个高可靠性、高性能、可伸缩的分布式数据库,所述分布式计算系统为MapReduce分布式计算系统,能够用来存储和处理大型数据。附图说明图1为本专利技术的结构原理图;图2为本专利技术的数据存储复制方法的流程图;图3为本专利技术的数据存储复制方法的流程图的具体结构流程图。10—主数据集群 11—第一HBase分布式数据库20—从数据集群 21—第二HBase分布式数据库22—MapReduce分布式计算系统具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1、2所示,一种数据存储复制方法,具体包括以下步骤:S1、采集传感器将采集到的数据存储于主数据集群10的第一分布式数据库11,所述第一分布式数据库11设计所述数据的存储策略;S2、所述第一分布式数据库11将所述数据复制到从数据集群20中的第二分布式数据库21;S3、所述从数据集群20利用内部的分布式计算系统22对所述数据执行分布式计算算法;S4、所述分布式计算系统22将分布式的计算结果输出至存储数据库中。下面结合附图3说明步骤S1中的所述第一HBase分布式数据库11设计所述数据的存储策略,具体步骤包括:S11、所述第一分布式数据库11在所述数据所存在的数据表中自动建立索引;S12、将用于查询的字段设置为所述数据表的主键,若所述字段不具备唯一性,则在所述字段上添加序列号,用于保证主键的唯一性。下面结合附图3说明步骤S2中的数据的复制采用主推送的架构模式,具体包括以下步骤:S21、所述第一分布式数据库11向所述第二分布式数据库21发送数据写入日志,即所述第一分布式数据库11向第二分布式数据库21写入数据的同时记录数据的操作和内容,当第二分布式数据库写入数据失败时可以进行回滚操作,当数据库出现故障时,可以对数据进行恢复;S22、所述第二HBase分布式数据库21根据所述数据写入日志写入数据。主推送即为一个主数据集群将数据复制到任意数目的从数据集群的架
构模式。如图1所示,一种数据存储复制系统,本系统包括所述主数据集群10和所述从数据集群20,所述主数据集群10用于对所述数据进行查询,所述主数据集群10的输入端接收所述前端传感器所采集到的数据;所述从数据集群20用于对所述数据进行分布式计算,所述从数据集群20的输入端连接所述主数据集群10的输出端。所述从数据集群20包括所述第二HBase分布式数据库21和MapReduce分布式计算系统22,所述第二HBase分布式数据库21的输入端连接所述主数据集群10中的第一HBase分布式数据库11的输出端,第二HBase分布本文档来自技高网
...

【技术保护点】
一种数据存储复制方法,其特征在于,具体包括以下步骤:S1、采集传感器将采集到的数据存储于主数据集群(10)的第一分布式数据库(11),所述第一分布式数据库(11)设计所述数据的存储策略;S2、所述第一分布式数据库(11)将所述数据复制到从数据集群(20)中的第二分布式数据库(21);S3、所述从数据集群(20)利用内部的分布式计算系统(22)对所述数据执行分布式计算算法;S4、所述分布式计算系统(22)将分布式的计算结果输出。

【技术特征摘要】
1.一种数据存储复制方法,其特征在于,具体包括以下步骤:S1、采集传感器将采集到的数据存储于主数据集群(10)的第一分布式数据库(11),所述第一分布式数据库(11)设计所述数据的存储策略;S2、所述第一分布式数据库(11)将所述数据复制到从数据集群(20)中的第二分布式数据库(21);S3、所述从数据集群(20)利用内部的分布式计算系统(22)对所述数据执行分布式计算算法;S4、所述分布式计算系统(22)将分布式的计算结果输出。2.如权利要求1所述的一种数据存储复制方法,其特征在于,步骤S1中的所述第一分布式数据库(11)设计所述数据的存储策略,具体步骤包括:S11、所述第一分布式数据库(11)将所述数据所存在的数据表的主键自动建立索引;S12、将用于查询的字段设置为所述数据表的主键,若所述字段不具备唯一性,则在所述字段上添加序列号。3.如权利要求2所述的一种数据存储复制方法,其特征在于,所述步骤S2中的数据复制具体包括以下步骤:S21、所述第一分布式数据库(11)向所述第二分布式数据库(21)发送数据写入日志,即所述第一分布式数据库(11)向第二分布式数据库(21)写入数据的同时记录数据的操作和内容;S22、所述第二分布式数据库(21)根据数据写入日志写入数据。4.如权利要求3所述的一种数据存储复制方法,其特征在于:所...

【专利技术属性】
技术研发人员:周春寅余保华范联伟李铮胡兴吴磊李贤军徐圣吉张金国胡斌
申请(专利权)人:安徽四创电子股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1