一种跨多个Hive集群实现数据和任务容灾方法及系统技术方案

技术编号：40934679 阅读：22 留言：0更新日期：2024-04-18 14:54

本发明专利技术属于大数据应用领域，本发明专利技术公开了一种跨多个Hive集群实现数据和任务容灾方法及系统，包括步骤：获取Hadoop集群A与Hadoop集群B的kerberos认证跨域互信；获取Hadoop集群A地集群数据与Hadoop集群B地集群数据，相互复制和同步；当二者数据发生丢失损坏，在二者之间调度与修复，相较于单h ive集群，做到客户无感知的数据、存算任务的容灾，保证业务连续性，规避区域性灾难等对企业数据、业务的破坏，大大提高了集群的可用性和可靠性，以减少或者规避其业务中断、数据丢失可能带来的影响和损失。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及大数据应用领域，更具体地说，本专利技术涉及一种跨多个hive集群实现数据和任务容灾方法及系统。

技术介绍

1、目前，大数据有4个特点，分别为：volume(大量)、variety(多样)、velocity(高速)、value(价值)，一般称之为4v；

2、在大数据离线数据/批数据存储计算中，hive承担着非常重要的角色，可以说批处理场景/数仓建设基本离不开hive，hive数仓中往往也存储着海量数据。

3、此外，对it企业来说，传统的单数据中心，已不足以保护企业数据的安全；当单数据中心存储故障后，可能会导致业务长时间中断，甚至数据丢失；只做本地的数据冗余保护或容灾建设，已不能规避区域性灾难对企业数据的破坏，远程容灾保护数据及保障企业业务连续性成为了企业亟待解决的问题；因此，针对跨idc/跨地域/跨数据中心的hive集群数据容灾/同步、存算任务的连续性等需求，显得尤为迫切和重要。

技术实现思路

1、为了克服现有技术的上述缺陷，本专利技术提供一种跨多个hi...

【技术保护点】

1.一种跨多个Hive集群实现数据和任务容灾方法，其特征在于，包括步骤：

2.根据权利要求1所述的一种跨多个Hive集群实现数据和任务容灾方法，其特征在于，所述Hadoop集群A集群数据与Hadoop集群B集群数据同步方法包括步骤：

3.根据权利要求2所述的一种跨多个Hive集群实现数据和任务容灾方法，其特征在于，所述hive元数据同步结果校验方法包括：

4.根据权利要求2所述的一种跨多个Hive集群实现数据和任务容灾方法，其特征在于，所述HDFS同步结果数据一致性校验方法为：分别获取Hadoop集群A与Hadoop集群B的文件列表及文件内容；

...

【技术特征摘要】

1.一种跨多个hive集群实现数据和任务容灾方法，其特征在于，包括步骤：

2.根据权利要求1所述的一种跨多个hive集群实现数据和任务容灾方法，其特征在于，所述hadoop集群a集群数据与hadoop集群b集群数据同步方法包括步骤：

3.根据权利要求2所述的一种跨多个hive集群实现数据和任务容灾方法，其特征在于，所述hive元数据同步结果校验方法包括：

4.根据权利要求2所述的一种跨多个hive集群实现数据和任务容灾方法，其特征在于，所述hdfs同步结果数据一致性校验方法为：分别获取hadoop集群a与hadoop集群b的文件列表及文件内容；

5.根据权利要求2所述的一种跨多个hive集群实现数据和任务容灾方法，其特征在于，所述hadoop集群a与hadoop集群b故障的监测方法包括步骤：

6.根据权利要求3所述的一种跨多个hive集群实现数据和任务容灾方法，其特征在于，cluster1故障，cluster2正常时，处理方法为：

7.根据权利要求6所述的一种跨多个hive集群实现数据和任务容灾方法，其特征在于，cluster1由故障恢复正常，cluster2一直正常时...

【专利技术属性】
技术研发人员：朱修德，朱韦琳，张文领，张晨曦，曹莫言，黄亦斌，陈天多，吴霜霜，
申请(专利权)人：天翼云科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人