本发明专利技术公开了一种分布式云灾备的方法及系统,包括将集群注册至灾备系统中,并设置每个集群的优先级;基于集群的优先级,应用调度到优先级高的集群中,优先级低的集群为备份集群;应用在运行过程中将增量数据备份到备份集群中;监测每个集群状态;当监测到应用运行所在的集群出现异常时,将应用在备份集群中运行;本发明专利技术利用云原生的方式来进行系统的容灾备份,使应用、数据和模型等资源在当前地区云环境出现故障时,可以快速迁移到其他地区云环境中,以确保服务的可用性。以确保服务的可用性。以确保服务的可用性。
【技术实现步骤摘要】
一种分布式云灾备的方法及系统
[0001]本专利技术涉及灾备
,尤其涉及一种分布式云灾备的方法及系统。
技术介绍
[0002]灾备系统建设主要涉及以下技术要素:数据备份系统、备用处理系统、备用网络系统。其中数据备份系统是灾备建设的基础,对灾难备份的关键指标——RPO和RTO都有影响,无论是数据级灾备还是应用级灾备系统,数据备份和复制技术都是首要考虑因素。
[0003]从灾备建设模式上看,传统灾备技术一般采用同城灾备、异地灾备模式,或者两者结合的两地三中心或多中心模式。同城灾备主要针对站点级的故障和灾难,异地灾备主要针对区域级的灾难风险。从灾备中心启用情况来区分,可分为主备模式和双多活模式。
[0004]目前分布式云灾备大多是传统的主备模式和双多活模式,主备模式投入大、使用率低、投资效益比不高;双多活模式虽然解决了“闲置”问题,但对系统建设和运营管理都提出了极高的要求,也只被少数企业所采用。无论采用哪种技术方案,都对技术实施和运维管理有着较高的要求,这在一定程度上限制了灾备系统建设的推广和普及。
技术实现思路
[0005]针对上述问题中存在的不足之处,本专利技术提供一种分布式云灾备的方法及系统。
[0006]为实现上述目的,本专利技术提供一种分布式云灾备的方法,包括:
[0007]将集群注册至灾备系统中,并设置每个所述集群的优先级;
[0008]基于所述集群的优先级,应用调度到优先级高的所述集群中,优先级低的所述集群为备份集群;
[0009]所述应用在运行过程中将增量数据备份到所述备份集群中;
[0010]监测每个所述集群状态;
[0011]当监测到所述应用运行所在的所述集群出现异常时,将所述应用在所述备份集群中运行。
[0012]优选的是,还包括当监测出现异常的所述集群恢复正常时,将所述备份集群中的增量数据备份至恢复正常的所述集群中,并重新在所述集群中运行。
[0013]优选的是,所述灾备系统具有一外部访问接口,外部访问流量通过所述接口能到达当前所述集群和所述备份集群。
[0014]优选的是,监测每个所述集群状态;当监测到所述应用运行所在的所述集群出现异常时包括:
[0015]监测每个所述集群状态并将所述集群状态以及所述应用运行状态发送至所述灾备系统,若超过预先设置的时间阈值未上报状态,则判断为异常。
[0016]优选的是,将所述应用在所述备份集群中运行包括:
[0017]外部访问流通通过接口到达所述备份集群,所述应用在所述备份集群中运行。
[0018]本专利技术还包括一种分布式云灾备的系统,包括:
[0019]注册模块,用于将集群注册至灾备系统中,并设置每个所述集群的优先级;
[0020]设置模块,用于基于所述集群的优先级,应用调度到优先级高的所述集群中,优先级低的所述集群为备份集群;
[0021]备份模块,用于所述应用在运行过程中将增量数据备份到所述备份集群中;
[0022]监测模块,用于监测每个所述集群状态;
[0023]切换模块,用于当监测到所述应用运行所在的所述集群出现异常时,将所述应用在所述备份集群中运行。
[0024]优选的是,还包括当监测出现异常的所述集群恢复正常时,将所述备份集群中的增量数据备份至恢复正常的所述集群中,并重新在所述集群中运行。
[0025]优选的是,所述灾备系统具有一外部访问接口,外部访问流量通过所述接口能到达当前所述集群和所述备份集群。
[0026]优选的是,监测每个所述集群状态;当监测到所述应用运行所在的所述集群出现异常时包括:
[0027]监测每个所述集群状态并将所述集群状态以及所述应用运行状态发送至所述灾备系统,若超过预先设置的时间阈值未上报状态,则判断为异常。
[0028]优选的是,将所述应用在所述备份集群中运行包括:
[0029]外部访问流通通过接口到达所述备份集群,所述应用在所述备份集群中运行。
[0030]与现有技术相比,本专利技术的有益效果为:
[0031]本专利技术利用云原生的方式来进行系统的容灾备份,使应用、数据和模型等资源在当前地区云环境出现故障时,可以快速迁移到其他地区云环境中,以确保服务的可用性。
附图说明
[0032]图1是本专利技术分布式云灾备的方法流程图。
具体实施方式
[0033]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0034]参照图1,本专利技术提供一种分布式云灾备的方法,包括:
[0035]将集群注册至灾备系统中,并设置每个集群的优先级;
[0036]具体地,灾备系统判断集群是否注册成功,若成功则设置该集群的优先级以及定制容灾策略,所述容灾策略为当发现集群出现异常时,则应用进行备份;
[0037]基于集群的优先级,应用调度到优先级高的集群中,优先级低的集群为备份集群;
[0038]应用在运行过程中将增量数据备份到备份集群中;
[0039]具体地,应用首先调度到优先级高的集群中,优先级低的集群作为备份集群,外部访问流量通过接口将流量送至当前集群;在当前集群正常运行的过程中就会定时增量数据备份到备份集群中,该备份过程是可以双向进行,保证当前集群和备份集群的数据是一致的,使应用可以在集群间平滑迁移;
[0040]监测每个集群状态;当监测到应用运行所在的集群出现异常时,将应用在备份集群中运行。
[0041]具体地,在每个集群中均部署一灾备代理程序,该灾备代理程序中都有一个集群状态监控功能,该功能会实时地上报当前集群的状态以及应用运行状态到灾备系统面。如果当前集群出现故障,超过一定时间未上报状态,会被灾备系统标记为“不可调度”,进而自动执行灾备策略。灾备系统会将故障集群中的所有应用迁移到备份集群,由于备份集群中已经有了同步过来的数据,备份集群中启动的应用会保持与故障前相同的运行状态。灾备系统具有一外部访问接口,外部访问流量通过接口能到达当前集群和备份集群;当应用迁移到备份集群中后,应用的访问流量也会迁移到该备份集群中。该流量迁移过程对外界也是透明的,外界无需知道应用具体运行在哪个集群中,从而无需改变访问地址;故外部访问流通通过接口到达备份集群,应用在备份集群中运行。
[0042]本申请还包括当监测出现异常的集群恢复正常时,将备份集群中的增量数据备份至恢复正常的集群中,并重新在集群中运行。
[0043]实施例1
[0044]以集群A发生故障,向集群B进行灾备为例:
[0045]将集群A和集群B注册到灾备系统中;
[0046]灾备系统判断集群A和集群B是否健康,如果都健康,则执本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种分布式云灾备的方法,其特征在于,包括:将集群注册至灾备系统中,并设置每个所述集群的优先级;基于所述集群的优先级,应用调度到优先级高的所述集群中,优先级低的所述集群为备份集群;所述应用在运行过程中将增量数据备份到所述备份集群中;监测每个所述集群状态;当监测到所述应用运行所在的所述集群出现异常时,将所述应用在所述备份集群中运行。2.根据权利要求1所述的分布式云灾备的方法,其特征在于,还包括当监测出现异常的所述集群恢复正常时,将所述备份集群中的增量数据备份至恢复正常的所述集群中,并重新在所述集群中运行。3.根据权利要求1所述的分布式云灾备的方法,其特征在于,所述灾备系统具有一外部访问接口,外部访问流量通过所述接口能到达当前所述集群和所述备份集群。4.根据权利要求3所述的分布式云灾备的方法,其特征在于,监测每个所述集群状态;当监测到所述应用运行所在的所述集群出现异常时包括:监测每个所述集群状态并将所述集群状态以及所述应用运行状态发送至所述灾备系统,若超过预先设置的时间阈值未上报状态,则判断为异常。5.根据权利要求4所述的分布式云灾备的方法,其特征在于,将所述应用在所述备份集群中运行包括:外部访问流通通过接口到达所述备份集群,所述应用在所述备份集群中运行。6.一种分布式云灾备的系统,其特征在于,包括:注...
【专利技术属性】
技术研发人员:王翱宇,魏欢,程哲,才振功,
申请(专利权)人:杭州谐云科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。