一种容灾系统的管理方法和装置制造方法及图纸

技术编号:31616711 阅读:16 留言:0更新日期:2021-12-29 18:50
本申请实施例提供一种容灾系统的管理方法,涉及通信领域,能够提高容灾系统管理维护的效率。其方法为:监控平台从容灾节点获取N个待同步数据的同步结果;其中,N为大于0的整数;若监控平台确定N个待同步数据中的M个待同步数据的同步结果不满足恢复目标点RPO,监控平台生成告警信息;其中,M为大于0且小于或等于N的整数。本申请实施例应用于各种需要进行数据复制的场景。复制的场景。复制的场景。

【技术实现步骤摘要】
一种容灾系统的管理方法和装置


[0001]本申请涉及互联网技术(internet Technology,IT)领域,尤其涉及一种容灾系统的管理方法和装置。

技术介绍

[0002]容灾系统用于灾难发生时接替生产系统运行。在日常运维过程中,生产系统新产生的数据要及时复制到容灾系统。如果生产数据不能及时复制到容灾系统,那么容灾系统数据将无法满足恢复目标点(recovery point object,RPO),导致容灾系统无法保证数据的安全。其中,RPO是衡量容灾数据完整性的指标,代表生产数据完整的复制到容灾系统的时间点要求。
[0003]现有技术的方案是对容灾数据复制状态做监控:通过设置定时任务执行容灾同步操作,当数据同步失败时,发送告警给管理员定位处理。
[0004]但是,直接通过同步结果状态做监控无法反映容灾系统数据是否满足各系统的RPO指标;并且告警分散,不同的同步类型监控机制不统一,从而导致容灾系统管理维护的效率低。

技术实现思路

[0005]本申请实施例提供一种容灾系统的管理方法和装置,能够提高容灾系统管理维护的效率。
[0006]第一方面,本申请实施例提供一种容灾系统的管理方法,包括:监控平台从容灾节点获取N个待同步数据的同步结果;其中,N为大于0的整数;若监控平台确定N个待同步数据中的M个待同步数据的同步结果不满足RPO,监控平台生成告警信息;其中,M为大于0且小于或等于N的整数。
[0007]相比现有技术中直接对容灾数据的复制状态做监控,无法反映容灾数据是否满足各系统的RPO指标;且告警分散,不同同步类型的容灾数据的监控机制不统一。本申请实施例中,若监控平台确定N个待同步数据中的M个待同步数据的同步结果不满足RPO,监控平台生成告警信息,即本申请实施例可以统一监控多个待同步数据(容灾数据)的同步结果,能够提高容灾系统管理维护的效率。
[0008]并且,监控平台可以判断每个待同步数据的同步结果是否满足RPO,比对容灾数据复制状态做监控,根据待同步数据的RPO指标(即待同步数据是否满足RPO)作监控能够更好的衡量待同步数据的完整性。
[0009]在一种可能的实现方式中,多个待同步数据可以采用不同的同步机制,从而可以统一监控不同的同步类型的待同步数据。
[0010]在一种可能的实现方式中,监控平台生成告警信息包括:监控平台确定告警信息的类型;监控平台生成告警信息;其中,告警信息包括告警信息的类型,告警信息的类型包括至少两个告警等级中的一个告警等级。
[0011]举例来说,告警等级可以包括普通等级和严重等级。监控平台可以根据待同步的数据对应的告警等级,选择通过短信息或电话的方式及时通知管理员对告警信息进行处理。例如,重要等级的告警信息通过电话通知,普通等级的告警信息通过短信息通知。
[0012]在一种可能的实现方式中,监控平台确定告警信息的类型包括:监控平台根据以下至少一项确定告警信息的类型:不满足RPO的待同步数据的数目、不满足RPO的待同步数据对应的应用的重要程度和待同步数据不满足RPO的次数。
[0013]其中,不满足RPO的待同步数据的数目和待同步数据不满足RPO的次数可以反映容灾系统的同步异常的影响范围,不满足RPO的待同步数据对应的应用的重要程度可以反映容灾系统重要性,即监控平台可以根据同步异常的影响范围和容灾系统重要性制定监控告警规则(例如确定告警信息的类型),能够更好的保障容灾系统运行的稳定性。
[0014]在一种可能的实现方式中,该方法还包括:监控平台获取配置清单,配置清单包括容灾节点和容灾节点对应的生产节点的待检查的参数;监控平台根据配置清单获取配置信息,配置信息包括待检查的参数的取值;监控平台根据配置清单和配置信息生成检查报告,检查报告用于指示容灾节点和生产节点的配置是否一致。
[0015]基于该方案,监控平台以配置清单的格式维护容灾节点和容灾节点对应的生产节点的待检查的参数,通过对配置清单和配置信息做较对确定容灾节点和生产节点的配置是否一致。可以避免管理员人工维护容灾节点和生产节点的配置时,由于管理员的疏漏产生的容灾节点和生产节点的配置不一致的问题。
[0016]需要说明的是,监控平台可以获取不同平台、不同中间件对应的待同步数据的同步结果,以及对应不同平台、不同中间件的容灾节点和生产节点的待检查的参数,即监控平台可以兼容不同平台(如Linux、Unix、Windows)、不同中间件(如Oracle、SqlServer、WAS、Mongodb)等各种监控场景,适用性强。
[0017]并且,监控平台进行管理维护时,例如调整待同步数据的RPO值时,或者调整告警级别时,或者调整配置清单中的相关参数时,可以直接修改监控平台上相关的配置项值,相较通过管理员分别对各个容灾节点和生产节点进行人工维护,本申请实施例提供的方案在管理维护时更加方便。
[0018]基于上述方法,一方面通过对多个待同步数据的同步结果统一监控,可以保证待同步数据的有效性;另一方面通过配置清单的格式维护容灾节点和生产节点的待检查的参数,保证了容灾系统在灾难场景下的有效性。
[0019]在一种可能的实现方式中,配置清单还包括映射关系清单和检查规则清单和白名单清单中的至少一个;其中,映射关系清单包括生产节点和容灾节点的映射关系;检查规则清单包括待检查的参数对应的检查规则;白名单清单用于指示生产节点和/或容灾节点的可忽略的参数。基于映射关系清单,在新上线或下线主机(主机可以是指生产节点或容灾节点)时,直接修改映射关系清单即可,使容灾节点和生产节点间的映射关系更容易维护。基于检查规则清单,可以确定检查项对应的检查规则,也可以直接修改检查规则清单中检查项对应的检查规则,使检查项和检查规则之间的对应关系更易维护。基于白名单清单,可以不校对生产节点和容灾节点之间无需保持一致的参数,能够减少不必要的校对以节约运行资源。
[0020]第二方面,本申请实施例提供一种容灾系统的配置方法,包括:监控平台获取配置
清单,配置清单包括容灾节点和容灾节点对应的生产节点的待检查的参数;监控平台根据配置清单获取配置信息,配置信息包括待检查的参数的取值;监控平台根据配置清单和配置信息生成检查报告,检查报告用于指示容灾节点和生产节点的配置是否一致。
[0021]现有的容灾配置过程中,并未对容灾系统的配置和生产系统的配置做较对,而是依赖管理员在生产系统做变更时,对容灾系统也做相应操作。如果管理员没有同步实施容灾系统的变更,就会导致容灾系统与生产系统不一致。如图1所示的现有技术的容灾配置方案,当生产系统的相关配置变更后,各个管理员对相应的容灾系统也进行相应的操作(如打补丁、配置参数修改等)。其中,生产节点1对应容灾节点1,生产节点2对应容灾节点2。由于人工管理可能会出现疏漏,例如管理员可能漏掉对容灾节点2的变更,导致了生产节点2与容灾节点2的配置不一致。
[0022]举例来说,若生产系统的CPU、内存、网络升级后(如系统硬件扩容、平台搬本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种容灾系统的管理方法,其特征在于,包括:监控平台从容灾节点获取N个待同步数据的同步结果;其中,N为大于0的整数;所述监控平台根据所述N个待同步数据的同步结果,确定所述N个待同步数据中同步结果不满足恢复目标点RPO的M个待同步数据以及所述N个待同步数据中同步结果满足恢复目标点RPO的L个待同步数据;所述M为大于0且小于N的整数,所述L为大于0且小于N的整数;所述监控平台展示所述N个待同步数据的同步统计信息,所述同步统计信息包括所述M和所述L。2.根据权利要求1所述的方法,其特征在于,所述同步统计信息还包括:所述M个待同步数据的标识,以及所述M个待同步数据的RPO值。3.根据权利要求1或2所述的方法,其特征在于,所述同步统计信息还包括:所述L个待同步数据的标识,以及所述L个待同步数据的RPO值。4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:所述监控平台确定告警信息的类型,所述告警信息的类型包括至少两个告警等级中的一个告警等级;所述监控平台生成所述告警信息;其中,所述告警信息包括所述告警信息的类型。5.根据权利要求4所述的方法,其特征在于,所述监控平台生成告警信息,包括:所述监控平台根据以下至少一项确定所述告警信息的类型:所述M的大小,所述M个待同步数据的重要程度。6.一种...

【专利技术属性】
技术研发人员:吴洪涛高显岑许腾
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1