【技术实现步骤摘要】
一种实时可用集群管理系统的设计方法
本专利技术涉及高可用集群管理
,具体涉及一种实时高可用集群管理系统的设计方法。
技术介绍
随着技术的发展,传统的通过人工方式逐一检查物理设备和业务应用的管理方式已经不再适用,其主要不足包括以下几点:业务应用和物理设备越来越多,业务应用和物理设备的组合方式也多种多样,手动记录业务应用部署情况、逐一登录到物理设备管理特定的业务系统启停的是一种低效的服务管理方式,造成了大量的时间和精力消耗。随着业务应用和物理设备的增多,软硬件故障出现的频率也线性增长。特别对由多个业务应用组成的一个大型系统,软硬件故障出现时,排查并解决问题会是一个长周期的工作,无法应付科研任务日益迫切的要求。同时软硬件故障不仅会造成业务应用无法正常工作,还有可能造成数据的永久性丢失,造成无法完全恢复的情况,无法满足真实的业务需求。高可用集群管理系统能够解决上述问题,它具有如下特点:1)支持应用与硬件解耦通过无入侵的方式,将应用与硬件解耦,在不影响业务流程的条件下,支持业务应用 ...
【技术保护点】
1.一种实时高可用集群管理系统的设计方法,其特征在于,该系统运行于计算节点和管理节点,设计为用于对计算节点上运行的用户应用进行高可用管理。/n
【技术特征摘要】
1.一种实时高可用集群管理系统的设计方法,其特征在于,该系统运行于计算节点和管理节点,设计为用于对计算节点上运行的用户应用进行高可用管理。
2.如权利要求1所述的方法,其特征在于,所述实时高可用集群管理系统设计为包括数据通信模块和应用管理模块,数据通信模块用于提供计算节点和管理节点的FC通信、千兆以太网通信数据支持,应用管理模块用于对计算节点和管理节点进行数据分发管理,还用于对计算节点和管理节点之间的交互控制进行管理。
3.如权利要求2所述的方法,其特征在于,所述数据通信模块设计为由驱动模块组成,所述驱动模块提供了FC驱动、网卡驱动以及通信协议,通过创建内存数据队列将两种通信数据进行融合存储,实现以统一的虚拟通信设备的方式对数据进行发送接收通信。
4.如权利要求3所述的方法,其特征在于,所述应用管理模块设计为包括数据同步模块、监控模块、加载模块、管理模块和人机交互模块;
所述数据同步模块设计为用于提供一种数据实时同步机制,任务系统产生的任务数据保存在本地数据库的同时,通过网络上传到管理节点,管理节点分发至计算节点,实现数据实时备份,当故障发生时,集成计算组合实时地将数据库实例和任务访问数据库的服务路由切换到备份节点;故障解除后,自动将故障恢复节点加入到可用序列中,同时将数据实时备份到故障恢复节点,最终达到数据正常不间断同步的效果,工作过程中,主应用和备应用同时运行,只有主应用能够对外发送数据,备应用不能对外发送数据;同时主、备应用都能够接收外部数据,外部数据同时发送给主、备应用;主应用能够将关键数据备份到所有计算节点,用于同步控制流程和数据;
所述监控模块设计为用于对外提供状态监控功能,该监控模块运行于各计算节点,与管理节点之间进行通信,它用于周期性地获取系统中各个计算节点的硬件资源状态、应用工作状态、模块自检信息,并将监控信息组成心跳报文周期发送给管理节点;
所述加载模块运行于各计算节点,具体采用以下设计实现:
a)启动时读取脚本配置文件信息,加载.out应用;
b)接收管理节点传输的.out应用,以进程的形式加载运行应用,根据管理节点分配的cpu核指定任务运行,将应用存储在电子盘,并将加载应用信息在配置文件里更新;
c)运行完成后向管理节点发送加载完成信息;
d)接收管理节点传输的vxworks映像文件,并存储在电子盘引导分区;
所述管理模块运行于管理节点,通过与各计算节点之间相互通信对主、备应用进行管理,并对人机交互信息进行响应;
所述人机交互模块设计为用于为用户提供计算节点管理信息显示功能。
5.如权利要求4所述的方法,其特征在于,所述监控模块具体采用如下设计实现:
a)周期性地监控计算节点上运行的各应用的状态,组成心跳报文向管理节点发送;
b)周期性监控计算节点运行硬件环境资源的在位状态以及FC、以...
【专利技术属性】
技术研发人员:詹少博,
申请(专利权)人:北京计算机技术及应用研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。