基于网络的linux集群计算节点操作系统恢复方法技术方案

技术编号:14235177 阅读:54 留言:0更新日期:2016-12-21 08:29
本发明专利技术公开了一种基于网络的linux集群计算节点操作系统恢复方法,属于高性能集群运维技术领域。本发明专利技术的基于网络的linux集群计算节点操作系统恢复方法通过配置集群管理节点的PXE网络灌装系统,提取集群计算节点的mac地址,通过集群的配置内容,修改PXE网络灌装系统的ks文件,在操作系统安装过程中即可配置好操作系统的各种服务,能一键修复操作系统,无需更改任何操作系统配置。该发明专利技术的基于网络的linux集群计算节点操作系统恢复方法能大幅度提高集群维护效率,节省人力成本,具有很好的推广应用价值。

Network based Linux cluster computing node operating system recovery method

The invention discloses a network based Linux cluster computing node operating system recovery method, which belongs to the technical field of high performance cluster operation and maintenance. The invention of the Linux Cluster Based on network computing node operating system recovery method through the PXE network configuration of cluster management node filling system, extracting the cluster computing node MAC address, configure content cluster, modify PXE network filling of the KS file system, a variety of services can be configured operating system in the operating system installation process can be a key to repair the operating system, without changing any operating system configuration. The network based Linux cluster computing node operating system recovery method can greatly improve the efficiency of cluster maintenance, save labor cost, and has good popularization and application value.

【技术实现步骤摘要】

本专利技术涉及高性能集群运维
,具体提供一种基于网络的linux集群计算节点操作系统恢复方法
技术介绍
计算机在人们的生活和工作中扮演着重要的角色,特别是近年来随着经济及社会的进一步发展,计算机的应用更加的普遍,同时,使用者对计算机的各项性能的要求也逐渐提高,特别是对计算机的计算能力要求越来越高,云计算、大数据技术飞速发展开来。大数据必然无法用单台的计算机进行处理,一台计算机的配置已经远远不能满足使用者对计算机计算能力的需求。服务器集群是很多服务器集中起来一起进行同一种服务,可以利用多个计算机进行计算从而获得很高的计算速度,能够满足使用者对计算机的计算能力的需求。服务器集群从诞生起应用范围越来越广泛,也越来越受到人们的关注。但是由于服务器集群是很多服务器集中在一起同时进行同一种服务的,故高性能服务器集群中的单个服务器进行稳定的运行才能保证服务器集群顺利完成服务,因而需要对高性能服务器集群系统的运行系统进行维护。在高性能集群系统运维过程中,安装操作系统及系统安装完成后的配置工作是一项不可或缺同时又费时费力的工作。特别是在大规模集群中,计算节点上千规模,这种配置工作更显得繁琐。一旦操作系统出现故障无法正常运行,或者硬盘出现故障,需要更换硬盘时,就需要维护人员对系统重新配置。不仅增加了维护人员的工作量,并且维护效率较低,有待进一步改进。
技术实现思路
本专利技术的技术任务是针对上述存在的问题,提供一种能大幅度提高集群维护效率,节省人力成本的基于网络的linux集群计算节点操作系统恢复方法。为实现上述目的,本专利技术提供了如下技术方案:一种基于网络的linux集群计算节点操作系统恢复方法,通过配置集群管理节点的PXE网络灌装系统,提取集群计算节点的mac地址,通过集群的配置内容,修改PXE网络灌装系统的ks文件,在操作系统安装过程中即可配置好操作系统的各种服务,能一键修复操作系统,无需更改任何操作系统配置,该linux集群计算节点操作系统恢复方法的具体步骤为:S1:集群管理节点的环境配置;S2:集群管理节点的服务配置,包括HTTP服务、TFTP服务、TFTPBOOT服务、DHCP服务和Kickstart脚本;S3:启动PXE网络灌装系统的相关服务,恢复计算节点操作系统。步骤S2中,通过配置Kickstart脚本文件,在操作系统安装过程中,自动加载设备驱动,自动配置系统服务,自动配置集群作业调度系统和集群管理软件客户端。步骤S2中,TFTPBOOT服务配置时,创建/tftpboot文件目录,把启动引导文件、启动菜单配置文件、系统引导内核文件拷入/tftpboot文件目录并配置完全。步骤S3中,有计算节点需要恢复操作系统时,在管理节点上启动HTTP服务和DHCP服务后,该计算节点在启动BIOS自检过程按F12强制从网络引导后即可自动恢复操作系统,若机器能进系统需要重新恢复,可以用ipmitool chassis bootdev pxe命令使下次系统从pxe网络启动,或者用dd if=/dev/zero of=/dev/sda bs=1M count=1000抹掉sda磁盘的分区,下次重启直接从网络引导恢复系统。作为优选,步骤S1所述集群管理节点的环境配置包括配置主机名、内网IP地址、关闭防火墙和关闭selinux。作为优选,步骤S2中DHCP服务配置时,提取所有计算节点的mac地址,实现计算节点通过DHCP服务获取一个预设的IP地址。提取所有计算节点的mac地址,并在配置文件中对应mac地址和IP地址关系,保证计算节点通过DHCP服务不是随机获取到一个IP地址,而是通过mac地址的对应,获取一个预设的IP地址。作为优选,步骤S2中通过Kickstart脚本文件配置,在操作系统安装过程中,自动设置节点主机名、IP地址、硬件驱动、服务配置、集群作业调度配置、集群管理软件配置和集群用户配置,实现操作系统安装完毕后,计算节点即恢复正常,自动加入到集群中。Kickstart脚本软件包的配置一直到%post符号结束,后面内容就是shell脚本命令,自由发挥,系统安装完毕后会执行%post后面的命令,进而进行恢复计算节点操作系统。与现有技术相比,本专利技术的基于网络的linux集群计算节点操作系统恢复方法具有以下突出的有益效果:本专利技术所述基于网络的linux集群计算节点操作系统恢复方法对计算节点的数量无限制,特别是在大规模的集群维护中,遇到计算节点操作系统问题或者硬盘问题导致需要重新部署系统时,可以实现计算节点操作系统的快速恢复,大幅度提高集群维护效率,节省人力成本。附图说明图1是本专利技术所述基于网络的linux集群计算节点操作系统恢复方法的过程示意图。具体实施方式下面将结合附图和实施例,对本专利技术的基于网络的linux集群计算节点操作系统恢复方法作进一步详细说明。实施例如图1所示,本专利技术的基于网络的linux集群计算节点操作系统恢复方法通过配置集群管理节点的PXE网络灌装系统,提取集群计算节点的mac地址,通过集群的配置内容,修改PXE网络灌装系统的ks文件,在操作系统安装过程中即可配置好操作系统的各种服务,能一键修复操作系统,无需更改任何操作系统配置。该linux集群计算节点操作系统恢复方法的具体步骤为:S1:集群管理节点的环境配置,包括配置主机名、内网IP地址、关闭防火墙和关闭selinux。S2:集群管理节点的服务配置,包括HTTP服务、TFTP服务、TFTPBOOT服务、DHCP服务和Kickstart脚本。DHCP服务配置时,提取所有计算节点的mac地址,并在配置文件中对应mac地址和IP地址关系,保证计算节点通过DHCP服务不是随机获取到一个IP地址,而是通过mac地址的对应,获取一个预设的IP地址。Kickstart脚本软件包的配置一直到%post符号结束,后面内容就是shell脚本命令,自由发挥,系统安装完毕后会执行%post后面的命令,通过配置该Kickstart脚本,在操作系统安装过程中,自动设置节点主机名、IP地址、硬件驱动、服务配置、集群作业调度配置、集群管理软件配置和集群用户配置,实现操作系统安装完毕后,计算节点即恢复正常,自动加入到集群中。S3:启动PXE网络灌装系统的相关服务,恢复计算节点操作系统。当有计算节点需要恢复操作系统时,在管理节点上启动HTTP服务和DHCP服务后,该计算节点在启动BIOS自检过程按F12强制从网络引导后即可自动恢复操作系统,若机器能进系统需要重新恢复,可以用ipmitool chassis bootdev pxe命令使下次系统从pxe网络启动,或者用dd if=/dev/zero of=/dev/sda bs=1M count=1000抹掉sda磁盘的分区,下次重启直接从网络引导恢复系统。以上所述的实施例,只是本专利技术较优选的具体实施方式,本领域的技术人员在本专利技术技术方案范围内进行的通常变化和替换都应包含在本专利技术的保护范围内。本文档来自技高网...
基于网络的linux集群计算节点操作系统恢复方法

【技术保护点】
基于网络的linux集群计算节点操作系统恢复方法,其特征在于:通过配置集群管理节点的PXE网络灌装系统,提取集群计算节点的mac地址,通过集群的配置内容,修改PXE网络灌装系统的ks文件,在操作系统安装过程中即可配置好操作系统的各种服务,能一键修复操作系统,无需更改任何操作系统配置,该linux集群计算节点操作系统恢复方法的具体步骤为:S1:集群管理节点的环境配置;S2:集群管理节点的服务配置,包括HTTP服务、TFTP服务、TFTPBOOT服务、DHCP服务和Kickstart脚本;S3:启动PXE网络灌装系统的相关服务,恢复计算节点操作系统。

【技术特征摘要】
1.基于网络的linux集群计算节点操作系统恢复方法,其特征在于:通过配置集群管理节点的PXE网络灌装系统,提取集群计算节点的mac地址,通过集群的配置内容,修改PXE网络灌装系统的ks文件,在操作系统安装过程中即可配置好操作系统的各种服务,能一键修复操作系统,无需更改任何操作系统配置,该linux集群计算节点操作系统恢复方法的具体步骤为:S1:集群管理节点的环境配置;S2:集群管理节点的服务配置,包括HTTP服务、TFTP服务、TFTPBOOT服务、DHCP服务和Kickstart脚本;S3:启动PXE网络灌装系统的相关服务,恢复计算节点操作系统。2.根据权利要求1所述的基于网络的linux集群计算节点操作系统恢复方法...

【专利技术属性】
技术研发人员:孙玉超
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1