服务器的控制方法和服务器的控制设备技术

技术编号:13105656 阅读:81 留言:0更新日期:2016-03-31 11:54
本发明专利技术实施例提供一种通过服务器的控制方法和服务器的控制设备,以解决现有技术中因服务器启动异常导致业务中断的问题。本发明专利技术实施例的控制方法和服务器的控制设备,在服务器因主用CPU、与主用CPU连接的PCH或与主用CPU连接的PCH相连的Flash异常导致服务器启动异常时,主用CPU被重新配置。实现了支持硬分区的服务器中出现启动异常时,仍然能够确保服务器正常启动和运行,提高了服务器的可靠性和稳定性;使得整个服务器的RAS得到提升;同时解决了FLASH异常导致系统不能运行的问题,可以不再使用原有的BIOS设计方式,节省了服务器的FLASH芯片成本。

【技术实现步骤摘要】

本专利技术涉及信息
,尤其涉及一种服务器的控制方法和服务器的控制设备
技术介绍
服务器是网络环境中的高性能计算机,能够侦听网络上的其他计算机(客户机)提交的服务请求,并提供相应的服务。按照体系架构来区分,服务器主要分为两类:非X86服务器和X86服务器。X86服务器又称复杂指令集架构服务器,即通常所讲的PC服务器,它是基于PC机体系结构,使用Intel或其它兼容x86指令集的处理器芯片的服务器。随着信息化技术的进一步发展,服务器在日常的IT(Informat1n Technical,信息技术)应用中变得越来越重要。在服务器上承载的业务也越来越多。由于服务器的异常或者宕机,往往会给客户带来非常大的损失。因此,不管是在通用的服务器上,还是在关键应用服务器上,服务器的RAS(Reliability,Availability and Serviceability,可靠性、可用性和可服务性)特性都变得越来越重要。所谓的RAS,即所谓的可靠性、可用性、可服务性,是服务器的重要指标。如何实现服务器具有很高的RAS特性,同时又具有较好的性价比,是服务器开发当中重点关注的。特别是对于中高端服务器,完整的RAS特性是衡量一台服务器是否高端的主要指标。在通常的中高端X86服务器或者更高端的小型机中,一般都会要求服务器能够支持硬分区。所谓的硬分区,就是将一个服务器分隔为几个完全独立的子服务器。这些子服务器是一个完整的服务器系统,它们拥有自己的B10S(Basic Input Output System,基本输入输出系统)和操作系统,与通常所说的单台服务器类似。例如,一个8路的X86服务器硬分区成2个4路服务器,或者是4个2路服务器,这种通过硬分区分隔出来的服务器是可以独立运行、独立上电、独立下电、独立管理。一般的X86服务器主要有CPU(Central Processing Unit,中央处理器)、PCH(Platform Controller Hub,平台控制器集线器)、内存、硬盘、插卡等多个部件组成。对于支持硬分区功能的X86服务器,需要配置多个PCH芯片,一般来说是系统支持几个硬分区就需要配置多个PCH芯片。如图1(a)所示是一个8路服务器的系统框架,图1(b)是一个8路服务器硬分区成2个4路服务器的系统框架。在图1(a)中,是8P独立模式,与CPU1相连的PCH为主用PCH,与其他处理器相连的PCH为从PCH。从PCH有两种工作模式,第一种是该PCH被禁止,对外不能提供任何功能,第二种是该PCH处于部分功能可用状态,比如该PCH上的USB、SATA功能还是可用的,但不能参与整个服务器的管理功能。在图1 (b)中,是8P分区模式,上面4个CPU及PCH组成一个独立的系统,下面4个CPU及PCH组成一个独立的系统,两个系统之间的QPI(Quick Path Interconnect,快速路径互联)连接被断开,彼此之间没有任务的交互。在现有技术中,系统的RAS存在着较大的缺点:当服务器未进行分区时,如果CPU1所连的主用PCH异常(例如芯片损坏),或主用PCH所连的FLASH出现异常(例如芯片损坏,FLASH所在的B1S被异常擦除),整个服务器就处于宕机状态。此时运行在该服务器上的业务将被中断。
技术实现思路
本专利技术实施例提供一种服务器的控制方法和服务器的控制设备,实现在服务器启动异常时,保证业务的正常运行。本专利技术实施例提供了一种服务器中的控制设备,所述服务器包括至少两个中央处理器CPU和至少两个平台控制集线器PCH,每个所述PCH与至少一个所述CPU相连,所述控制设备包括:配置单元,用于配置所述CPU的标号,并将其中一个CPU标记为主用CPU;在所述服务器启动异常时,将与正常PCH连接的CPU配置为主用CPU,所述服务器启动异常包括与主用CHJ连接的PCH或与主用CPU连接的PCH相连的Flash异常导致的基本输入输出系统B1S启动异常;重启单元,用于在所述服务器启动异常时,触发所述服务器重新启动,并触发所述配置单元将与正常PCH连接的CPU配置为主用CPU。作为一种可选的实现方式,所述配置单元包括:管脚配置单元,用于配置所述至少两个CPU的管脚,通过配置所述管脚的值将其中一个CPU配置为主用CPU;信息接收单元,用于接收所述重启单元发送的所述服务器启动异常的信息,触发所述管脚配置单元将与正常PCH连接的一个CPU配置为主用CPU。作为一种可选的实现方式,所述重启单元包括:判断单元,用于判断在预设时间内所述服务器是否启动异常;触发单元,用于在所述判断单元判断所述服务器启动异常时,触发所述服务器重新启动,并触发所述配置单元将与正常PCH连接的一个CPU配置为主用CPU。作为一种可选的实现方式,所述触发单元包括:第一触发单元,用于在所述服务器启动异常时,通过所述B1S预先设置的寄存器触发所述服务器重新启动;第二触发单元,用于在所述服务器重新启动过程中,判断是否存在导致所述服务器启动异常的异常信息,在存在所述异常信息时,触发所述配置单元将与正常PCH连接的一个CPU配置为主用CPU,所述异常信息是在所述服务器重启前由所述B1S触发记录的信息。作为一种可选的实现方式,所述服务器是支持硬分区功能的服务器,所述服务器中的CPU的管脚连接到所述控制设备中。作为一种可选的实现方式,所述控制设备在所述服务器的复杂可编程逻辑器件CPLD或现场可编程门阵列FPGA中实现。本专利技术实施例还提供了一种服务器控制方法,所述方法应用于服务器中,所述服务器包括至少两个中央处理器CPU和至少两个平台控制集线器PCH,每个所述PCH与至少一个所述CPU相连,所述方法包括:配置所述CPU的标号,并将其中一个CPU标记为主用CPU;判断所述服务器是否启动异常,如果启动异常则记录异常信息,并触发所述服务器重新启动;所述异常信息包括与主用CPU连接的PCH或与主用CPU连接的PCH相连的F1 a sh异常导致的基本输入输出系统B1S启动异常;在所述服务器重新启动过程中,根据所述记录的异常信息,将与正常PCH连接的CHJ配置为主用CPU。作为一种可选的实现方式,所述配置CPU的标号具体是配置所述CPU的管脚,所述将其中一个CHJ标记为主用CPU,是通过配置所述管脚的值将其中一个CPU配置为主用CPU。作为一种可选的实现方式,判断所述服务器是否启动异常包括:设定定时器,所述定时器的时长小于所述服务器看门狗的定时器时长;在所述服务器启动过程中,如果在所述定时器设定时间内所述看门狗未被禁止,则判定所述服务器启动异常。作为一种可选的实现方式,所述方法是由复杂可编程逻辑器件CPLD或现场可编程门阵列FPGA实现。作为一种可选的实现方式,所述触发服务器重新启动是通过设置在所述CPLD或所述FPGA中的重启寄存器触发所述服务器重新启动。作为一种可选的实现方式,服务器是支持硬分区功当前第1页1 2 3 4 本文档来自技高网
...

【技术保护点】
一种服务器中的控制设备,所述服务器包括至少两个中央处理器CPU和至少两个平台控制集线器PCH,每个所述PCH与至少一个所述CPU相连,其特征在于,所述控制设备包括:配置单元,用于配置所述CPU的标号,并将其中一个CPU标记为主用CPU;在所述服务器启动异常时,将与正常PCH连接的CPU配置为主用CPU,所述服务器启动异常包括与主用CPU连接的PCH或与主用CPU连接的PCH相连的Flash异常导致的基本输入输出系统BIOS启动异常;重启单元,用于在所述服务器启动异常时,触发所述服务器重新启动,并触发所述配置单元将与正常PCH连接的CPU配置为主用CPU。

【技术特征摘要】

【专利技术属性】
技术研发人员:郑根强张迪煊
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1