一种中央处理器CPU热移除、热添加方法及装置制造方法及图纸

技术编号:13365326 阅读:367 留言:0更新日期:2016-07-18 19:23
本发明专利技术实施例涉及中央处理器CPU热移除、热添加方法及装置。该方法适用于具有非全互联的第一CPU拓扑的服务器,包括:控制器确定多个CPU中的第一CPU,其中,该第一CPU为有故障或根据第一指示信息需要移除的CPU,该第一指示信息来自所述第一CPU拓扑或用户接口。控制器确定多个CPU中与第一CPU符合预设条件的至少一个第二CPU。控制器向第一CPU拓扑发送第二指示信息,第一CPU拓扑接收到第二指示信息后,移除第一CPU以及至少一个第二CPU,得到第二CPU拓扑,并运行所述第二CPU拓扑。通过本发明专利技术实施例可以实现CPU的在线移除,且在CPU移除过程中以及移除后,系统能够正常的工作,提升了用户体验。

【技术实现步骤摘要】

本专利技术涉及多CPU互联技术,尤其涉及一种中央处理器CPU热移除、热添加方法及装置
技术介绍
随着IT(InternetTechnology,互联网技术)技术的迅猛发展,各类IT系统中的数据量越来越大,例如现在一些应用于企业关键业务的服务器,由于这些业务处于企业应用中的核心地位,这就决定了它处理的数据和信息都是用户核心的商业数据和信息,而且通常都是海量的。从目前一些关键业务领域最常见的三大类应用:在线交易、商业分析和数据库来看,即使应用于一家普通企业,其所处理的数据量可能也十分惊人,就更不用说它们在银行、电信、证券等行业运行时,动辄就要面对TB或PB级的数据量了。如此规模的数据量,又关系到商业用户的生产、运营和决策效率,势必要求其承载平台要有非常出色的高性能处理能力,而且随着HANA(High-PerformanceAnalyticAppliance,分析软件)等大规模内存数据库应用的兴起,对单台服务器系统的内存容量也提出了很高的要求,因此需要在单台服务器中集成更多的CPU(CentralProcessingUnit,中央处理器),更多的内存以达到业务运行所需的高性能,大容量的要求。由此,衍生出了多CPU互联技术,即通过CPU之间高速互联通道(如QPI(QuickPathInterconnect,快速通道互联)快速互联通道等)将多个CPU相互连接,使得多颗物理CPU可以通过这些高速互联通道相互连接形成一个资源共享的服务器系统,但多CPU的互联在增强单台服务器处理性能的同时,也带来了一些额外的风险,因为这种多CPU互联的系统中只要有任意一个CPU发生故障,都可能会导致整个系统挂死,如需修复CPU故障则必须对整个服务器系统下电,然后更换CPU,而这种下电更换的操作必然会造成系统业务中断,严重影响系统的连续服务时间。
技术实现思路
本专利技术实施例提供了一种中央处理器CPU热移除、热添加方法及装置,可以实现在不下电的情况下实现对CPU的更换,且系统能够正常的工作,提升了用户体验。一方面,本申请的实施例提供了一种中央处理器CPU热移除方法。该方法适用于具有非全互联的第一CPU拓扑的服务器,该服务器包括控制器,其中,当前运行的第一CPU拓扑包括多个CPU,该方法可以包括:控制器确定多个CPU中的第一CPU,其中,该第一CPU为有故障或根据第一指示信息需要移除的CPU,该第一指示信息来自所述第一CPU拓扑或用户接口。控制器确定多个CPU中与第一CPU符合预设条件的至少一个第二CPU。控制器向第一CPU拓扑发送第二指示信息,第一CPU拓扑接收到第二指示信息后,移除第一CPU以及至少一个第二CPU,得到第二CPU拓扑,并运行所述第二CPU拓扑。通过本专利技术实施例可以实现CPU的在线移除,且在CPU移除过程中以及移除后,系统能够正常的工作,提升了用户体验。在一个可能的设计中,上述第一CPU拓扑的多个CPU之间可以通过中间节点的连接,其中,该中间节点包括CPU和/或外部节点控制器XNC。通过本发明实施例可以实现对通过中间节点连接的CPU拓扑中的CPU进行在线移除,且系统能够正常的工作,提升了用户体验。在一个可能的设计中,上述控制器确定多个CPU中与第一CPU符合预设条件的至少一个第二CPU,可以包括:服务器中每个CPU可以有至少一个备份CPU,控制器可以确定第一CPU的至少一个备份第二CPU。其中,至少一个备份第二CPU在第一CPU拓扑中,通过本专利技术可以实现,在CPU移除时,可以将需要移除的CPU以及备份的CPU一起移除,使得移除后的CPU依然是一个稳定的拓扑,保证了在系统能够正常的运行的情况下,对CPU进行移除操作,提高了用户体验。在一个可能的设计中,上述控制器确定多个CPU中与第一CPU符合预设条件的至少一个第二CPU,可以包括:控制器确定第一CPU在第一CPU拓扑上的位置,以及在第一CPU拓扑中,与第一CPU处于至少一个对称位置(例如,可以是中心对称或者轴对称等等)上的第二CPU,或者与第一CPU处于至少一个对称位置上,且直接连接的任意一个第二CPU。通过本专利技术实施例可以实现,移除CPU和处于对称位置的全部或者任意一个CPU后,能够得到一个稳定的拓扑结构,保证系统能够正常工作,提升了用户体验。在一个可能的设计中,每个CPU都可以具有多个端口,上述多个CPU之间通过端口连接,其中,上述控制器确定多个CPU中与第一CPU符合预设条件的至少一个第二CPU,具体可以包括,控制器确定与第一CPU通过相同的端口号的端口相互连接的至少一个第二CPU(例如,一个CPU有三个端口,端口号分别为,0,1,2。如果两个CPU都通过端口2相连,那么在其中一个CPU需要移除时,另一个CPU也需要一并移除)。通过本专利技术实施例可以实现,通过端口的方式确定需要同时移除的CPU,得到一个稳定的CPU拓扑,保证系统能够正常工作,提升了用户体验。在一个可能的设计中,上述第一CPU拓扑包括多个CPU组,其中,该多个CPU组的信息可以预存在服务器中,上述控制器确定多个CPU中与第一CPU符合预设条件的至少一个第二CPU,可以包括:控制器确定与第一CPU属于同一CPU组的至少一个第二CPU。通过本专利技术实施例可以实现,通过以组的形式,对CPU进行移除,可以得到一个稳定的CPU拓扑,保证系统能够正常工作,提升了用户体验。在一个可能的设计中,上述第一CPU拓扑在接收到上述第二指示信息后,将第一CPU以及至少一个第二CPU中的资源回收,断开第一CPU和至少一个第二CPU与第二CPU拓扑中的CPU的连接,还可以调整第二CPU拓扑中的CPU的设置,使得移除第一CPU以及至少一个第二CPU后,能够以稳定的第四CPU拓扑的形式进行工作。通过本专利技术实施例可以实现,移除CPU后的CPU拓扑能够正常的工作,提高了用户体验。另一方面,本申请的实施例提供了一种中央处理器CPU热添加方法。该方法适用于具有非全互联的第三CPU拓扑的服务器,该服务器包括控制器,该方法可以包括,控制器确定第一指示信息,其中,第一指示信息用于指示添加第三CPU,另外,第三CPU不在当前运行的第三CPU拓扑中。控制器确定与第三CPU符合预设条件的至少一个第四CPU是否已经安装,若是,控制器向第三CPU拓扑发送第二指示信息。第三CPU拓扑在接收到第二指示信息后,添加第三CPU以及所述第四CPU,得到第四CPU拓扑,并运行第四CPU本文档来自技高网
...

【技术保护点】
一种中央处理器CPU热移除方法,其特征在于,所述方法适用于具有非全互联的第一CPU拓扑的服务器,所述服务器包括控制器,当前运行的第一CPU拓扑包括多个CPU,所述方法包括:所述控制器确定所述多个CPU中的第一CPU,所述第一CPU为有故障或根据第一指示信息需要移除的CPU,所述第一指示信息来自所述第一CPU拓扑或用户接口;所述控制器确定所述多个CPU中与所述第一CPU符合预设条件的至少一个第二CPU;所述控制器向所述第一CPU拓扑发送第二指示信息,所述第二指示信息用于指示移除所述第一CPU以及所述至少一个第二CPU,得到第二CPU拓扑,并运行所述第二CPU拓扑。

【技术特征摘要】
1.一种中央处理器CPU热移除方法,其特征在于,所述方法适用于具有非全互联的第一CPU拓扑的服务器,所述服务器包括控制器,当前运行的第一CPU拓扑包括多个CPU,所述方法包括:
所述控制器确定所述多个CPU中的第一CPU,所述第一CPU为有故障或根据第一指示信息需要移除的CPU,所述第一指示信息来自所述第一CPU拓扑或用户接口;
所述控制器确定所述多个CPU中与所述第一CPU符合预设条件的至少一个第二CPU;
所述控制器向所述第一CPU拓扑发送第二指示信息,所述第二指示信息用于指示移除所述第一CPU以及所述至少一个第二CPU,得到第二CPU拓扑,并运行所述第二CPU拓扑。
2.根据权利要求1所述的方法,其特征在于,所述控制器确定所述多个CPU中与所述第一CPU符合预设条件的至少一个第二CPU,包括:
所述控制器确定所述第一CPU的至少一个备份第二CPU。
3.根据权利要求2所述的方法,其特征在于,所述第一CPU拓扑包括多个CPU组,多个CPU组的信息预存在所述服务器中,所述控制器确定所述第一CPU的至少一个备份第二CPU包括:
所述控制器确定与所述第一CPU属于同一CPU组的至少一个第二CPU。
4.根据权利要求1所述的方法,其特征在于,每个CPU具有多个端口,所述多个CPU之间通过端口连接,所述控制器确定所述多个CPU中与所述第一CPU符合预设条件的至少一个第二CPU,包括:
所述控制器确定与所述第一CPU通过相同的端口号的端口相互连接的至少一个第二CPU。
5.根据权利要求1所述的方法,其特征在于,所述第二指示信息用于指示移除所述第一CPU以及所述至少一个第二CPU包括:
所述第二指示信息用于指示所述第一CPU拓扑,将所述第一CPU以及所述至少一个第二CPU中的资源回收,断开所述第一CPU以及所述至少一个第二CPU与所述第二CPU拓扑中的CPU的连接。
6.一种中央处理器CPU热添加方法,其特征在于,所述方法适用于具有非全互联的第三CPU拓扑的服务器,所述服务器包括控制器,所述方法包括:
所述控制器确定第一指示信息,所述第一指示信息用于指示添加第三CPU,其中,所述第三CPU不在当前运行的第三CPU拓扑中;
所述控制器确定与第三CPU符合预设条件的至少一个第四CPU是否已经安装;
若是,所述控制器向所述第三CPU拓扑发送第二指示信息,所述第二指示信息用于指示添加所述第三CPU以及所述至少一个第四CPU,得到第四CPU拓扑,并运行所述第四CPU拓扑。
7.根据权利要求6所述的方法,其特征在于,所述控制器确定第一指示信息包括:
所述控制器通过用户接口接收所述第三指示信息,所述第三指示信息包括第三CPU的标识;
或者,
所述控制器通过感应器接收安装所述第三CPU触发的第四指示信息;根据所述第四指示信息,确定已安装的所述第三CPU。
8.根据权利要求6或7所述的方法,其特征在于,所述控制器确定与第三CPU符合预设条件的至少一个第四CPU是否已经安装,包括:
所述控制器确定所述第三CPU的至少一个备份第二CPU是否已经安装。
9.根据权利要求8所述的方法,其特征在于,所述第四CPU拓扑包括多个CPU组,多个CPU组的信息预存在所述服务器中,所述控制器确定与第三CPU符合预设条件的至少一个第四CPU是否已经安装,包括:
所述控制器确定与所述第三CPU属于同一CPU组的至少一个第四CPU是否已经安装。
10.根据权利要求6或7所述的方法,其特征在于,所述第二指示信息用于指示添加所述第三CPU以及所述第四CPU包括:
所述第二指示信息用于指示,为所述第三CPU以及所述至少一个第四CPU分配资源,建立所述第三C...

【专利技术属性】
技术研发人员:张飞廖德甫马樟平
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1