用于服务器的控制处理器单元重启的方法、装置及服务器制造方法及图纸

技术编号:14646996 阅读:65 留言:0更新日期:2017-02-16 03:52
本发明专利技术公开了一种用于服务器的控制处理器单元重启的方法,其特征在于,服务器包括至少两个处理器单元构成的处理器集群,每一处理器单元独立供电,该方法包括:检测每一处理器单元的工作状态是否存在异常,如是,则:检测出处理器集群中的异常处理器单元及与每一异常处理器单元对应的正常处理器单元;发送指令至任一正常处理器单元、以使该正常处理器单元控制对应的异常处理器单元重启。这样,通过操作正常处理器控制异常处理器断电重启,以便使异常处理器恢复正常工作,能够大幅度提高多处理器的服务器的可用性。

【技术实现步骤摘要】

本专利技术涉及电路控制
,更具体地,本专利技术涉及一种控制服务器内处理器断电重启的方法、装置及服务器。
技术介绍
服务器要求能够长时间无人值守工作,但是因为电磁干扰或者软件设计存在Bug等问题,工作一段时间后每一个处理器都存在宕机可能性。针对这种情况,一般通过看门狗(Watchdog)来提高系统的可用性;在系统没有按照预定的流程执行时,看门狗会超时,重启系统以恢复到正常状态。但是因为软硬件设计不可能做到完美,该方法并不总是奏效,在很多情况下存在无法重启或者重启无效的情况,比如由于软件设计缺陷,看门狗没有起到应有的作用;或者系统已经异常了,由于喂狗位置设置不合理,仍然有例程在继续喂狗;或者还没启动看门狗,系统就进入了一个死锁状态等。可也能由于硬件设计缺陷,重启反而让系统进入不可预测的状态;某些存储芯片必须要1ms以上的断电时间才能够进入启动模式。还可能由于存在残留的状态,即便重启也无法恢复,必须断电才能让系统恢复到正常状态。
技术实现思路
本专利技术的一个目的是提供一种用于服务器的控制处理器单元重启的新技术方案。根据本专利技术的第一方面,提供了一种用于服务器的控制处理器单元重启的方法,所述服务器包括至少两个处理器单元构成的处理器集群,每一所述处理器单元独立供电,所述方法包括:检测每一处理器单元的工作状态是否存在异常,如是,则:检测出所述处理器集群中的异常处理器单元及与每一所述异常处理器单元对应的正常处理器单元;发送指令至任一所述正常处理器单元、以使所述任一所述正常处理器单元控制对应的异常处理器单元重启。可选的是,与所述异常处理器单元对应的正常处理器单元具体为能够控制所述异常处理器单元断电重启的正常处理器单元。可选的是,所述发送指令至所述正常处理器单元、以使所述正常处理器单元控制所述异常处理器单元断电重启具体为:发送指令至任一所述正常处理器单元、以使所述任一所述正常处理器单元输出断电信号;根据所述断电信号输出重启信号至所述异常处理器单元、以使所述异常处理器单元断电重启。根据本专利技术的第二方面,提供了一种用于服务器的控制处理器单元重启的装置,所述服务器包括至少两个处理器构成的处理器集群,每一所述处理器独立供电,所述装置包括:异常检测模块,用于检测每一处理器单元的工作状态是否存在异常;处理器单元检测模块,用于在所述异常检测模块的检测结果为是的情况下,检测出所述处理器集群中的异常处理器单元及与每一所述异常处理器单元对应的正常处理器单元;指令发送模块,用于发送指令至任一所述正常处理器单元、以使所述任一所述正常处理器单元控制对应的异常处理器重启。可选的是,与所述异常处理器单元对应的正常处理器单元具体为能够控制所述异常处理器单元断电重启的正常处理器单元。可选的是,所述指令发送模块还包括:指令发送单元,用于发送指令至任一所述正常处理器单元、以使所述任一所述正常处理器单元输出断电信号;在重启信号输出单元,用于根据所述断电信号输出重启信号至所述异常处理器单元、以使所述异常处理器单元断电重启。根据本专利技术的第三方面,提供了一种服务器,包括处理器和存储器,其中,所述存储器用于存储指令,所述指令用于控制所述处理器进行操作以执行根据本专利技术第一方面所述的方法。根据本专利技术的第四方面,提供了一种服务器,包括:本专利技术第二方面所述的装置;至少两个处理器单元构成的处理器集群,且每一所述处理器独立供电。可选的是,每一所述处理器单元的电源使能端均连接至所述服务器的电源总线上,所述指令发送模块具体用于发送指令至任一所述正常处理器单元、以使所述任一所述正常处理器单元通过所述电源总线控制对应的异常处理器重启。可选的是,所述处理器单元至少包括ARM处理器单元或者CPU单元。本专利技术的专利技术人发现,在现有技术中,存在处理器无法重启或者重启无效的问题。在本专利技术的实施例中,通过操作正常处理器控制异常处理器断电重启,以便使异常处理器恢复正常工作,能够大幅度提高多处理器的服务器的可用性。因此,本专利技术所要实现的技术任务或者所要解决的技术问题是本领域技术人员从未想到的或者没有预期到的,故本专利技术是一种新的技术方案。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实施例,并且连同其说明一起用于解释本专利技术的原理。图1是现有多处理器架构服务器的一种实施结构的示意图;图2是根据本专利技术一种用于服务器的控制处理器单元重启的方法的一种实施方式的流程图;图3是根据本专利技术处理器单元与电源总线之间一种连接结构的电路原理图;图4是根据本专利技术一种多处理器架构服务器的一种实施结构的方框原理图;图5是根据本专利技术一种用于服务器的控制处理器单元重启的装置的一种实施结构的方框原理图。具体实施方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。现有的多处理器架构服务器,如图1所示,该服务器包括至少两个处理器构成的处理器集群,每个处理器之间相互独立,并且电源可独立控制,具体的是,每个处理器都具有电源使能端,该电源使能端均连到电源控制总线上,可以通过向该电源使能端发送使能信号以控制相应处理器的供电。为了解决现有技术中存在多处理器架构服务器中的处理器无法重启或者重启无效的问题,提供了一种用于服务器的控制处理器单元重启的方法,通过操作正常处理器控制异常处理器断电重启,以便使异常处理器恢复正常工作,能够大幅度提高多处理器的服务器的可用性。图2是根据本专利技术一种用于服务器的控制处理器单元重启的方法的一种实施方式的流程图。根据图2所示,该方法包括以下步骤:步骤S201,检测所有处理器单元的工作状态是否存在异常,如是,则执行步骤S202,如否,则继续执行步骤S201。进一步地,由于所有的处理器单元实时发送各自的工作状态,可以通过检测接收到的工作状态是否完整来检测是否存在工作状态存在异常的处理器单元。下面以一多ARM集群服务器为例进行说明,例如该服务器在一个标准3U机箱内集成了80个ARM处理器单元,这80个ARM处理器单元组成一个集群,对外提供编解码服务。服务器采用插卡背板的设计模式,每一个ARM处理器单元都是一块类似于内存的卡片(本领域技术人员也将其称为业务卡),这些卡片通过金手指连接到背板总线上,金手指上有以太网信号、状态信号、控制信号等。以太网信号汇聚到4块交换芯片上,以4个上行千兆口对外输出;如果80个ARM处理器单元的以太网不经过汇聚直接输出,将有80个网口,对于布线都是一个挑战。每一个ARM处理器单元通过网络,以心跳的方式向中心服务器本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201610839308.html" title="用于服务器的控制处理器单元重启的方法、装置及服务器原文来自X技术">用于服务器的控制处理器单元重启的方法、装置及服务器</a>

【技术保护点】
一种用于服务器的控制处理器单元重启的方法,其特征在于,所述服务器包括至少两个处理器单元构成的处理器集群,每一所述处理器单元独立供电,所述方法包括:检测每一处理器单元的工作状态是否存在异常,如是,则:检测出所述处理器集群中的异常处理器单元及与每一所述异常处理器单元对应的正常处理器单元;发送指令至任一所述正常处理器单元、以使所述任一所述正常处理器单元控制对应的异常处理器单元重启。

【技术特征摘要】
1.一种用于服务器的控制处理器单元重启的方法,其特征在于,所述服务器包括至少两个处理器单元构成的处理器集群,每一所述处理器单元独立供电,所述方法包括:检测每一处理器单元的工作状态是否存在异常,如是,则:检测出所述处理器集群中的异常处理器单元及与每一所述异常处理器单元对应的正常处理器单元;发送指令至任一所述正常处理器单元、以使所述任一所述正常处理器单元控制对应的异常处理器单元重启。2.根据权利要求1所述的方法,其特征在于,与所述异常处理器单元对应的正常处理器单元具体为能够控制所述异常处理器单元断电重启的正常处理器单元。3.根据权利要求1所述的方法,其特征在于,所述发送指令至任一所述正常处理器单元、以使所述任一所述正常处理器单元控制所述异常处理器单元断电重启具体为:发送指令至任一所述正常处理器单元、以使所述任一所述正常处理器单元输出断电信号;根据所述断电信号输出重启信号至所述异常处理器单元、以使所述异常处理器单元断电重启。4.一种用于服务器的控制处理器单元重启的装置,其特征在于,所述服务器包括至少两个处理器构成的处理器集群,每一所述处理器独立供电,所述装置包括:异常检测模块,用于检测每一处理器单元的工作状态是否存在异常;处理器单元检测模块,用于在所述异常检测模块的检测结果为是的情况下,检测出所述处理器集群中的异常处理器单元及与每一所述异常处理器单元...

【专利技术属性】
技术研发人员:范志强王路飞
申请(专利权)人:杭州龙境科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1