多核系统中的监控方法、监控装置以及多核系统制造方法及图纸

技术编号:2845112 阅读:190 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种多核系统的监控方法,预先为该多核系统中的每个核设置对应的复位策略,该方法包括:对多核系统中所有核的运行状态进行监视,当出现处于异常状态的核时,确定该核对应的复位策略,并按照所确定的复位策略对需要被复位的核进行复位。本发明专利技术还公开了一种包括系统监控模块、核监控模块、控制模块和存储模块的监控装置,以及一种包括核监控模块、控制模块和存储模块的监控装置。另外,本发明专利技术又公开了一种多核系统,该系统包括核以及监控装置。本发明专利技术的上述技术方案能够在多核系统中的核出现异常的情况下,及时有效地恢复系统运行。

【技术实现步骤摘要】

本专利技术涉及监控技术,尤其涉及多核系统中的监控方法、监控装置以及多核系统
技术介绍
在计算机技术和电子技术迅猛发展的趋势下,将多个芯片集成于一个封装之内的多核技术逐渐成熟。多核系统中的每个核均可被看作为一个中央处理器(CPU),以便提高多核系统的处理效率并减少处理延迟。在多核系统中,通常采用流水线或者并行处理等工作方式来完成待处理任务。图1示出了采用流水线工作方式的多核系统示意图。参见图1,在流水线工作方式下,待处理任务被分成多个部分,每个核完成其中的一个部分。只有前面的核完成处理后,后面的核才继续执行该任务的后续部分,并在最后一个核结束处理后输出处理结果。图2示出了采用并行处理工作方式的多核系统示意图。参见图2,在并行处理工作方式下,每个核都能够独立地执行待处理任务,并输出处理结果。对于多核系统,由于所运行程序中存在的潜在错误以及恶劣环境干扰等因素会导致核出现异常而无法运行,因此为了保证该系统能够在无人干预下自动恢复正常,目前参考单核系统中采用的看门狗方式,对多核系统进行监控并执行异常情况下的系统复位。具体而言,在多核系统中设置一个作为监控装置的看门狗芯片,并且该看门狗的输出端与多核系统的复位端相连。多核系统中的每个核都可以在运行正常的情况下定期对看门狗清零,以保证该看门狗不会溢出,从而不会对该多核系统进行复位。当所有核均发生故障而无法执行清零操作时,看门狗因未被清零而溢出,则整个多核系统被复位。在上述的监控方法下,只有等到全部核均处于异常状态时,才能够对多核系统进行复位。那么,当多核系统采用流水线工作方式时,任何一个核出现故障都会导致待处理任务无法正常执行,即需要对整个多核系统进行复位,然而当多核系统中存在正常运行的核时无法执行复位,则必须等待全部的核均出现故障。当多核系统采用并行处理工作方式时,当仅有几个核出现异常时,也必须等待全部核均出现故障时才能够对多核系统进行复位;并且由于并行处理工作方式下,各个核能够相互独立地工作,每个核的故障均不会中断多核系统的运行,则当存在处于正常状态的核时,无需对多核系统进行整体复位。可见,现有的监控方法无法在多核系统中的核出现异常的情况下及时有效地恢复系统运行。
技术实现思路
有鉴于此,本专利技术提供一种监控方法,能够在多核系统中的核出现异常的情况下,及时有效地恢复系统运行。在本专利技术中,预先为多核系统中的每个核设置对应的复位策略,然后按照如下步骤对多核系统进行监控对多核系统中所有核的运行状态进行监视,当出现处于异常状态的核时,确定该核对应的复位策略,并按照所确定的复位策略对需要被复位的核进行复位。其中,所述多核系统中的核包括监控核和被监控核,所述预先为多核系统中的每个核设置对应的复位策略为将监控核对应的复位策略设置为系统复位,并根据所执行任务的特性,将被监控核对应的复位策略设置为系统复位、单核复位或者相关核复位。较佳地,预先为监控核设置系统监控变量,为被监控核设置上次更新变量和本次更新变量,该方法进一步包括监控核在正常状态下对所述系统监控变量定期更新,并且监控核和被监控核在正常状态下按照预先设置的该被监控核的更新周期,分别对所述上次更新变量和本次更新变量进行更新; 所述对多核系统中所有核的运行状态进行监视为根据所述系统监控变量确定监控核的运行状态,根据所述上次更新变量和本次更新变量确定被监控核的工作状态。其中,所述监控核在正常状态下对所述系统监控变量定期更新为监控核在处于正常状态时定期将系统监控变量清零;所述上次更新变量的初始值比当前更新变量的初始值小1,则所述监控核和被监控核在正常状态下对所述上次更新变量和本次更新变量进行更新为监控核按照所述被监控核的更新周期,将上次更新变量对应的数值加1,被监控核按照所述更新周期,将当前更新变量对应的数值加1;所述根据系统监控变量确定监控核的运行状态为判断系统监控变量是否溢出,如果是,则判定监控核处于异常状态,否则,判定监控核处于正常状态;所述根据上次更新变量和本次更新变量确定被监控核的工作状态为判断上次更新变量是否大于等于本次更新变量,如果是,则判定该被监控核处于异常状态,否则,判定该被监控核处于正常状态。较佳地,所述确定核对应的复位策略,并按照所确定的复位策略对需要被复位的核进行复位包括A1.判断处于异常状态的核是否为监控核,如果是,则将该核对应的复位策略确定为系统复位,并对所述多核系统中的所有核进行复位;否则,执行步骤B1;B1.判断处于异常状态的核对应的复位策略是单核复位、相关核复位还是系统复位,如果是单核复位,则对所述处于异常状态的核进行复位,并结束本流程;如果是相关核复位,则根据复位策略确定与异常状态相关的被监控核,对所确定的被监控核进行复位,并结束本流程;如果是系统复位,则对所述多核系统中的所有核进行复位。其中,所述预先为多核系统中的每个核设置对应的复位策略为根据所述核所执行任务的特性,将核对应的复位策略设置为系统复位、单核复位或者相关核复位。较佳地,预先为所述核设置上次更新变量和本次更新变量,该方法进一步包括按照预先设置的该核的更新周期对上次更新变量进行更新,并且核在正常状态下按照所述更新周期,对本次更新变量进行更新;所述对多核系统中所有核的运行状态进行监视为根据所述上次更新变量和本次更新变量确定核的工作状态。其中,所述上次更新变量的初始值比当前更新变量的初始值小1,则所述对上次更新变量进行更新为按照预先设置的核的更新周期,将上次更新变量对应的数值加1;所述对本次更新变量进行更新为核按照所述更新周期,将当前更新变量对应的数值加1;所述根据上次更新变量和本次更新变量确定核的工作状态为判断上次更新变量是否大于等于本次更新变量,如果是,则判定该核处于异常状态,否则,判定该核处于正常状态。其中,所述确定核对应的复位策略,并按照所确定的复位策略对需要被复位的核进行复位为判断处于异常状态的核对应的复位策略是单核复位、相关核复位还是系统复位,如果是单核复位,则对所述处于异常状态的核进行复位,并结束本流程;如果是相关核复位,则根据复位策略确定与异常状态相关的核,对所确定的核进行复位,并结束本流程;如果是系统复位,则对所述多核系统中的所有核进行复位。较佳地,所述按照所确定的复位策略对需要被复位的核进行复位之前,进一步包括需要被复位的核对自身的数据进行备份;所述按照所确定的复位策略对需要被复位的核进行复位之后,进一步包括利用所备份的数据对被复位的核进行恢复现场。其中,所述需要被复位的核对自身的数据进行备份为将需备份的数据的存储位置通知给所述需要被复位的核,该核按照将自身的数据传输至所述存储位置,进行保存。其中,预先确定需备份的数据的存储位置,则所述需要被复位的核对自身的数据进行备份为需要被复位的核在正常状态下定期将需备份的数据传输至所述存储位置,进行保存。本专利技术还提供一种监控装置,能够在多核系统中的核出现异常的情况下,及时有效地恢复系统运行。该监控装置包括系统监控模块、核监控模块、控制模块和存储模块,其中,系统监控模块用于对多核系统中监控核的运行状态进行监视,将监视结果提供给控制模块,在监控核处于异常状态时或者接收到来自于控制模块的系统复位通知时,对多核系统中的所有核进行复位;所述核监控模块用于对多核系统中被监控核的本文档来自技高网
...

【技术保护点】
一种多核系统中的监控方法,其特征在于,预先为该多核系统中的每个核设置对应的复位策略,该方法包括:对多核系统中所有核的运行状态进行监视,当出现处于异常状态的核时,确定该核对应的复位策略,并按照所确定的复位策略对需要被复位的核进行复位。

【技术特征摘要】
1.一种多核系统中的监控方法,其特征在于,预先为该多核系统中的每个核设置对应的复位策略,该方法包括对多核系统中所有核的运行状态进行监视,当出现处于异常状态的核时,确定该核对应的复位策略,并按照所确定的复位策略对需要被复位的核进行复位。2.如权利要求1所述的方法,其特征在于,所述多核系统中的核包括监控核和被监控核,所述预先为多核系统中的每个核设置对应的复位策略为将监控核对应的复位策略设置为系统复位,并根据所执行任务的特性,将被监控核对应的复位策略设置为系统复位、单核复位或者相关核复位。3.如权利要求2所述的方法,其特征在于,预先为监控核设置系统监控变量,为被监控核设置上次更新变量和本次更新变量,该方法进一步包括监控核在正常状态下对所述系统监控变量定期更新,并且监控核和被监控核在正常状态下按照预先设置的该被监控核的更新周期,分别对所述上次更新变量和本次更新变量进行更新;所述对多核系统中所有核的运行状态进行监视为根据所述系统监控变量确定监控核的运行状态,根据所述上次更新变量和本次更新变量确定被监控核的工作状态。4.如权利要求3所述的方法,其特征在于,所述监控核在正常状态下对所述系统监控变量定期更新为监控核在处于正常状态时定期将系统监控变量清零;所述上次更新变量的初始值比当前更新变量的初始值小1,则所述监控核和被监控核在正常状态下对所述上次更新变量和本次更新变量进行更新为监控核按照所述被监控核的更新周期,将上次更新变量对应的数值加1,被监控核按照所述更新周期,将当前更新变量对应的数值加1;所述根据系统监控变量确定监控核的运行状态为判断系统监控变量是否溢出,如果是,则判定监控核处于异常状态,否则,判定监控核处于正常状态;所述根据上次更新变量和本次更新变量确定被监控核的工作状态为判断上次更新变量是否大于等于本次更新变量,如果是,则判定该被监控核处于异常状态,否则,判定该被监控核处于正常状态。5.如权利要求2所述的方法,其特征在于,所述确定核对应的复位策略,并按照所确定的复位策略对需要被复位的核进行复位包括A1.判断处于异常状态的核是否为监控核,如果是,则将该核对应的复位策略确定为系统复位,并对所述多核系统中的所有核进行复位;否则,执行步骤B1;B1.判断处于异常状态的核对应的复位策略是单核复位、相关核复位还是系统复位,如果是单核复位,则对所述处于异常状态的核进行复位,并结束本流程;如果是相关核复位,则根据复位策略确定与异常状态相关的被监控核,对所确定的被监控核进行复位,并结束本流程;如果是系统复位,则对所述多核系统中的所有核进行复位。6.如权利要求1所述的方法,其特征在于,所述预先为多核系统中的每个核设置对应的复位策略为根据所述核所执行任务的特性,将核对应的复位策略设置为系统复位、单核复位或者相关核复位。7.如权利要求6所述的方法,其特征在于,预先为所述核设置上次更新变量和本次更新变量,该方法进一步包括按照预先设置的该核的更新周期对上次更新变量进行更新,并且核在正常状态下按照所述更新周期,对本次更新变量进行更新;所述对多核系统中所有核的运行状态进行监视为根据所述上次更新变量和本次更新变量确定核的工作状态。8.如权利要求7所述的方法,其特征在于,所述上次更新变量的初始值比当前更新变量的初始值小1,则所述对上次更新变量进行更新为按照预先设置的核的更新周期,将上次更新变量对应的数值加1;所述对本次更新变量进行更新为核按照所述更新周期,将当前更新变量对应的数值加1;所述根据上次更新变量和本次更新变量确定核的工作状态为判断上次更新变量是否大于等于本次更新变量,如果是,则判定该核处于异常状态,否则,判定该核处于正常状态。9.如权利要求6所述的方法,其特征在于,所述确定核对应的复位策略,并按照所确定的复位策略对需要被复位的核进行复位为判断处于异常状态的核对应的复位策略是单核复位、相...

【专利技术属性】
技术研发人员:郭昕
申请(专利权)人:杭州华为三康技术有限公司
类型:发明
国别省市:86[中国|杭州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1