多核系统中的监控方法、监控装置以及多核系统制造方法及图纸

技术编号：2845112 阅读：190 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种多核系统的监控方法，预先为该多核系统中的每个核设置对应的复位策略，该方法包括：对多核系统中所有核的运行状态进行监视，当出现处于异常状态的核时，确定该核对应的复位策略，并按照所确定的复位策略对需要被复位的核进行复位。本发明专利技术还公开了一种包括系统监控模块、核监控模块、控制模块和存储模块的监控装置，以及一种包括核监控模块、控制模块和存储模块的监控装置。另外，本发明专利技术又公开了一种多核系统，该系统包括核以及监控装置。本发明专利技术的上述技术方案能够在多核系统中的核出现异常的情况下，及时有效地恢复系统运行。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及监控技术，尤其涉及多核系统中的监控方法、监控装置以及多核系统。
技术介绍
在计算机技术和电子技术迅猛发展的趋势下，将多个芯片集成于一个封装之内的多核技术逐渐成熟。多核系统中的每个核均可被看作为一个中央处理器(CPU)，以便提高多核系统的处理效率并减少处理延迟。在多核系统中，通常采用流水线或者并行处理等工作方式来完成待处理任务。图1示出了采用流水线工作方式的多核系统示意图。参见图1，在流水线工作方式下，待处理任务被分成多个部分，每个核完成其中的一个部分。只有前面的核完成处理后，后面的核才继续执行该任务的后续部分，并在最后一个核结束处理后输出处理结果。图2示出了采用并行处理工作方式的多核系统示意图。参见图2，在并行处理工作方式下，每个核都能够独立地执行待处理任务，并输出处理结果。对于多核系统，由于所运行程序中存在的潜在错误以及恶劣环境干扰等因素会导致核出现异常而无法运行，因此为了保证该系统能够在无人干预下自动恢复正常，目前参考单核系统中采用的看门狗方式，对多核系统进行监控并执行异常情况下的系统复位。具体而言，在多核系统中设置一个作为监控装置的看门狗芯片，并且该看门狗的输出端与多核系统的复位端相连。多核系统中的每个核都可以在运行正常的情况下定期对看门狗清零，以保证该看门狗不会溢出，从而不会对该多核系统进行复位。当所有核均发生故障而无法执行清零操作时，看门狗因未被清零而溢出，则整个多核系统被复位。在上述的监控方法下，只有等到全部核均处于异常状态时，才能够对多核系统进行复位。那么，当多核系统采用流水线工作方式时，任何一个核出现故障都会导致待处理任务...

【技术保护点】
一种多核系统中的监控方法，其特征在于，预先为该多核系统中的每个核设置对应的复位策略，该方法包括：对多核系统中所有核的运行状态进行监视，当出现处于异常状态的核时，确定该核对应的复位策略，并按照所确定的复位策略对需要被复位的核进行复位。

【技术特征摘要】
1.一种多核系统中的监控方法，其特征在于，预先为该多核系统中的每个核设置对应的复位策略，该方法包括对多核系统中所有核的运行状态进行监视，当出现处于异常状态的核时，确定该核对应的复位策略，并按照所确定的复位策略对需要被复位的核进行复位。2.如权利要求1所述的方法，其特征在于，所述多核系统中的核包括监控核和被监控核，所述预先为多核系统中的每个核设置对应的复位策略为将监控核对应的复位策略设置为系统复位，并根据所执行任务的特性，将被监控核对应的复位策略设置为系统复位、单核复位或者相关核复位。3.如权利要求2所述的方法，其特征在于，预先为监控核设置系统监控变量，为被监控核设置上次更新变量和本次更新变量，该方法进一步包括监控核在正常状态下对所述系统监控变量定期更新，并且监控核和被监控核在正常状态下按照预先设置的该被监控核的更新周期，分别对所述上次更新变量和本次更新变量进行更新；所述对多核系统中所有核的运行状态进行监视为根据所述系统监控变量确定监控核的运行状态，根据所述上次更新变量和本次更新变量确定被监控核的工作状态。4.如权利要求3所述的方法，其特征在于，所述监控核在正常状态下对所述系统监控变量定期更新为监控核在处于正常状态时定期将系统监控变量清零；所述上次更新变量的初始值比当前更新变量的初始值小1，则所述监控核和被监控核在正常状态下对所述上次更新变量和本次更新变量进行更新为监控核按照所述被监控核的更新周期，将上次更新变量对应的数值加1，被监控核按照所述更新周期，将当前更新变量对应的数值加1；所述根据系统监控变量确定监控核的运行状态为判断系统监控变量是否溢出，如果是，则判定监控核处于异常状态，否则，判定监控核处于正常状态；所述根据上次更新变量和本次更新变量确定被监控核的工作状态为判断上次更新变量是否大于等于本次更新变量，如果是，则判定该被监控核处于异常状态，否则，判定该被监控核处于正常状态。5.如权利要求2所述的方法，其特征在于，所述确定核对应的复位策略，并按照所确定的复位策略对需要被复位的核进行复位包括A1.判断处于异常状态的核是否为监控核，如果是，则将该核对应的复位策略确定为系统复位，并对所述多核系统中的所有核进行复位；否则，执行步骤B1；B1.判断处于异常状态的核对应的复位策略是单核复位、相关核复位还是系统复位，如果是单核复位，则对所述处于异常状态的核进行复位，并结束本流程；如果是相关核复位，则根据复位策略确定与异常状态相关的被监控核，对所确定的被监控核进行复位，并结束本流程；如果是系统复位，则对所述多核系统中的所有核进行复位。6.如权利要求1所述的方法，其特征在于，所述预先为多核系统中的每个核设置对应的复位策略为根据所述核所执行任务的特性，将核对应的复位策略设置为系统复位、单核复位或者相关核复位。7.如权利要求6所述的方法，其特征在于，预先为所述核设置上次更新变量和本次更新变量，该方法进一步包括按照预先设置的该核的更新周期对上次更新变量进行更新，并且核在正常状态下按照所述更新周期，对本次更新变量进行更新；所述对多核系统中所有核的运行状态进行监视为根据所述上次更新变量和本次更新变量确定核的工作状态。8.如权利要求7所述的方法，其特征在于，所述上次更新变量的初始值比当前更新变量的初始值小1，则所述对上次更新变量进行更新为按照预先设置的核的更新周期，将上次更新变量对应的数值加1；所述对本次更新变量进行更新为核按照所述更新周期，将当前更新变量对应的数值加1；所述根据上次更新变量和本次更新变量确定核的工作状态为判断上次更新变量是否大于等于本次更新变量，如果是，则判定该核处于异常状态，否则，判定该核处于正常状态。9.如权利要求6所述的方法，其特征在于，所述确定核对应的复位策略，并按照所确定的复位策略对需要被复位的核进行复位为判断处于异常状态的核对应的复位策略是单核复位、相...

【专利技术属性】
技术研发人员：郭昕，
申请(专利权)人：杭州华为三康技术有限公司，
类型：发明
国别省市：86[中国|杭州]

全部详细技术资料下载我是这个专利的主人