多核处理器故障处理方法、多核处理器及通信设备技术

技术编号:3933635 阅读:193 留言:0更新日期:2012-04-11 18:40
本发明专利技术实施例公开了一种多核处理器故障处理方法,包括:判断对数据进行处理的主用核是否发生故障;若是,则将备用核切换为主用状态。本发明专利技术实施例还提供相应的多核处理器及通信设备。本发明专利技术实施例将故障核的数据处理转移到备用核,从而使出现故障的多核处理器恢复正常工作,恢复时间在毫秒级或以下,相对于现有技术,能够满足实时性要求较高的场合。

【技术实现步骤摘要】

本专利技术涉及通信
,具体涉及一种多核处理器故障处理方法、多核处理器 及通信设备。
技术介绍
随着处理器技术的迅速发展,多核处理器越来越被通信设备广泛采用。随着多核 处理器技术的发展,多核处理器功能越来越强大,往往一个多核处理器就可以实现单板上 全部的信息处理功能,同时,多核处理器的内部设计也日趋复杂,这就对多核处理器的可靠 性提出了较高的要求。为了增强多核处理器的可靠性,在通信系统实现中需要对多核处理器的运行状 态,包括各种信号状态,以及其上运行的软件状态进行实时检测,一旦检测到多核处理器出 现故障,就需要对多核处理器采取措施,使出现故障的多核处理器能够自愈。目前,主要采 用对独立模块(例如单核)单独复位的方法使出现故障的多核处理器自愈,即在多核处理 器中,管理模块实时检测各个独立模块,当检测到独立模块出现故障时,管理模块触发发生 故障的独立模块进行复位、重加载,将该独立模块恢复为可用状态,从而使多核处理器恢复 正常工作。在对现有技术的研究和实践过程中,本专利技术的专利技术人发现,采用对独立模块单独 复位使出现故障的多核处理器恢复正常工作,恢复时间通常在秒级,无法满足实时性要求 较高的场合。
技术实现思路
本专利技术实施例提供一种多核处理器故障处理方法、多核处理器及通信设备。一方面,本专利技术实施例提供一种多核处理器故障处理方法,包括判断对数据进行处理的主用核是否发生故障;若是,则将备用核切换为主用状态。另一方面,本专利技术实施例提供一种多核处理器,包括主用核,用于对数据进行处理;备用核,用于判断主用核是否发生故障;若是,则将所述备用核切换为主用状态。另一方面,本专利技术实施例提供一种通信设备,包括本专利技术实施例中的多核处理器。从以上技术方案可以看出,本专利技术实施例具有以下优点本专利技术实施例中,通过判断多核处理器中主用核是否发生故障,当主用核发生故 障时,则将备用核切换为主用状态,使故障核的数据处理转移到该备用核,从而使多核处理 器恢复正常工作,恢复时间可以达到毫秒级或以下,相对于现有技术,能够满足实时性要求 较高的场合。附图说明 图1是本专利技术实施例中多核处理器故障处理方法的一个实施例的示意图;图2是本专利技术实施例中多核处理器故障处理方法的另一实施例的示意图;图3是本专利技术实施例中通信设备的一个实施例的多核处理器的示意图;图4是本专利技术实施例中通信设备的另一实施例的多核处理器的示意图;图5是图4所示实施例中的备用核的示意图;图6是图4所示实施例中多核处理器的管理模块的示意图。具体实施例方式本专利技术实施例提供一种多核处理器故障处理方法、多核处理器及通信设备。以下 分别进行详细说明。请参阅图1,本专利技术实施例中多核处理器故障处理方法的一个实施例包括110、判断对数据进行处理的主用核是否发生故障,若是,则执行步骤120,否则结 束操作;本专利技术实施例中,多核处理器包括主用核和备用核,每一对主用核和备用核加载 有相同的代码,多核处理器还可以进一步包括管理模块。本专利技术实施例可以通过多核处理器中的备用核或管理模块来判断主用核是否发 生故障。管理模块或备用核判断主用核是否发生故障具体可以包括监测主用核的流水线 是否中断,若中断,则判定该主用核发生故障。或者,备用核判断主用核是否发生故障具体也可以包括获取主用核的每个处理 阶段所用到的数据内容和针对该数据内容的阶段处理结果,对该数据内容进行与主用核相 同的阶段处理,即对该数据内容运行该处理阶段对应的程序,再判断自身的阶段处理结果 与主用核发送的阶段处理结果是否一致,若不一致,则备用核判定该主用核发生故障。其中,数据可以为报文或其他形式,本专利技术实施例对此不作限定。120、将备用核切换为主用状态。当判定主用核发生故障时,管理模块或备用核将备用核切换为主用状态,使故障 核(即发生故障的主用核)的数据处理转移到该备用核,从而使多核处理器恢复正常工作。本专利技术实施例的执行主体若为备用核,恢复时间可以达到在微秒级;本专利技术实施 例的执行主体若为管理模块,恢复时间可以达到在毫秒级,均远小于现有技术中的恢复时 间。并且,由于恢复时间较短,从而能够减少数据的丢失,满足可靠性要求较高的场合。将备用核切换为主用状态之后,备用核可以从与主用核共有的缓存队列中获取并 处理后续数据(故障核处理的当前数据的后续数据);备用核也可以先处理故障核还未执 行完所有阶段处理程序的当前数据,再从缓存队列中获取并处理后续数据,从而进一步减 少了数据的丢失。备用核处理故障核对应的当前数据的具体实现方式可以包括备用核处理当前数 据最新保存的阶段处理结果,即对该阶段处理结果继续运行剩余阶段对应的处理程序。本实施例中,多核处理器包括主用核和备用核,通过判断主用核是否发生故障,当 主用核发生故障时,则将备用核切换为主用状态,使故障核的数据处理转移到该备用核,从而使多核处理器恢复正常工作,恢复时间在毫秒级或以下,相对于现有技术,能够满足实时 性要求较高的场合。请参阅图2,本专利技术实施例中多核处理器故障处理方法的另一实施例包括210、备用核判断对数据进行处理的主用核是否发生故障,若是,则触发步骤220,否则结束操作;本实施例中,由备用核判断主用核是否发生故障。220、备用核将自身切换为主用状态;本实施例中,主用核对数据进行处理的过程分为多个处理阶段,主用核会将每个 处理阶段所用到的数据内容和针对该数据内容的阶段处理结果以消息的形式发送给备用 核,备用核中设置有对应于每个处理阶段的定时器,在预定时间内若没有收到每个处理阶 段的消息,则认为主用核的流水线中断,确定主用核发生故障,若在预定时间内收到每个处 理阶段的消息,则备用核对收到的数据内容进行与主用核相同的处理,若自身的处理结果 与主用核发送的阶段处理结果不一致,则备用核判定主用核发生故障。当备用核判定主用核发生故障时,备用核将自身切换为主用状态,并处理最新保 存的阶段处理结果,再从缓存队列中获取并处理后续数据。230、管理模块对故障核进行故障检测;本实施例中,多核处理器还包括管理模块,在备用核将自身切换为主用状态后,管 理模块可以对故障核进行故障检测。故障检测是指对故障核进行内部资源的有效性检查,包括寄存器读写是否正常, 内部缓存读写是否正常,外部缓存读写是否正常,计算器是否能正确计算,内部通信机制是 否能正常收发消息等,具体执行方式为现有技术,此处不作赘述。240、管理模块判断故障是否为可恢复性故障,若是,则执行步骤250,否则执行步 骤 260 ;管理模块可以根据步骤230中的检测判断故障是可恢复性故障还是不可恢复性 故障,具体执行方式可以为现有技术,此处不作赘述。250、管理模块将故障核恢复为可用状态,结束流程;若是可恢复性故障,管理模块可以将故障核进行复位、重加载,恢复为可用状态, 具体执行方式为现有技术,此处不作赘述。所述故障核在恢复为可用状态之后,可以进入备用状态,监控当前的主用核的运 行状态。260、告警模块发出告警,结束流程。本实施例中的多核处理器还可以包括告警模块,若管理模块判定故障是不可恢复 性故障,则告警模块可以发出告警,以通知网管人员。进一步地,在备用核将自身切换为主用状态后,管理模块还可以从故障核获取并 保存故障核发生故障时的现场资料,以便开发人员分析故障模型并优化技术方案。主本文档来自技高网...

【技术保护点】
一种多核处理器故障处理方法,其特征在于,包括:  判断对数据进行处理的主用核是否发生故障;  若是,则将备用核切换为主用状态。

【技术特征摘要】

【专利技术属性】
技术研发人员:岳青伦
申请(专利权)人:上海华为技术有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1