基于设备视图冗余的众核处理器容错方法技术

技术编号:11103675 阅读:81 留言:0更新日期:2015-03-04 15:54
本发明专利技术公开了一种基于设备视图冗余的众核处理器容错方法,步骤包括:预先在众核处理器的主核和冗余核中加入可靠设备单元并提供可供编程调用的设备视图;主核执行到配置指令时配置可靠设备单元,控制核为主核分配冗余核;在主核执行到启用指令后,主核将现场复制给冗余核,主核和冗余核分别启用可靠设备单元;控制核分别发送冗余执行命令,主核和冗余核开始容错执行,控制核定时执行更新检查点,在容错执行出错时退回上一个检查点;在主核执行到停用指令后,分别停用可靠设备单元,主核继续执行应用程序。本发明专利技术可靠性高、软件调用方便、容错灵活、容错成本低、错误发现实时、容错执行效率高,能够充分利用空闲的核资源、对系统性能影响小。

【技术实现步骤摘要】

本专利技术涉及微处理器体系结构领域众核容错技术,具体涉及一种。
技术介绍
故障率的增加使得容错成为所有处理器必需面对的问题。甚至桌面应用也开始考虑可靠性。目前广泛应用容错系统的都是金融、能源、航空航天等关键领域,这主要是因为这些关键应用对容错开销的承受能力强。而桌面应用,高性能计算等应用对容错代价是很敏感的。同时处理器的发展也日益从多核向众核发展。所以一种面向开销敏感型应用的众核容错技术是极为有意义的。 目前主流的容错技术分软件实现和硬件实现两种,软件实现多基于多次执行相同程序比较结果,而硬件容错多基于多模冗余,实现多套硬件资源来同时执行程序的多个副本。将软硬件结合起来进行全系统的容错是目前一个趋势,如硬件负责错误检测而软件负责错误恢复,这可以极大降低容错开销。 公认的,目前众核处理器存在利用率较低的问题,通常存在空闲资源。Pollack定律表明如果程序的并行性足够,众核能够维持性能继续按照摩尔定律增长。所以众核对并行性的需求也是遵循摩尔定律的,但是程序的并行性及其开发受多种因素限制很难满足需求,这就导致了众核性能的下降和空闲核的存在。实际的众核处理器如本文档来自技高网...

【技术保护点】
一种基于设备视图冗余的众核处理器容错方法,其特征在于步骤包括:1)预先在众核处理器指定的主核和冗余核中加入用于容错检测的可靠设备单元,且针对可靠设备单元提供可供编程调用的设备视图,所述设备视图可供编程调用的指令包括设备视图的配置、启用和停用;在主核执行应用程序时,如果执行到设备视图的配置指令,则初始化配置可靠设备单元并向控制核发送中断请求,控制核根据中断请求为主核分配一个可用的冗余核,跳转执行步骤2);2)主核继续执行应用程序;当主核执行到设备视图的启用指令时挂起应用程序,启用可靠设备单元并将上下文复制给冗余核,冗余核保存上下文并启用可靠设备单元,控制核分别给主核和冗余核发送冗余执行命令,跳转...

【技术特征摘要】
1.一种基于设备视图冗余的众核处理器容错方法,其特征在于步骤包括: 1)预先在众核处理器指定的主核和冗余核中加入用于容错检测的可靠设备单元,且针对可靠设备单元提供可供编程调用的设备视图,所述设备视图可供编程调用的指令包括设备视图的配置、启用和停用;在主核执行应用程序时,如果执行到设备视图的配置指令,则初始化配置可靠设备单元并向控制核发送中断请求,控制核根据中断请求为主核分配一个可用的冗余核,跳转执行步骤2); 2)主核继续执行应用程序;当主核执行到设备视图的启用指令时挂起应用程序,启用可靠设备单元并将上下文复制给冗余核,冗余核保存上下文并启用可靠设备单元,控制核分别给主核和冗余核发送冗余执行命令,跳转执行步骤3); 3)主核、冗余核同时执行设备视图的启用指令后的关键代码段,同时控制核根据指定的间隔时间更新主核执行的检查点,在执行关键代码段的过程中如果主核的可靠设备单元检测到和冗余核的可靠设备单元执行的结果不一致则向控制核发出中断请求,则控制核控制主核和冗余核退回上一个检查点;当主核执行到设备视图的停用指令时,跳转执行步骤4); 4)主核、冗余核分别停用可靠设备单元,主核继续执行应用程序。2.根据权利要求1所述的基于设备视图冗余的众核处理器容错方法,其特征在于:所述步骤I)中初始化配置可靠设备单元时包括配置控制核用于更新主核执行的间隔时间。3.根据权利要求2所述的基于设备视图冗余的众核处理器容错方法,其特征在于:所述步骤I)中控制核根据中断请求为主核分配一个可用的冗余核的步骤包括:控制核收到中断请求后向各个冗余核发送空闲度查询指令,各个冗余核基于自带的性能计数器或者可靠设备单元内置的性能计数器统计指定的时间内该冗余核执行的NULL指令数和总指令数,并将NULL指令数除以总指令数得到该冗余核的空闲度并发送给控制核,控制核根据各个冗余核返回的空闲度为主核分配一个可用的冗余核。4.根据权利要求3所述的基于设备视图冗余的众核处理器容错方法,其特征在于:所述步骤I)中初始化配置可靠设备单元时还包括配置主核的冗余优先级;所述控制核根据各个冗余核返回的空闲度为主核分配一个可用的冗余核时,如果同时只有一个主核向控制核发送中断请求,则查找一个空闲度最高的有效的冗余核分配给该主核,如果同时存在两个以上主核同时向控制核发送中断请求,则控制核根据各个主核的冗余优先级来分配冗余核,冗余优先级最高的主核获得空闲度最高的有效的冗余核,冗余优先级最低的主核获得空闲度最低的有效的冗余核,如果没有足够的冗余核,则将冗余核优先分配冗余优先级较高的主核,如果控制核没有足够的冗余核分配给主核,则向主核返回分...

【专利技术属性】
技术研发人员:乔寓然文梅任巨荀长庆范方园苏华友张春元黄达飞
申请(专利权)人:中国人民解放军国防科学技术大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1