冗余处理器中的差错处理系统技术方案

技术编号:2850888 阅读:230 留言:0更新日期:2012-04-11 18:40
在冗余处理器计算装置(102)中,差错处理方法包括检测正工作的计算装置(102)的处理器元件(104A,104B)之间的等量不一致,并且通过评估处理器保真度的辅助考虑因素来响应所检测等量不一致。

【技术实现步骤摘要】

本专利技术涉及处理器,更具体地说,涉及冗余处理器中的差错处理系统
技术介绍
系统可用性、可缩放性以及数据完整性是企业系统的基本特性。不间断执行能力施加于采用诸如证券交易业务处理、信用卡和借记卡系统、电话网络等应用的企业系统的金融、通信及其它领域。在具有高的财政或人力成本的应用中,在大规模缩放的环境中,以及在不容许停机和数据破坏的情况中,往往实现高可靠性系统。一些系统结合运行相同操作的多个冗余处理器,使得单个处理器中的差错可被检测和/或纠正。对于每个处理器得到的结果可互相比较。如果所有结果均相同,则所有处理器以高正确性概率被认为正常运行。但是,如果结果不同,则进行分析以确定哪个处理器不正确工作。来自多个处理器的结果可经过“表决”,其中“胜出”结果被确定是正确的。例如,具有三个处理器元件的系统通常采用三个处理器中的两个所得到的结果。对于具有两个运行处理器的双工系统出现困难,因为偶数处理器元件可能产生可导致中止操作和停机的“表决平局”情况。可通过运行奇数处理器来避免平局,但是,单个处理器没有表决所提供的故障检测能力。三个或三个以上处理器系统增加产品成本。
技术实现思路
根据冗余处理器计算装置的一个实施例,差错处理方法包括检测正工作的计算装置的处理器元件之中的等量不一致,并且通过评估处理器保真度的辅助考虑因素来响应所检测的等量不一致。附图说明通过参照以下描述和附图,可以最佳地理解涉及结构以及操作方法的具体实施例方式图1是示意框图,说明用于冗余处理器计算装置并且具有解决相互不一致或平局状况的能力的控制设备的一个实施例;图2是示意框图,说明具有采用查验向量在多个处理器元件之中解决不一致以及打破平局的能力的计算系统的一个实施例;图3是示意框图,说明以冗余处理器方案来配置的计算系统的一个实施例,其中在不一致或平局状况时施加所选持续时间的短延迟;图4是示意框图,说明在其中可实现说明性差错处理系统的复合处理器的一个实施例;图5是示意框图,说明能够检测处理器元件之中的等量不一致并且通过评估处理器保真度的辅助考虑因素来响应的计算系统的一个 具体实施例方式处理器可结合多个冗余的松散耦合的处理器元件用于检错。采用两个处理器元件的双工方案易遭遇“表决平局”情况。通过以采用单处理器元件时损失检错能力的方式采用奇数个处理器,以及通过增加结合附加处理器元件的成本,可避免平局。说明性系统及方法可采用其它信息来解决冲突以及打破平局。因此,有效的处理器可以仅采用用于表决或比较的两个处理器元件来配置。参照图1,示意框图说明用于冗余处理器计算装置102的控制设备100的一个实施例。控制设备100在具有多个处理器元件104A和104B的配置中可工作,并且可解决处理器元件之间的相互不一致或“平局”状况。在例如对于偶数个处理器元件表决错误的情况中,控制设备100可用于采用其它可用信息来打破平局。控制设备100包括控制元件106,它检测处理器元件104A、104B之间的等量不一致,并通过评估处理器保真度的辅助考虑因素进行响应。控制元件106确定辅助考虑因素的评估是否不足以解决处理器元件104A、104B之间的不一致,以及如果是的话,则终止计算装置操作。计算装置102可能是计算机处理器,它采用多个冗余的松散同步的处理器元件104A、104B来检测和管理差错。具有偶数个处理器元件104A、104B的配置易遭遇表决“平局”状况,其中来自处理器元件的动作或结果不同。例如,计算装置102可具有两个处理器元件104A、104B,使得任何不一致是等量的并且产生平局状况。奇数、例如三个处理元件通常可用来以增加成本为代价避免平局。在一些情况中,可称作保真度的辅助考虑因素的其它信息可用于解决不一致并打破平局。其它信息是启发式数据,它充分预测为对于不一致解决是可信的。如果平局无法通过使用其它信息来打破,则错误被认为足够严重,处理器因不能保证不相等表决数据项的任一个的正确性而被停止。一些实施例可包括控制元件106,它在检测到等量不一致之前、在处理器元件104A、104B正在运行时评估处理器保真度的辅助条件,并根据评估来设置查验向量108。例如,查验向量108可在表决单元110中实现,并由表决单元110用来解决不一致,并打破预定条件中的平局。在一个具体实例中,查验向量108对每个处理器元件104A、104B可具有一个状态位。在各处理器元件104A、104B中运行的控制逻辑部件、如软件可在逻辑部件已经累积用于打破将来的平局或者最近的平局的信息的条件下设置该位。控制逻辑部件可定期重置查验向量位。在检测到不一致或平局状况时,表决单元110可延迟按该状况采取动作或者宣布致命错误情况。相反,表决单元110可在采取动作之前保持所比较的值一个短期时段。控制元件106可相应地在等量不一致检测与计算机装置操作的终止之间插入延迟。延迟使控制逻辑部件、例如软件能够有可能检测其它错误或者收集与解决不一致或打破平局相关的信息。延迟还可打破可能的竞争条件。例如,如果可自行检测的错误与表决错误(misvote)同时或几乎同时出现,则延迟使得能够在表决器宣布表决错误情况之前进一步收集信息或分析,使得能够识别错误以及解决表决。在一个具体双工实施例中,如果控制逻辑部件在表决单元110施加的短延迟期间设置查验向量108中的两位其中之一,则表决单元110解决不一致或打破平局,有利于没有处于查验中的处理器元件、无论是104A还是104B。虽然状况保持为错误状况,但该错误变为可恢复的。如果控制逻辑部件在延迟之前或者期间没有设置查验向量中的位,则错误被认为对于计算装置102是致命的,因而操作被停止。在一个具体实施例中,计算装置102可包括逻辑同步单元112,其中包含表决单元110和输入/输出接口114A和114B。例如,接口114A和114B可包括编程输入/输出(PIO)接口和直接存储器存取(DMA)接口。一种可能的等量不一致或平局状况可包括第一处理器元件执行编程输入/输出(PIO)动作而第二处理器元件不执行该动作的一种状况。等量不一致或平局状况的第二实例可能是对于表决数据的比较错误,因而两个处理器元件104A、104B提供的数据对于编程输入/输出(PIO)动作或直接存储器存取(DMA)动作不匹配。其它等量不一致或平局状况包括第一处理器元件执行PIO读取,而第二处理器元件则执行PIO写入,或者第一和第二处理器读取或写入不同地址。参照图2,示意框图说明具有解决以冗余处理器方案来配置的多个处理器元件202A、202B之间不一致的能力的计算系统200的一个实施例。计算系统200还包括耦合到处理器元件202A、202B的查验向量204,并且具有分配给处理器元件202A、202B的每个的信号。控制元件206耦合到处理器元件202A、202B,以及评估处理器保真度,从而根据评估的结果来设置查验向量204。与处理器元件状况和功能性相关的更多丰富信息可用时,查验向量204用于在检测差错之前监测处理器元件保真度的辅助考虑因素。相反,没有在检测差错之前开始获取状态信息的系统可能具有更有限的功能能力,并且可能无法执行诊断处理器元件保真度的动作。在适当时候,当处理器元件202A、202B正在运行时的状态和操作信息的获取简化操作,因为仅本文档来自技高网...

【技术保护点】
一种用于包括多个处理器元件(104A,104B)的冗余处理器计算装置(102)中的控制设备(100),所述控制设备(100)包括:控制元件(106),它检测所述处理器元件(104A,104B)之间的等量不一致,并通过评估处理器保真度的辅助考虑因素来响应。

【技术特征摘要】
US 2005-1-27 11/0454011.一种用于包括多个处理器元件(104A,104B)的冗余处理器计算装置(102)中的控制设备(100),所述控制设备(100)包括控制元件(106),它检测所述处理器元件(104A,104B)之间的等量不一致,并通过评估处理器保真度的辅助考虑因素来响应。2.一种计算系统(500),包括配置成冗余处理器方案的多个处理器元件(502A,502B);耦合到所述多个处理器元件(502A,502B)的表决器(504),它比较所述处理器元件(502A,502B)所采取的动作,并确定所述动作中的不一致;以及耦合到所述处理器元件(502A,502B)和所述表决器(504)的控制元件(506),它检测所述处理器元件(502A,502B)之间的等量不一致,并通过评估处理器保真度的辅助考虑因素来响应。3.如权利要求2所述的系统(500),其特征在于,还包括双处理器元件配置(502A,502B);以及耦合到所述表决器(504)的编程输入/输出(PIO)接口(522),由此,所述控制元件(506)可检测的动作不一致是PIO超时,其中一个处理器元件(502A)执行PIO动作,而一个处理器元件(502B)不执行所述PIO动作。4.如权利要求2所述的系统(500),其特征在于,还包括双处理器元件配置;以及耦合到所述表决器(504)的编程输入/输出(PIO)接口(522)和直接存储器存取(DMA)接口(524),由此,所述控制元件(506)可检测的动作不一致是对于所表决数据的比较错误,其中两个处理器元件(502A,502B)对PIO动作或者DMA动作提供不匹配数据。5.如权利要求2所述的系统(500),其特征在于,还包括查验向量(526),耦合到所述表决器(504)以及耦合到所述处理器元件(502A,502B),并且具有分配给所述处理器元件中每一个的信号;以及控制元件(506),评估处理器保真度的辅助条件,并根据处理器保真度的辅助考虑因素来设置所述查验向量(526)。6.一种计算系统(200),包括配置成冗余处理器方案的多个处理器元件(202A,202B);查验向量(204),耦合...

【专利技术属性】
技术研发人员:RL贾丁JS克莱卡WF布鲁克特JR斯穆伦DJ加西亚
申请(专利权)人:惠普开发有限公司
类型:发明
国别省市:US[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1