当前位置: 首页 > 专利查询>西门子公司专利>正文

容错计算机装置以及运行该装置的方法制造方法及图纸

技术编号:2872779 阅读:142 留言:0更新日期:2012-04-11 18:40
在一种根据本发明专利技术的计算机装置中,包括一个中继层(10)和一个处理层(30),其中,该中继层(10)由至少一个中继计算机(11,12,13)形成,该计算机可以为到达的请求数据(7)设置一个时间标记;该处理层(30)由至少两个处理计算机(201,202,20x,211,212,21y,221,222,22z)形成,该计算机由中继层(10)并行地提供请求数据(7),以及,然后各处理计算机都可以在下一个处理步骤中处理该请求数据(7),如果所述时间标记的当前值分别在有效值范围内。通过这种方式,用简单的方法实现了计算机的“隐含同步”。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种计算机装置,包括多个计算机,这些计算机用硬件和/或软件这样逻辑连接,使得该计算机装置对外的功能不会由于一个或多个计算机的故障而受到影响,或仅受到不重要的影响(容错计算机装置)。本专利技术还涉及运行这类装置的方法。
技术介绍
在现代社会里,目前已经利用数字计算机实现了大量业务线路、通信连接、监控任务等。例如,通过因特网订购货物逐渐多地代替了不久前还很普遍的邮政信件订购。在这类订购过程中,顾客利用其与因特网连接的计算机在提供服务公司的服务器中进行选择,以使用在此现有的订购软件进行其订购委托。顾客在订购过程中没有注意到,同时或先后有多少不同的计算机对其订购过程进行处理;只要在此订购过程中不出现错误,顾客的订购状况就好像他只同一个作为“对话伙伴”的计算机在通信。但是,如果在订购过程的某个步骤中出现错误,则顾客经常会通过以下方式注意到该错误,即,他必须再次输入已输入的信息,因为由于错误的出现而使得订购系统的某个计算机丢失了信息。这种可通过因特网使用的订购系统已经公知,且每天都有上百万用户在使用。这种系统的缺点在于,尽管该系统一般由多个计算机组成,但其中一个计算机的故障会导致整个计算机系统的故障,或至少导致部分功能的丢失,并由此导致信息和处理时间的损失。该缺点基于下述理由,即使用这种计算机装置(群集)一般要解决的任务是,将对该计算机系统提出的要求分配到多个计算机上(负荷分配),以便提高可同时处理过程的速度和数量。由此,在这种装置中,由于所期望的负荷分配而没有将待处理的要求同时引导到多个计算机上,且该装置的计算机不同步,该装置中一个计算机的故障将不可避免地至少导致部分功能的丢失和/或信息丢失。具有多个服务器的计算机装置例如在EP 0942363 A2中给出。其中,将输入的请求数据分配到服务器类中,然后由一定数量的服务器进行处理。如果此时一个确定的服务不能被处理,因为该时刻可供利用的计算机容量资源不足,则从其它服务器类中会分离出有可供利用的计算资源的服务器,并用于所要求的服务。在所述欧洲公开文献中还描述了一种计算机集群,其中,在服务器上进行请求数据的负荷分配,从而在一个服务达到资源极限时,用另一个服务的、仍然具有可用计算容量的服务器来代替。其中的缺陷是,对错误情况没有解决方法,使得尽管一个服务的故障不会导致整个所涉及服务的丢失,但不能保证,在发生错误的情况下还会获得传递到计算集群的请求数据,以及尽可能无间断的继续处理该数据。因此,这种计算机装置不适用于不允许出现数据丢失和/或处理延迟的重要应用,以便使人和环境都不受到损害。因此,禁止采用这种装置作为例如核能站的监控系统、在危险处理(例如电或化学处理)中的保护系统,或具有与时间密切相关的过程的服务系统。在DE 19814096 A1中,描述了一种用于转换冗余连接的同类组件的方法。该同类组件中的一个组件作为主组件用于自动化处理。一个第二同类组件处于所谓的从属模式(保留),以便能在主组件出现故障时接管其功能。两个同类组件都由一个置于其上的装置同步地提供相同的请求数据。在主组件出现错误时,处于从属模式的组件直接在置于其上的装置的处理下被激活,以便接管主组件的功能。这样就保证了在出现错误的情况下从有缺陷的组件迅速转换到能工作的组件。但是还不能识别,如何在出现错误的情况下可以保证不丢失请求数据,并且保证在错误情况下接管功能的组件提供了正确的任务数据。此外,在这种根据现有技术的方法中,存在的缺点是组件必须是相同种类的。由此,采用互不相同的组件就不能具有相同的用于解决问题的功能,这在实现这类冗余装置时会导致很高的费用。可以将例如主计算机(主机)实施为功能极其强大的计算机,而将保留计算机(从机)实施为功能较弱的计算机。正常情况下,功能强大的计算机接管计算机装置的功能,而只有在出现错误的情况下计算功能才会出现轻微的损失(如果保留计算机接管功能);但是,这种与引用的现有技术相比花费更少的计算机装置用所描述的方法无容错的运行。在WO 98/44416中描述了一种容错计算机系统。该系统包括例如4个或多个CPU,它们钟同步地工作。到达的数据由所有CPU同时时钟同步地处理。CPU将其计算结果传送到处理单元,该单元确定出该结果的有效性,并输出有效的结果。在该系统中,容错性实际只能在硬件中实现。这意味着相互完全同类的单元(CPU)绝对同时(时钟同步)地处理相同的输入数据,并提供所属的结果。因此,一个单元的故障不会导致整个系统的失效。其中的缺点在于,这种时钟同步工作的解决方法花费极大,因为时钟同步运行对所应用的硬件提出了很高的要求,此外这些硬件必须相互是完全相同的类型;其中实际上不允许容错。此外,同步所应用的单元花费极大,因为并联的单元在处理请求数据时甚至不允许相差一个时钟。此外,也不能采用种类互不相同的硬件,以实现根据该现有技术的冗余。根据现有技术的这类只能在硬件中实现冗余的冗余系统的其它例子是所谓的西门子SIMATIC自动化系列中的H系统(高度可控系统)(例如s5-155h,s7-400h)。其中,各使用两个相互完全相同的、特殊的中央单元,其各自时钟同步地、并行地处理相同的请求数据。在中央单元出现故障时的同步和监控花费极大,此外购置费用也极高。
技术实现思路
本专利技术要解决的技术问题是,提供一种容错计算机装置,其克服上述缺陷,也可以灵活地由不同的组件组合,并可以低廉的制造。根据本专利技术,该技术问题是通过一种具有中继层和处理层的容错计算机装置来解决的,其中-该中继层由至少一个中继计算机形成,该计算机可以为到达的请求数据设置一个时间标记,-该处理层由至少两个处理计算机形成,该计算机由中继层并行的提供请求数据, -如果时间标记的当前值分别在有效值范围内,则然后各处理计算机都可以在下一个处理步骤中处理该请求数据。在根据本专利技术的装置中,由该装置处理为一个结果的请求数据被传送到中继层(中介)的一个或多个计算机。在此,中继层为到达的请求数据设置时间标记,该标记可以例如是时钟元件的当前时间信号或一个序列号,该序列号包含请求数据抵达中继层的时刻。请求数据在必要时由中继层进行预处理,并与所述的时间标记一起并行传送到处理层的处理计算机。如果处理层由多个处理分层(处理子层)组成,它们各由至少两个计算机构成,并特定为处理各自确定的要求类型,则根据其类型由中继层将请求数据传送到所述处理子层的所涉及的计算机中。因此,中继层的基本任务在于,对将由根据本专利技术的计算机装置待处理为一个结果的请求数据设置输入时间辍,并传送到处理层的计算机中,该计算机然后将请求数据处理为一个结果。根据本专利技术,与一个处理计算机的故障相对的装置的容错是这样实现的,即,不仅象现有技术的很多解决方法(所谓的集群解决方法)那样将请求数据继续传送到处理层的一个计算机中,而且还传送到处理层的所有计算机中。这样就保证了,如果处理层中的一个计算机出现故障,该层中的请求数据不会丢失。然后,各处理计算机借助请求数据所具有的时间标记的当前值确定,是否由各处理计算机在下一个处理步骤中处理该请求数据。由此防止了,到处理层的非同步并行信息传送导致处理计算机确定出不同的回答作为请求数据的结果。处理计算机这样处理时间标记的当前值,即,其确定时间标记的当前值是否在一个各本文档来自技高网
...

【技术保护点】
一种容错计算机装置(1),包括一个中继层(10)和一个处理层(30),其特征在于,     -所述中继层(10)由至少一个中继计算机(11,12,1n)形成,该计算机可以为到达的请求数据(7)设置一个时间标记(46),    -所述处理层(30)由至少两个处理计算机(201,202,20x,211,212,21y,221,222,22z)形成,该计算机由中继层(10)并行的提供请求数据(7),以及    -如果所述时间标记(46)的当前值分别在有效值范围内,则然后各处理计算机都可以在下一个处理步骤(C↓[0],C↓[1],C↓[2])中处理该请求数据(7)。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:奥利弗凯泽
申请(专利权)人:西门子公司
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利