一种用于计算机系统的故障恢复方法及装置制造方法及图纸

技术编号:11022877 阅读:94 留言:0更新日期:2015-02-11 12:00
本发明专利技术提供了一种用于计算机系统的故障恢复方法。所述计算机系统中包括用于管理所述计算机系统与外部设备之间的消息通讯的会话管理进程以及用于对所述外部设备的访问请求进行处理的数据处理进程。所述故障恢复方法包括:a.比较由所述数据处理进程发送给所述会话管理进程的第一消息与所述数据处理进程生成的包含数据处理结果的第二消息的消息标识,其中,所述第一消息是基于所述第二消息生成的;以及b.在所述第一消息与所述第二消息的消息标识不一致的情况下,基于所述第二消息来同步所述第一消息。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种用于计算机系统的故障恢复方法。所述计算机系统中包括用于管理所述计算机系统与外部设备之间的消息通讯的会话管理进程以及用于对所述外部设备的访问请求进行处理的数据处理进程。所述故障恢复方法包括:a.比较由所述数据处理进程发送给所述会话管理进程的第一消息与所述数据处理进程生成的包含数据处理结果的第二消息的消息标识,其中,所述第一消息是基于所述第二消息生成的;以及b.在所述第一消息与所述第二消息的消息标识不一致的情况下,基于所述第二消息来同步所述第一消息。【专利说明】一种用于计算机系统的故障恢复方法及装置
本专利技术涉及计算机
,更具体地,涉及一种用于计算机系统的故障恢复方法及装置。
技术介绍
随着计算机和网络技术的迅速发展,在银行、外汇交易、股票交易等领域,越来越多的计算机系统被使用。这些计算机系统往往被作为后台服务器使用,其通过网络连接到各种终端或工作站,并通过运行各种进程来响应这些终端或工作站的访问请求,进而实现相应的业务及数据处理。 然而,在这种计算机系统运行时,由于各种原因,例如由于软件错误、硬件或网络错误,等等,该计算机系统可能会出现运行故障。这些故障会严重影响数据处理的实时性和准确性。例如,运行故障可能会使得系统暂时停止运行,从而使得该计算机系统不能实时地响应交易请求或其他访问请求;或者该运行故障可能会导致一些重要的业务数据丢失。 因此,有必要提供一种能够监控计算机系统的运行状态,并且在出现故障时及时进行故障恢复的方法及装置。
技术实现思路
可见,现有的计算机系统不能够实时地检测运行故障,并且不能够在出现故障时及时地进行故障恢复。 因此,针对上述问题,根据本专利技术的第一方面,提出了一种用于计算机系统的故障恢复方法,其中,所述计算机系统中包括用于管理所述计算机系统与外部设备之间的消息通讯的会话管理进程以及用于对所述外部设备的访问请求进行处理的数据处理进程,所述故障恢复方法包括#比较由所述数据处理进程发送给所述会话管理进程的第一消息与所述数据处理进程生成的包含数据处理结果的第二消息的消息标识,其中,所述第一消息是基于所述第二消息生成的;以及匕在所述第一消息与所述第二消息的消息标识不一致的情况下,基于所述第二消息来同步所述第一消息。 借助于上述方面的故障恢复方法,该计算机系统能够确定经由其中运行的进程所处理得到的数据处理结果是否准确、及时地发送出去。如果由于进程错误等原因引起第一消息丢失,则该计算机系统能够及时地根据已处理得到的数据处理结果重新同步第一消息,已使得该计算机系统能够及时从故障中恢复,并保持正常运行。 在一个实施例中,所述方法还包括二比较由所述会话管理进程发送给所述数据处理进程的第三消息与所述第一消息的消息标识,其中,所述第三消息接收自所述外部设备且包含所述访问请求;以及(1.在所述第一消息与所述第三消息的消息标识不一致的情况下,基于所述第三消息来同步所述第一消息。 对于数据处理进程未能完全、准确处理访问请求的情况,该计算机系统还能够通过初始处理前接收的第三消息来同步第一消息,也即通过数据处理进程重新处理第一消息中包含的访问请求,以得到准确处理的数据处理结果,并以第一消息的形式发送出去。 在一个实施例中,所述方法还包括:在生成或接收到消息时,将所述消息记录在消息数据库中;以及在同步所述消息时,基于所述消息的消息标识在所述消息数据库中读取对应的消息。 在一个实施例中,在所述消息比较步骤之前,还包括:检测运行错误的进程数量;以及如果单个进程错误,则重启所述进程,如果有多个进程错误,则执行所述消息比较和同步的步骤。 在一个实施例中,所述计算机系统包括:至少一个本地管理器,用于对进程进行管理,其中所述进程配置有线程;以及域管理器,其与所述至少一个本地管理器耦合,用于管理所述至少一个本地管理器及其进程,并通过与所述进程相关联的线程通信以监控所述进程的状态。 在一个实施例中,所述方法还包括:检测运行错误的类型;以及如果所述运行错误为软件错误,则执行所述检测运行错误的进程数量的步骤;如果所述运行错误为硬件错误,则更换运行所述进程的硬件设备。 在一个实施例中,所述比较消息的步骤是由所述域管理器执行的;而所述同步消息的步骤是由所述本地管理器执行的。 在一个实施例中,所述进程的所述线程用于在所述进程出现运行错误时,向所述本地管理器反馈故障报告。 在一个实施例中,所述本地管理器用于将所述进程的状态和/或所述故障报告发送至所述域管理器。 在一个实施例中,所述域管理器用于当需要停止所述进程时,向所述本地管理器发送停止消息,所述本地管理器进一步用于向所述进程的所述线程转发所述停止消息,以使得所述线程根据所述停止消息来停止所述进程。 根据本专利技术的第二方面,还提出了一种用于计算机系统的故障恢复装置,其中,所述计算机系统中包括用于管理所述计算机系统与外部设备之间的消息通讯的会话管理进程以及用于对所述外部设备的访问请求进行处理的数据处理进程,包括:第一装置,用于比较由所述数据处理进程发送给所述会话管理进程的第一消息与所述数据处理进程生成的包含数据处理结果的第二消息的消息标识,其中,所述第一消息是基于所述第二消息生成的;以及第二装置,用于在所述第一消息与所述第二消息的消息标识不一致的情况下,基于所述第二消息来同步所述第一消息。 在一个实施例中,所述装置还包括:第三装置,用于比较由所述会话管理进程发送给所述数据处理进程的第三消息与所述第一消息的消息标识,其中,所述第三消息接收自所述外部设备且包含所述访问请求;以及第四装置,用于在所述第一消息与所述第三消息的消息标识不一致的情况下,基于所述第三消息来同步所述第一消息。 在一个实施例中,还包括:消息数据库,用于在生成或接收到消息时,将所述消息记录其中;并用于在同步所述消息时,基于所述消息的消息标识来提供对应的消息。 在一个实施例中,还包括:第五装置,用于检测运行错误的进程数量;以及第六装置,用于如果单个进程错误,则重启所述进程,如果有多个进程错误,则执行所述消息比较和同步的步骤。 在一个实施例中,所述计算机系统包括:至少一个本地管理器,用于对进程进行管理,其中所述进程配置有线程;以及域管理器,其与所述至少一个本地管理器耦合,用于管理所述至少一个本地管理器及其进程,并通过与所述进程相关联的线程通信以监控所述进程的状态。 在一个实施例中,还包括:第七装置,用于检测运行错误的类型;以及第八装置,用于如果所述运行错误为软件错误,则执行所述检测运行错误的进程数量的步骤;如果所述运行错误为硬件错误,则更换运行所述进程的硬件设备。 在一个实施例中,所述进程的所述线程用于在所述进程出现运行错误时,向所述本地管理器反馈故障报告。 在一个实施例中,所述本地管理器用于将所述进程的状态和/或所述故障报告发送至所述域管理器。 在一个实施例中,所述域管理器用于当需要停止所述进程时,向所述本地管理器发送停止消息,所述本地管理器进一步用于向所述进程的所述线程转发所述停止消息,以使得所述线程根据所述停止消息来停止所述进程。 上文已经概括而非宽泛地给出了本
技术实现思路
的特征。本
技术实现思路
的附加特本文档来自技高网
...
一种用于计算机系统的故障恢复方法及装置

【技术保护点】
一种用于计算机系统的故障恢复方法,其中,所述计算机系统中包括用于管理所述计算机系统与外部设备之间的消息通讯的会话管理进程以及用于对所述外部设备的访问请求进行处理的数据处理进程,其特征在于,所述故障恢复方法包括:a.比较由所述数据处理进程发送给所述会话管理进程的第一消息与所述数据处理进程生成的包含数据处理结果的第二消息的消息标识,其中,所述第一消息是基于所述第二消息生成的;以及b.在所述第一消息与所述第二消息的消息标识不一致的情况下,基于所述第二消息来同步所述第一消息。

【技术特征摘要】

【专利技术属性】
技术研发人员:王垚俞森李国荣
申请(专利权)人:中国外汇交易中心
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1