【技术实现步骤摘要】
软件系统的故障恢复方法及装置
本申请涉及软件系统故障处理领域,具体而言,涉及一种软件系统的故障恢复方法及装置。
技术介绍
随着应用场景、配置环境复杂的增加,嵌入式设备的软件系统也越来越复杂,即使在进行大量测试验证后,仍然存在系统故障的风险。在生产环境下,用户希望系统异常尽可能的不影响业务,同时希望软件能持续改进,避免后续再有相同的问题出现。目前,通常使用硬件看门狗机制将软件系统从故障中恢复。具体技术方案为:在系统外部增加一个硬件看门狗,软件系统通过特定的总线协议定时向硬件看门狗发送心跳信号。硬件看门狗如果超过预设的时间没有收到软件系统发送心跳信号,就会复位硬件设备使软件系统从故障中恢复。这种方式确实能够实现快速故障恢复,但由于软件系统是被外部硬件复位的,软件系无法保留系统异常信息,不利于进一步定位故障原因,在相同的配置和部署环境下,很容易再次出现相同的问题。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种软件系统的故障恢复方法及装置,以至少解决由于 ...
【技术保护点】
1.一种软件系统的故障恢复方法,其特征在于,包括:/n启动第一目标监控应用;/n检测软件系统中的应用程序定时向所述第一目标监控应用发送的第一心跳信号;/n如果所述应用程序发送所述第一心跳信号的超时时间超过第一预设时长,检测所述应用程序发生的故障的类型;/n依据所述故障的类型确定所述软件系统的故障恢复方式。/n
【技术特征摘要】
1.一种软件系统的故障恢复方法,其特征在于,包括:
启动第一目标监控应用;
检测软件系统中的应用程序定时向所述第一目标监控应用发送的第一心跳信号;
如果所述应用程序发送所述第一心跳信号的超时时间超过第一预设时长,检测所述应用程序发生的故障的类型;
依据所述故障的类型确定所述软件系统的故障恢复方式。
2.根据权利要求1所述的方法,其特征在于,所述第一预设时长是所述第一目标监控应用依据所述软件系统的负载情况设定的。
3.根据权利要求1所述的方法,其特征在于,所述故障的类型至少包括:导致所述应用程序无法重启的致命故障以及不会导致所述应用程序重启的非致命故障。
4.根据权利要求3所述的方法,其特征在于,依据所述故障的类型确定所述软件系统的故障恢复方式,包括:
如果所述故障的类型为所述致命故障,利用所述第一目标监控应用收集所述软件系统当前的异常信息;
收集所述异常信息结束后,利用所述第一目标监控应用重启所述软件系统。
5.根据权利要求3所述的方法,其特征在于,依据所述故障的类型确定所述软件系统的故障恢复方式,还包括:
如果所述故障的类型为所述非致命故障,利用所述第一目标监控应用收集所述软件系统当前的异常信息,并且在不重启所述软件系统的情况下重新运行一个新的...
【专利技术属性】
技术研发人员:许逢陪,杨华,
申请(专利权)人:山石网科通信技术股份有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。