故障注入系统和故障注入方法技术方案

技术编号:25004905 阅读:119 留言:0更新日期:2020-07-24 18:04
本发明专利技术提供了一种用于软件系统(200)的故障注入系统(300),其中所述软件系统包括可执行命令(command,CMD)、所述命令(command,CMD)生成的事件(event,E)和表示两个事件(event,E)之间的状态机的状态的状态(state,S)。故障注入规则数据库(350)用于提供用于注入选定故障的规则,所述规则在选定命令、发生故障注入的选定状态和发生故障注入的条件出现时提供故障注入决策。估计器模块(330)用于根据预测时间模型确定与执行所述选定命令相关的所述选定状态出现时间,并提供状态的持续时间作为故障注入的时间区间。注入器模块(360)用于执行所述选定命令并在所述时间区间内注入所述选定故障。

【技术实现步骤摘要】
【国外来华专利技术】故障注入系统和故障注入方法
本专利技术涉及一种故障注入系统、故障注入方法及计算机程序。具体地,本专利技术涉及使用基于时间估计的状态驱动故障注入。
技术介绍
本专利技术涉及软件实现的故障注入(SoftwareImplementedFaultInjection,SWIFI)系统,尤其涉及大规模分布式系统中的故障注入。现有的SWIFI系统大多无法精确判断故障是在分布式系统的哪种状态下注入的。即使在所述SWIFI系统通过分析事件精确注入故障的情况下,这种系统在状态识别到实际故障注入之间的延迟仍然很高。现有的SWIFI系统存在以下限制之一。故障随机注入运行中的分布式系统。事件识别、分布式系统访问、故障注入之间的延迟形成了一个盲点,在此期间无法将故障注入分布式系统。随着社会越来越依赖复杂的软件系统,大型分布式系统(例如云平台)的可靠性和恢复能力正变得越来越重要。云计算正变得与其它已建立的公用设施(例如水和电)一样重要。支持云平台的新型软件系统极其复杂,需要具备恢复能力和可靠性工程的新方法。大规模云平台的复杂性和动态性要求自动化解决方案来降低本文档来自技高网...

【技术保护点】
1.一种用于软件系统(100)的故障注入系统,其特征在于,所述软件系统包括可执行命令(command,CMD)、所述命令(command,CMD)生成的事件(event,E)和表示两个事件(event,E)之间的状态机的状态的状态(state,S),/n所述故障注入系统包括:/n故障注入规则数据库(120、350),所述故障注入规则数据库(120、350)用于提供用于注入选定故障的规则,所述规则在选定命令、发生故障注入的选定状态和发生故障注入的条件出现时提供故障注入决策。/n估计器模块(130、330),所述估计器模块(130、330)用于根据预测时间模型确定与执行所述选定命令相关的所述选定状...

【技术特征摘要】
【国外来华专利技术】1.一种用于软件系统(100)的故障注入系统,其特征在于,所述软件系统包括可执行命令(command,CMD)、所述命令(command,CMD)生成的事件(event,E)和表示两个事件(event,E)之间的状态机的状态的状态(state,S),
所述故障注入系统包括:
故障注入规则数据库(120、350),所述故障注入规则数据库(120、350)用于提供用于注入选定故障的规则,所述规则在选定命令、发生故障注入的选定状态和发生故障注入的条件出现时提供故障注入决策。
估计器模块(130、330),所述估计器模块(130、330)用于根据预测时间模型确定与执行所述选定命令相关的所述选定状态出现时间,并提供状态的持续时间作为故障注入的时间区间;
注入器模块(140、360),所述注入器模块(140、360)用于执行所述选定命令并在所述时间区间内注入所述选定故障。


2.根据权利要求1所述的故障注入系统,其特征在于,
所述规则包括以下公式:FORCOMMANDcONSTATES(EVENTm,EVENTn)CONDITIONSEQ(EVENTi,EVENTj……EVENTk)ACTIONINJECTFAULTt。


3.根据权利要求1或2所述的故障注入系统,其特征在于,还包括:
自举(bootstrap)模块(310),所述自举模块(310)用于执行命令,以确定通过所执行的命令生成的事件,并存储命令与事件之间的关系。


4.根据权利要求3所述的故障注入系统,其特征在于,
所述自举模块(310)用于执行所述命令多次。


5.根据权利要求3或4所述的故障注入系统,其特征在于,
所述自举模块(310)用于在执行所述命令时生成跟踪ID,并根据事件的匹配跟踪ID确定通过所执行的命令生成的事件。


6.根据权利要求1至5任一项所述的故障注入系统,其特征在于,
所述估计器模块(330)用于提供预测所述状态的出现和持续时间的预测时间模型,其中所述状态在第一事件的耗时之后发生,所述状态的持续时间从所述第一事件之后开始到第二事件之前结束,两个事件均源自同一命令,所述耗时基于从所述命令执行开始到所述事件结束的时间区间确定。


7.根据权利要求6所述的故障注入系统,其特征在于,
所述估计器模块(330)用于通过对事件进行切片以确定同一类型的事件,从而提供所述事件的耗时。


8.根据权利要求6或7所述的...

【专利技术属性】
技术研发人员:乔治·卡多索戈兹·布兰切
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1