故障场景的模拟方法及装置制造方法及图纸

技术编号:28034525 阅读:10 留言:0更新日期:2021-04-09 23:16
本发明专利技术公开了一种故障场景的模拟方法及装置,涉及人工智能领域,其中,该方法包括:获取服务系统的监控数据,监控数据包括:应用服务信息和系统资源信息;根据预先设置的识别模型识别获取的应用服务信息和系统资源信息中异常时间段,其中,识别模型基于历史监控数据来构建,历史监控数据包括:历史应用服务信息和历史系统资源信息;根据识别的异常时间段中的系统资源信息生成故障场景,故障场景包括:来源于异常时间段中的系统资源信息的至少一个异常指标;根据故障场景对模拟服务系统进行故障场景模拟操作。通过本发明专利技术,可以精确模拟实际的故障场景。

【技术实现步骤摘要】
故障场景的模拟方法及装置
本专利技术涉及人工智能领域,具体涉及一种故障场景的模拟方法及装置。
技术介绍
随着互联网的普及,互联网用户的急速增长,传统的单体应用系统已经无法满足日益增长的用户压力对系统容量及高可用的需求。通过对单体应用改造为分布式服务模式,能有效的解决不断增长的系统压力,这一点已经在多家互联网公司的商品大促中得到验证。分布式应用架构及基础设施的复杂性相较于传统的单一主机应用大大增加,系统中任何地方都可能出错,各种不可预测的突发事件无可避免,如果想减少问题,只能让问题更多频次地暴露,找到问题所在并解决,提升系统容错性。混沌故障演练就是用于这类场景的技术,利用实验,提前探知系统风险,通过架构优化和运维模式的改进来解决系统风险,真正实现高可用高韧性的分布式架构,降低企业损失的风险。然而,目前业界常见的故障演练工具仅提供了基本的故障模拟机制,针对单一的系统指标进行模拟,缺乏对实际场景的模拟能力,并且指标模拟的精确性也较差。
技术实现思路
有鉴于此,本专利技术提供一种故障场景的模拟方法及装置,以解决上述提及的至少一个问题。根据本专利技术的第一方面,提供一种故障场景的模拟方法,所述方法包括:获取服务系统的监控数据,所述监控数据包括:应用服务信息和系统资源信息;根据预先设置的识别模型识别获取的所述应用服务信息和系统资源信息中异常时间段,其中,所述识别模型基于历史监控数据来构建,所述历史监控数据包括:历史应用服务信息和历史系统资源信息;根据识别的异常时间段中的系统资源信息生成故障场景,所述故障场景包括:来源于所述异常时间段中的系统资源信息的至少一个异常指标;根据所述故障场景对模拟服务系统进行故障场景模拟操作。根据本专利技术的第二方面,提供一种故障场景的模拟装置,所述装置包括:信息监控单元,用于获取服务系统的监控数据,所述监控数据包括:应用服务信息和系统资源信息;异常识别单元,用于根据预先设置的识别模型识别获取的所述应用服务信息和系统资源信息中的异常时间段,其中,所述识别模型基于历史监控数据来构建,所述历史监控数据包括:历史应用服务信息和历史系统资源信息;故障场景生成单元,用于根据识别的异常时间段中的系统资源信息生成故障场景,所述故障场景包括:来源于所述异常时间段中的系统资源信息的至少一个异常指标;故障场景模拟单元,用于根据所述故障场景对模拟服务系统进行故障场景模拟操作。根据本专利技术的第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法的步骤。根据本专利技术的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。由上述技术方案可知,通过根据识别模型对获取的应用服务信息和系统资源信息进行分析,识别出异常时间段,之后根据识别的异常时间段中的系统资源信息生成故障场景,并根据故障场景对模拟服务系统进行故障场景模拟操作,相比于现有技术中的单一系统指标模拟方案,本专利技术实施例的故障场景融合了多种异常指标,因而可以精确模拟实际的故障场景。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本专利技术实施例的故障场景的模拟方法的流程图;图2是根据本专利技术实施例的故障场景的模拟装置的结构框图;图3是根据本专利技术实施例的基于AI的Linux内核进程组控制的故障演练装置系统;图4是根据本专利技术实施例的服务监控装置1的结构框图;图5是根据本专利技术实施例的系统监控装置2的结构框图;图6是根据本专利技术实施例的AI运维分析装置3的结构框图;图7是根据本专利技术实施例的故障演练编排装置4的结构框图;图8是根据本专利技术实施例的故障演练实施装置5的结构框图;图9为本专利技术实施例的电子设备600的系统构成的示意框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。由于目前的故障演练工具仅提供了基本的故障模拟机制,针对单一的系统指标进行模拟,缺乏对实际场景的模拟能力,并且指标模拟的精确性也较差。基于此,本专利技术实施例提供一种故障场景的模拟方案,通过该方案,可以针对生产实际故障场景进行精确模拟。以下结合附图来详细描述本专利技术实施例。图1是根据本专利技术实施例的故障场景的模拟方法的流程图,如图1所示,该方法包括:步骤101,获取服务系统的应用服务信息和系统资源信息。这里的应用服务信息可以包括:服务成功率(即,应用服务请求或者任务执行成功的概率)、吞吐量(即,系统在单位时间内处理请求的数量)、响应时间(即,应用服务处理一个请求或一个任务的耗时)等。系统资源信息可以包括:CPU(CentralProcessingUnit,中央处理器)使用率、内存使用率、IO(Input/output,输入输出量),IO可以是如IOPS(Input/outputPerSecond,每秒的输入输出量)等。步骤102,根据预先设置的识别模型识别获取的所述应用服务信息和系统资源信息中的异常时间段。其中,所述识别模型基于历史监控数据来构建和训练,所述历史监控数据包括:历史应用服务信息和历史系统资源信息。根据历史监控数据中的异常时间段,来训练该识别模型。具体地训练过程,可以参见如下的识别模型识别异常时间段的描述。步骤103,根据识别的异常时间段中的系统资源信息生成故障场景,所述系统资源信息包括:至少一个异常指标,例如,CPU异常指标、内存异常指标、IO异常指标等。步骤104,根据所述故障场景对模拟服务系统进行故障场景模拟操作。这里的故障场景模拟操作可以包括如下至少之一:CPU故障场景模拟操作、内存故障场景模拟操作、IO(Inputoutput,输入输出)故障场景模拟操作。通过根据识别模型识别获取的应用服务信息和系统资源信息中的异常时间段,之后根据识别的异常时间段中的系统资源信息生成故障场景,并根据故障场景对模拟服务系统进行故障场景模拟操作,相比于现有技术中的单一系统指标模拟方案,本专利技术实施例的故障场景融合了多种异常指标,因而可以精确模拟实际的故障场景。对于上述步骤102,可以先根据预先设置的识别模型对获取的所述应用服务信息和系统资源信息进行分类;之后根据预定规则对分类后的信息进行分析操作,并根据分析结果识别异常时间段。在实际操作中,应本文档来自技高网...

【技术保护点】
1.一种故障场景的模拟方法,其特征在于,所述方法包括:/n获取服务系统的监控数据,所述监控数据包括:应用服务信息和系统资源信息;/n根据预先设置的识别模型识别获取的所述应用服务信息和系统资源信息中异常时间段,其中,所述识别模型基于历史监控数据来构建,所述历史监控数据包括:历史应用服务信息和历史系统资源信息;/n根据识别的异常时间段中的系统资源信息生成故障场景,所述故障场景包括:来源于所述异常时间段中的系统资源信息的至少一个异常指标;/n根据所述故障场景对模拟服务系统进行故障场景模拟操作。/n

【技术特征摘要】
1.一种故障场景的模拟方法,其特征在于,所述方法包括:
获取服务系统的监控数据,所述监控数据包括:应用服务信息和系统资源信息;
根据预先设置的识别模型识别获取的所述应用服务信息和系统资源信息中异常时间段,其中,所述识别模型基于历史监控数据来构建,所述历史监控数据包括:历史应用服务信息和历史系统资源信息;
根据识别的异常时间段中的系统资源信息生成故障场景,所述故障场景包括:来源于所述异常时间段中的系统资源信息的至少一个异常指标;
根据所述故障场景对模拟服务系统进行故障场景模拟操作。


2.根据权利要求1所述的方法,其特征在于,根据预先设置的识别模型识别获取的所述应用服务信息和系统资源信息中的异常时间段包括:
根据预先设置的识别模型对获取的所述应用服务信息和系统资源信息进行分类;
根据预定规则对分类后的信息进行分析操作,并根据分析结果识别异常时间段。


3.根据权利要求2所述的方法,其特征在于,根据预定规则对分类后的信息进行分析操作包括:
当所述分类后的信息属于平稳型数据时,根据预设的阈值对分类后的信息进行分析操作;
当所述分类后的信息属于周期型数据时,基于监督学习方式对分类后的信息进行分析操作。


4.根据权利要求1所述的方法,其特征在于,根据识别的异常时间段中的系统资源信息生成故障场景包括:
根据识别的异常时间段中的系统资源信息确定至少一个异常指标;
将所述至少一个异常指标进行组合操作生成故障场景。


5.根据权利要求1所述的方法,其特征在于,所述故障场景模拟操作包括如下至少之一:
中央处理器CPU故障场景模拟操作、内存故障场景模拟操作、输入输出IO故障场景模拟操作。


6.根据...

【专利技术属性】
技术研发人员:易辛悦王炳辉陈兴马曙晖
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1