一种故障处理、分析故障的影响面方法和设备技术

技术编号:15639108 阅读:51 留言:0更新日期:2017-06-15 21:26
本申请公开了一种故障处理、分析故障的影响面方法和设备,包括:获取日志信息,并确定日志信息中包含用于检测系统是否发生故障的第一数据和用于分析发生故障所产生故障影响面的第二数据;对所述日志信息中包含的第一数据进行异常检测,并在根据异常检测结果确定系统发生故障时,查找与第一数据对应的第二数据;根据第二数据,确定用于处理所述故障的策略,并利用策略,处理故障。这样能够快速获取于分析发生故障所产生的故障影响面的数据,进而有效地根据得到的故障影响面对故障进行处理,提高故障处理效率。

【技术实现步骤摘要】
一种故障处理、分析故障的影响面方法和设备
本申请涉及互联网信息处理
,尤其涉及一种故障处理、分析故障的影响面方法和设备。
技术介绍
随着互联网技术的发展,互联网平台的建立越来越完善,给人们的生产和生活带来了极大的便利。然而,一旦互联网平台发生故障,将对用户/业务产生一定的影响。因此,分析故障的影响面成为处理故障的重要依据。所谓故障的影响面是指故障发生时所影响到的用户数量/业务数量。经研究发展,目前,分析故障的影响面所采取的方式主要包括两种:第一种方式:在故障发生时,访问服务器,通过脚本的方式查询服务器中的日志信息,根据日志信息对目前发生的故障所产生的影响面进行分析,以得到目前发生的故障所产生的影响面数据。针对第一种方式,在实际应用中,一旦接收到故障告警,多数通过人工方式查询相关日志信息,分析故障所产生的影响面,但是这种方式的缺点在于:效率比较低,同时成本要求比较高,无法满足现实需要。第二种方式:针对发生的故障,搜索与发生的故障相关的日志信息;利用大数据分析平台对搜索到的日志信息进行离线分析,以得到发生的故障所产生的影响面数据。针对第二种方式,在实际应用中,通常将日志信息上传至云服务器中,利用开放数据处理服务(英文:OpenDataProcessingService;缩写:ODPS)采用离线的方式对日志信息进行分析,得到故障所产生的影响面,但是这种方式的缺点在于:实时性比较差,在适用时无法满足实际需要。由于目前用于分析故障的影响面的方式存在各种各样的缺陷,使得在故障发生时,无法及时准确定位该故障所造成的影响范围,进而导致确定的用于处理故障的方式不够精确,使得故障处理效率较低。
技术实现思路
有鉴于此,本申请实施例提供了一种故障处理、分析故障的影响面方法和设备,用于解决现有技术中由于分析故障的影响面的方式存在缺陷导致故障处理效率比较低的问题。一种故障处理方法,包括:获取日志信息,并确定所述日志信息中包含用于检测系统是否发生故障的第一数据和用于分析发生故障所产生故障影响面的第二数据;对所述日志信息中包含的所述第一数据进行异常检测,并在根据异常检测结果确定系统发生故障时,查找与所述第一数据对应的第二数据;根据所述第二数据,确定用于处理所述故障的策略,并利用所述策略,处理所述故障。一种分析故障的影响面的方法,包括:采集日志信息;利用日志解析规则对所述日志信息进行解析,确定出所述日志信息中包含的用于检测系统是否发生故障的第一数据与至少一个用于分析发生故障所产生故障影响面的第二数据;对所述日志信息中包含的所述第一数据进行异常检测,并在根据异常检测结果确定系统发生故障时,根据所述日志信息中包含的至少一个所述第二数据,分析系统发生故障所产生的故障影响面。一种故障处理设备,包括:获取单元,用于获取日志信息,并确定所述日志信息中包含用于检测系统是否发生故障的第一数据和用于分析发生故障所产生故障影响面的第二数据;查找单元,用于对所述日志信息中包含的所述第一数据进行异常检测,并在根据异常检测结果确定系统发生故障时,查找与所述第一数据对应的第二数据;处理单元,用于根据所述第二数据,确定用于处理所述故障的策略,并利用所述策略,处理所述故障。一种分析故障的影响面设备,包括:采集单元,用于采集日志信息;确定单元,用于利用日志解析规则对所述日志信息进行解析,确定出所述日志信息中包含的用于检测系统是否发生故障的第一数据与至少一个用于分析发生故障所产生故障影响面的第二数据;分析单元,用于对所述日志信息中包含的所述第一数据进行异常检测,并在根据异常检测结果确定系统发生故障时,根据所述日志信息中包含的至少一个所述第二数据,分析系统发生故障所产生的故障影响面。本申请有益效果如下:本申请实施例获取日志信息,并确定所述日志信息中包含用于检测系统是否发生故障的第一数据和用于分析发生故障所产生故障影响面的第二数据;对所述日志信息中包含的所述第一数据进行异常检测,并在根据异常检测结果确定系统发生故障时,查找与所述第一数据对应的第二数据;根据所述第二数据,确定用于处理所述故障的策略,并利用所述策略,处理所述故障。通过本申请实施例的方案,对产生的日志信息进行分析,确定日志信息中包含的用于分析发生故障所产生的故障影响面的数据,一旦在对日志信息中用于检测系统是否发生故障的数据进行异常检测时确定系统发生故障时,能够快速获取于分析发生故障所产生的故障影响面的数据,进而有效地根据得到的故障影响面对故障进行处理,提高故障处理效率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种故障处理方法的流程示意图;图2为本申请实施例提供的一种分析故障的影响面的方法的流程示意图;图3为本申请实施例提供的一种故障处理设备的结构示意图;图4为本申请实施例提供的一种分析故障的影响面设备的结构示意图;图5为本申请实施例提供的一种故障处理系统的结构示意图。具体实施方式为了实现本申请的目的,本申请实施例提供了一种故障处理、分析故障的影响面方法和设备,获取日志信息,并确定所述日志信息中包含用于检测系统是否发生故障的第一数据和用于分析发生故障所产生故障影响面的第二数据;对所述日志信息中包含的所述第一数据进行异常检测,并在根据异常检测结果确定系统发生故障时,查找与所述第一数据对应的第二数据;根据所述第二数据,确定用于处理所述故障的策略,并利用所述策略,处理所述故障。通过本申请实施例的方案,对产生的日志信息进行分析,确定日志信息中包含的用于分析发生故障所产生的故障影响面的数据,一旦在对日志信息中用于检测系统是否发生故障的数据进行异常检测时确定系统发生故障时,能够快速获取于分析发生故障所产生的故障影响面的数据,进而有效地根据得到的故障影响面对故障进行处理,提高故障处理效率。下面结合说明书附图对本申请各个实施例作进一步地详细描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。图1为本申请实施例提供的一种故障处理方法的流程示意图。所述方法可以如下所示。步骤101:获取日志信息。在步骤101中,通过日志采集设备获取实时产生的日志信息。可选地,以分钟级为时间周期,周期性地采集日志信息。步骤102:确定所述日志信息中包含用于检测系统是否发生故障的第一数据和用于分析发生故障所产生故障影响面的第二数据。在步骤102中,首先,对于采集设备获取到的日志信息,将该日志信息同步至处理设备中。其次,由处理设备将该日志信息发送给流式计算框架,由流式计算框架采用流式计算方式分析得到所述日志信息中包含用于检测系统是否发生故障的第一数据和用于分析发生故障所产生故障影响面的第二数据。具体地,利用日志解析规则对所述日志信息进行解析,确定出所述日志信息中包含的用于检测系统是否发生故障的第一数据与至少一个用于分析发生故障所产生故障影响面的第二数据。其中,本文档来自技高网
...
一种故障处理、分析故障的影响面方法和设备

【技术保护点】
一种故障处理方法,其特征在于,包括:获取日志信息,并确定所述日志信息中包含用于检测系统是否发生故障的第一数据和用于分析发生故障所产生故障影响面的第二数据;对所述日志信息中包含的所述第一数据进行异常检测,并在根据异常检测结果确定系统发生故障时,查找与所述第一数据对应的第二数据;根据所述第二数据,确定用于处理所述故障的策略,并利用所述策略,处理所述故障。

【技术特征摘要】
1.一种故障处理方法,其特征在于,包括:获取日志信息,并确定所述日志信息中包含用于检测系统是否发生故障的第一数据和用于分析发生故障所产生故障影响面的第二数据;对所述日志信息中包含的所述第一数据进行异常检测,并在根据异常检测结果确定系统发生故障时,查找与所述第一数据对应的第二数据;根据所述第二数据,确定用于处理所述故障的策略,并利用所述策略,处理所述故障。2.如权利要求1所述的故障处理方法,其特征在于,确定所述日志信息中包含用于检测系统是否发生故障的第一数据和用于分析发生故障所产生故障影响面的第二数据,包括:利用日志解析规则对所述日志信息进行解析,确定出所述日志信息中包含的用于检测系统是否发生故障的第一数据与至少一个用于分析发生故障所产生故障影响面的第二数据;所述方法还包括:建立用于检测系统是否发生故障的第一数据与至少一个用于分析发生故障所产生故障影响面的第二数据之间的对应关系,并将所述对应关系存储至数据库中。3.如权利要求2所述的故障处理方法,其特征在于,建立用于检测系统是否发生故障的数据与至少一个用于分析发生故障所产生故障影响面的数据之间的对应关系,包括:确定用于检测系统是否发生故障的第一数据的第一键值,其中,所述第一键值包含所述日志解析规则的标识、所述日志信息的产生时间;确定每一个用于分析发生故障所产生故障影响面的第二数据的第二键值,其中,所述第二键值包含所述日志解析规则的标识、所述日志信息的产生时间以及所述日志信息的标识;建立包含所述第一键值的用于检测系统是否发生故障的第一数据与包含所述第二键值的用于分析发生故障所产生故障影响面的第二数据的第二键值之间的对应关系。4.如权利要求2或3所述的故障处理方法,其特征在于,查找与所述第一数据对应的第二数据,包括:根据所述第一数据和所述数据库中存储的所述对应关系,从所述数据库中查找到与所述第一数据对应的所述第二数据。5.如权利要求1至4任一项所述的故障处理方法,其特征在于,获取日志信息,包括:以分钟级为时间周期,周期性地采集日志信息。6.一种分析故障的影响面方法,其特征在于,包括:采集日志信息;利用日志解析规则对所述日志信息进行解析,确定出所述日志信息中包含的用于检测系统是否发生故障的第一数据与至少一个用于分析发生故障所产生故障影响面的第二数据;对所述日志信息中包含的所述第一数据进行异常检测,并在根据异常检测结果确定系统发生故障时,根据所述日志信息中包含的至少一个所述第二数据,分析系统发生故障所产生的故障影响面。7.一种故障处理设备,其特征在于,包括:获取单元,用于获取日志信息,并确定所述日志信息中包含用...

【专利技术属性】
技术研发人员:朱旭光杜炼程磊
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1