The invention provides a system, apparatus and method for fault simulation in distributed system, the method comprises: receiving the access request; from the received access request in the selected predetermined specific access rules for fault simulation; for the particular access request, fault simulation in distributed system. According to the method and device of this application, this application can effectively control the scope of the fault influence and the application can be directly implemented in real business environment, so as to effectively save the operation and maintenance cost of building independent test environment.
【技术实现步骤摘要】
一种在分布式系统进行故障模拟的系统、装置及方法
本申请涉及计算机领域,尤其涉及一种在分布式系统进行故障模拟的系统、装置及方法。
技术介绍
分布式系统通常包括多个应用组件(或称多个子系统),经常会有一些应用组件发生故障。为了解决这些故障,现有技术通常会在独立的测试环境中模拟一些故障,以通过度量分布式系统在模拟故障下的表现来确定解决所模拟故障的方案,从而将该方案用于解决真实业务环境下的故障。现有技术中,为了度量分布式系统在故障下的表现,通常模拟的是服务器集群级别的故障,此类故障对真实业务环境容易造成很大的影响。为了避免此类大的影响,需要搭建与真实业务环境隔离的测试环境来进行故障的模拟,这一方面需要耗费较大的运维成本,另一方面在隔离的测试环境下进行故障模拟,所得到的系统的表现结果并不一定与真实业务环境下系统的真实结果相符,从而不利于获得切实可行的用于解决实际故障的方案。
技术实现思路
本申请的一个目的是有效控制在分布式系统上模拟故障的影响范围。根据本申请的一个实施例,提供了一种在分布式系统进行故障模拟的系统,包括分布式系统外的故障控制端和分布式系统中的故障模拟装置,所述故障控制端,用于接收预先配置的故障模拟规则并将所述故障模拟规则发送至所述故障模拟装置,其中该故障模拟规则用于指示故障模拟装置针对符合该故障模拟规则的访问请求进行故障模拟;所述故障模拟装置,用于接收访问请求以及来自故障控制端的故障模拟规则,从所述访问请求中筛选出符合预定故障模拟规则预定故障模拟规则的特定访问请求,针对该特定访问请求在分布式系统上进行故障模拟。根据本申请的一个实施例,提供了在分布式系统进行 ...
【技术保护点】
一种在分布式系统进行故障模拟的系统,其特征在于,包括分布式系统外的故障控制端和分布式系统中的故障模拟装置,所述故障控制端,用于接收预先配置的故障模拟规则并将所述故障模拟规则发送至所述故障模拟装置,其中该故障模拟规则用于指示故障模拟装置针对符合该故障模拟规则的访问请求进行故障模拟;所述故障模拟装置,用于接收访问请求以及来自故障控制端的故障模拟规则,从所述访问请求中筛选出符合预定故障模拟规则预定故障模拟规则的特定访问请求,针对该特定访问请求在分布式系统上进行故障模拟。
【技术特征摘要】
1.一种在分布式系统进行故障模拟的系统,其特征在于,包括分布式系统外的故障控制端和分布式系统中的故障模拟装置,所述故障控制端,用于接收预先配置的故障模拟规则并将所述故障模拟规则发送至所述故障模拟装置,其中该故障模拟规则用于指示故障模拟装置针对符合该故障模拟规则的访问请求进行故障模拟;所述故障模拟装置,用于接收访问请求以及来自故障控制端的故障模拟规则,从所述访问请求中筛选出符合预定故障模拟规则预定故障模拟规则的特定访问请求,针对该特定访问请求在分布式系统上进行故障模拟。2.一种在分布式系统进行故障模拟的系统,其特征在于,包括分布式系统中的故障控制端和分布式系统中的故障模拟装置,所述故障控制端,用于接收预先配置的故障模拟规则并将所述故障模拟规则发送至所述故障模拟装置,其中该故障模拟规则用于指示故障模拟装置针对符合该故障模拟规则的访问请求进行故障模拟;所述故障模拟装置,用于接收访问请求以及来自故障控制端的故障模拟规则,从所述访问请求中筛选出符合预定故障模拟规则预定故障模拟规则的特定访问请求,针对该特定访问请求在分布式系统上进行故障模拟。3.一种故障控制方法,其特征在于,该方法包括:接收预先配置的故障模拟规则,其中该故障模拟规则用于指示分布式系统的故障模拟装置针对符合该故障模拟规则的访问请求进行故障模拟;将所配置好的故障模拟规则发送至分布式系统,以使该分布式系统的故障模拟装置基于该故障模拟规则进行故障模拟。4.根据权利要求3所述的故障控制方法,其特征在于,所述预定故障模拟规则包括至少一个条件,故障模拟规则用于指示分布式系统针对符合该故障模拟规则至少一个条件的访问请求进行故障模拟。5.根据权利要求4所述的故障控制方法,其特征在于,还包括:接收来自分布式系统发送的故障模拟反馈信息;响应于接收到清除故障模拟规则中至少一个条件的指令,向反馈故障模拟信息的分布式系统发送特定信息,该特定信息用于指示该分布式系统的故障模拟装置针对符合该被清除的至少一个条件的访问请求不再进行故障模拟。6.根据权利要求5所述的故障控制方法,其特征在于,所述针对符合该被清除的至少一个条件的访问请求不再进行故障模拟包括:针对符合该被清除的至少一个条件且不符合未被清除的条件的访问请求不再进行故障模拟。7.一种在分布式系统进行故障模拟的方法,其特征在于,该方法包括以下步骤:接收访问请求;从所接收的访问请求中筛选出符合预定故障模拟规则的特定访问请求;针对所述特定访问请求,在分布式系统上进行故障模拟。8.根据权利要求7所述的方法,其特征在于,所述预定故障模拟规则包括至少一个条件,所述从所接收的访问请求中筛选出符合预定故障模拟规则的特定访问请求的步骤包括:从所接收的访问请求中筛选出符合预定故障模拟规则至少一个条件的特定访问请求。9.根据权利要求7所述的方法,其特征在于,所述从所接收的访问请求中筛选出符合预定故障模拟规则的特定访问请求的步骤包括:判断所接收的访问请求中是否存在其访问的应用程序的名称被包含于预定故障模拟规则中设定的应用程序名称集合的特定访问请求;如果存在,则筛选出该特定访问请求。10.根据权利要求7所述的方法,其特征在于,所述从所接收的访问请求中筛选出符合预定故障模拟规则的特定访问请求的步骤包括:判断所接收的访问请求中是否存在其访问的网页链接地址被包含于预定故障模拟规则中设定的网页链接地址集合的特定访问请求;如果存在,则筛选出该特定访问请求。11.根据权利要求8-10任一项所述的方法,其特征在于,所述从所接收的访问请求中筛选出符合预定故障模拟规则的特定访问请求的步骤还包括:获取发出所述特定访问请求的用户的特征信息;滤掉其用户的特征信息未被包含于所述设定的用户特征信息集中的特定访问请求。12.根据权利要求8所述的方法,其特征在于,所述预定故障模拟规则中的每一个条件与特定类型的待模拟故障对应,所述针对所述特定访问请求,在分布式系统上进行故障模拟包括:针对符合所述至少一个条件的特定访问请求,在分布式系统上进行与该至少一个条件对应的特定类型的待模拟故障的模拟。13.根据权利要求7所述的方法,其特征在于,所述在分布式系统上进行故障模拟具体包括:于预设时段或/和预设条件下在分布式系统上进行故障模拟。14.根据权利要求13所述的方法,其特征在于,所述预设条件包括:所述分布式系统所接收到的访问的总流量超过预设阈值,或/和分布式系统的资源消耗超过预设阈值。15.根据权利要求7所述的方法,其特征在于,在所述从所接收的访问请求中筛选出符合预定故障模拟规则的特定访问请求的步骤之前还包括:接收预先设置的故障模拟规则,或从所接收的访问请求中解析得到故障模拟规则。16.根据权利要求8所述的方法,其特征在于,在所述从所接收的访问请求中筛选出符合...
【专利技术属性】
技术研发人员:周洋,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。