一种在分布式系统进行故障模拟的系统、装置及方法制造方法及图纸

技术编号:17164848 阅读:24 留言:0更新日期:2018-02-01 22:23
本申请提供了一种在分布式系统进行故障模拟的系统、装置及方法,其方法包括:接收访问请求;从所接收的访问请求中筛选出符合预定故障模拟规则的特定访问请求;针对所述特定访问请求,在分布式系统上进行故障模拟。根据本申请的方法及装置,本申请可以有效地控制故障影响的范围并且由于本申请可以在真实的业务环境中直接实施,从而有效节省搭建独立测试环境所带来的运维成本。

A system, device and method for fault simulation in a distributed system

The invention provides a system, apparatus and method for fault simulation in distributed system, the method comprises: receiving the access request; from the received access request in the selected predetermined specific access rules for fault simulation; for the particular access request, fault simulation in distributed system. According to the method and device of this application, this application can effectively control the scope of the fault influence and the application can be directly implemented in real business environment, so as to effectively save the operation and maintenance cost of building independent test environment.

【技术实现步骤摘要】
一种在分布式系统进行故障模拟的系统、装置及方法
本申请涉及计算机领域,尤其涉及一种在分布式系统进行故障模拟的系统、装置及方法。
技术介绍
分布式系统通常包括多个应用组件(或称多个子系统),经常会有一些应用组件发生故障。为了解决这些故障,现有技术通常会在独立的测试环境中模拟一些故障,以通过度量分布式系统在模拟故障下的表现来确定解决所模拟故障的方案,从而将该方案用于解决真实业务环境下的故障。现有技术中,为了度量分布式系统在故障下的表现,通常模拟的是服务器集群级别的故障,此类故障对真实业务环境容易造成很大的影响。为了避免此类大的影响,需要搭建与真实业务环境隔离的测试环境来进行故障的模拟,这一方面需要耗费较大的运维成本,另一方面在隔离的测试环境下进行故障模拟,所得到的系统的表现结果并不一定与真实业务环境下系统的真实结果相符,从而不利于获得切实可行的用于解决实际故障的方案。
技术实现思路
本申请的一个目的是有效控制在分布式系统上模拟故障的影响范围。根据本申请的一个实施例,提供了一种在分布式系统进行故障模拟的系统,包括分布式系统外的故障控制端和分布式系统中的故障模拟装置,所述故障控制端,用于接收预先配置的故障模拟规则并将所述故障模拟规则发送至所述故障模拟装置,其中该故障模拟规则用于指示故障模拟装置针对符合该故障模拟规则的访问请求进行故障模拟;所述故障模拟装置,用于接收访问请求以及来自故障控制端的故障模拟规则,从所述访问请求中筛选出符合预定故障模拟规则预定故障模拟规则的特定访问请求,针对该特定访问请求在分布式系统上进行故障模拟。根据本申请的一个实施例,提供了在分布式系统进行故障模拟的系统,包括分布式系统中的故障控制端和分布式系统中的故障模拟装置,所述故障控制端,用于接收预先配置的故障模拟规则并将所述故障模拟规则发送至所述故障模拟装置,其中该故障模拟规则用于指示故障模拟装置针对符合该故障模拟规则的访问请求进行故障模拟;所述故障模拟装置,用于接收访问请求以及来自故障控制端的故障模拟规则,从所述访问请求中筛选出符合预定故障模拟规则预定故障模拟规则的特定访问请求,针对该特定访问请求在分布式系统上进行故障模拟。根据本申请的一个实施例,提供了一种故障控制方法,该方法包括:接收预先配置的故障模拟规则,其中该故障模拟规则用于指示分布式系统的故障模拟装置针对符合该故障模拟规则的访问请求进行故障模拟;将所配置好的故障模拟规则发送至分布式系统,以使该分布式系统的故障模拟装置基于该故障模拟规则进行故障模拟。根据本申请的一个实施例,提供了一种在分布式系统进行故障模拟的方法,该方法包括以下步骤:接收访问请求;从所接收的访问请求中筛选出符合预定故障模拟规则的特定访问请求;针对所述特定访问请求,在分布式系统上进行故障模拟。根据本申请的一个实施例,提供了一种故障控制装置,该装置包括:规则接收单元,用于接收预先配置的故障模拟规则,其中该故障模拟规则用于指示分布式系统的故障模拟装置针对符合该故障模拟规则的访问请求进行故障模拟;规则发送单元,用于将所述故障模拟规则发送至分布式系统,以使该分布式系统的故障模拟装置基于该故障模拟规则进行故障模拟。根据本申请的一个实施例,提供了一种在分布式系统进行故障模拟的装置,该装置包括:请求接收单元,用于接收访问请求;请求筛选单元,用于从所接收的访问请求中筛选出符合预定故障模拟规则预定故障模拟规则的特定访问请求;故障模拟单元,用于针对所述特定访问请求,在分布式系统上进行故障模拟。与现有技术相比,本申请的实施例具有以下优点:本申请的实施例通过将故障的影响范围控制在特定的访问请求,即从限定访问请求的新维度对故障影响的面或故障的粒度进行控制,也即当本申请应用到分布式系统,可以有效对分布式系统真实业务环境下的故障范围进行有效控制,从而较大地节省了搭建独立的测试环境所带来的运维成本。进而,由于本申请可以直接应用于分布式系统的真实业务环境而不需要单独搭建隔离环境进行故障模拟,从而因真实环境下的模拟,提升了模拟故障下系统表现结果的真实性,有利于为解决故障提供更真实的数据支撑。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1为本申请一个实施例的对本申请的在分布式系统进行故障模拟的系统进行描述的系统性框图;图2为本申请一个实施例的在分布式系统进行故障模拟的方法流程图;图3为本申请一个实施例的对图1中的步骤S102进行描述的流程图;图4为本申请一个实施例的进行故障模拟的分布式系统所包括的组件示意图;图5为本申请一个实施例的故障模拟的场景示意图;图6为本申请一个实施例的在分布式系统进行故障模拟的方法还包括的步骤的流程图;图7为本申请一个实施例的故障控制方法的流程图;图8为本申请一个实施例的故障控制方法还包括的步骤的流程图;图9为本申请一个实施例的在分布式系统进行故障模拟的装置的示意性框图;图10为本申请一个实施例的对图9中的单元102进行描述的示意图;图11为本申请一个实施例的在分布式系统进行故障模拟的装置还包括的单元的示意性框图;图12为本申请一个实施例的故障控制装置的示意性框图;图13为本申请一个实施例的故障控制装置还包括的单元的示意性框图;附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。所述计算机设备包括用户设备与网络设备。其中,所述用户设备包括但不限于电脑、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本申请,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本申请。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。需要说明的是,所述用户设备、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本申请,也应包含在本申请保护范围以内,并以引用方式包含于此。后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代本文档来自技高网...
一种在分布式系统进行故障模拟的系统、装置及方法

【技术保护点】
一种在分布式系统进行故障模拟的系统,其特征在于,包括分布式系统外的故障控制端和分布式系统中的故障模拟装置,所述故障控制端,用于接收预先配置的故障模拟规则并将所述故障模拟规则发送至所述故障模拟装置,其中该故障模拟规则用于指示故障模拟装置针对符合该故障模拟规则的访问请求进行故障模拟;所述故障模拟装置,用于接收访问请求以及来自故障控制端的故障模拟规则,从所述访问请求中筛选出符合预定故障模拟规则预定故障模拟规则的特定访问请求,针对该特定访问请求在分布式系统上进行故障模拟。

【技术特征摘要】
1.一种在分布式系统进行故障模拟的系统,其特征在于,包括分布式系统外的故障控制端和分布式系统中的故障模拟装置,所述故障控制端,用于接收预先配置的故障模拟规则并将所述故障模拟规则发送至所述故障模拟装置,其中该故障模拟规则用于指示故障模拟装置针对符合该故障模拟规则的访问请求进行故障模拟;所述故障模拟装置,用于接收访问请求以及来自故障控制端的故障模拟规则,从所述访问请求中筛选出符合预定故障模拟规则预定故障模拟规则的特定访问请求,针对该特定访问请求在分布式系统上进行故障模拟。2.一种在分布式系统进行故障模拟的系统,其特征在于,包括分布式系统中的故障控制端和分布式系统中的故障模拟装置,所述故障控制端,用于接收预先配置的故障模拟规则并将所述故障模拟规则发送至所述故障模拟装置,其中该故障模拟规则用于指示故障模拟装置针对符合该故障模拟规则的访问请求进行故障模拟;所述故障模拟装置,用于接收访问请求以及来自故障控制端的故障模拟规则,从所述访问请求中筛选出符合预定故障模拟规则预定故障模拟规则的特定访问请求,针对该特定访问请求在分布式系统上进行故障模拟。3.一种故障控制方法,其特征在于,该方法包括:接收预先配置的故障模拟规则,其中该故障模拟规则用于指示分布式系统的故障模拟装置针对符合该故障模拟规则的访问请求进行故障模拟;将所配置好的故障模拟规则发送至分布式系统,以使该分布式系统的故障模拟装置基于该故障模拟规则进行故障模拟。4.根据权利要求3所述的故障控制方法,其特征在于,所述预定故障模拟规则包括至少一个条件,故障模拟规则用于指示分布式系统针对符合该故障模拟规则至少一个条件的访问请求进行故障模拟。5.根据权利要求4所述的故障控制方法,其特征在于,还包括:接收来自分布式系统发送的故障模拟反馈信息;响应于接收到清除故障模拟规则中至少一个条件的指令,向反馈故障模拟信息的分布式系统发送特定信息,该特定信息用于指示该分布式系统的故障模拟装置针对符合该被清除的至少一个条件的访问请求不再进行故障模拟。6.根据权利要求5所述的故障控制方法,其特征在于,所述针对符合该被清除的至少一个条件的访问请求不再进行故障模拟包括:针对符合该被清除的至少一个条件且不符合未被清除的条件的访问请求不再进行故障模拟。7.一种在分布式系统进行故障模拟的方法,其特征在于,该方法包括以下步骤:接收访问请求;从所接收的访问请求中筛选出符合预定故障模拟规则的特定访问请求;针对所述特定访问请求,在分布式系统上进行故障模拟。8.根据权利要求7所述的方法,其特征在于,所述预定故障模拟规则包括至少一个条件,所述从所接收的访问请求中筛选出符合预定故障模拟规则的特定访问请求的步骤包括:从所接收的访问请求中筛选出符合预定故障模拟规则至少一个条件的特定访问请求。9.根据权利要求7所述的方法,其特征在于,所述从所接收的访问请求中筛选出符合预定故障模拟规则的特定访问请求的步骤包括:判断所接收的访问请求中是否存在其访问的应用程序的名称被包含于预定故障模拟规则中设定的应用程序名称集合的特定访问请求;如果存在,则筛选出该特定访问请求。10.根据权利要求7所述的方法,其特征在于,所述从所接收的访问请求中筛选出符合预定故障模拟规则的特定访问请求的步骤包括:判断所接收的访问请求中是否存在其访问的网页链接地址被包含于预定故障模拟规则中设定的网页链接地址集合的特定访问请求;如果存在,则筛选出该特定访问请求。11.根据权利要求8-10任一项所述的方法,其特征在于,所述从所接收的访问请求中筛选出符合预定故障模拟规则的特定访问请求的步骤还包括:获取发出所述特定访问请求的用户的特征信息;滤掉其用户的特征信息未被包含于所述设定的用户特征信息集中的特定访问请求。12.根据权利要求8所述的方法,其特征在于,所述预定故障模拟规则中的每一个条件与特定类型的待模拟故障对应,所述针对所述特定访问请求,在分布式系统上进行故障模拟包括:针对符合所述至少一个条件的特定访问请求,在分布式系统上进行与该至少一个条件对应的特定类型的待模拟故障的模拟。13.根据权利要求7所述的方法,其特征在于,所述在分布式系统上进行故障模拟具体包括:于预设时段或/和预设条件下在分布式系统上进行故障模拟。14.根据权利要求13所述的方法,其特征在于,所述预设条件包括:所述分布式系统所接收到的访问的总流量超过预设阈值,或/和分布式系统的资源消耗超过预设阈值。15.根据权利要求7所述的方法,其特征在于,在所述从所接收的访问请求中筛选出符合预定故障模拟规则的特定访问请求的步骤之前还包括:接收预先设置的故障模拟规则,或从所接收的访问请求中解析得到故障模拟规则。16.根据权利要求8所述的方法,其特征在于,在所述从所接收的访问请求中筛选出符合...

【专利技术属性】
技术研发人员:周洋
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1