An abnormity detection and solution system (ADRS) used to automatically detect and resolve exceptions in the computing environment is disclosed. ADRS can be implemented using an exception classification system that defines different types of exceptions, such as defined Exceptions and undefined exceptions. The defined exceptions can be based on the limits of any measure to be monitored (fixed or seasonal). The exception detection and solution component (ADRC) can be implemented in every part of the service that defines the computing system. ADRC may be configured to detect exceptions and try to resolve exceptions locally. If the exception event is not resolved in the component, the ADRC can transfer the exception to the parent's ADRC (if it exists). Each ADRC in the component can be configured to dispose of specific types of exceptions locally to reduce the communication time and resource use for the exception.
【技术实现步骤摘要】
【国外来华专利技术】自动异常检测和解决系统对相关申请的交叉引用本申请要求于2016年5月26日提交的标题为“AUTOMATICANOMALYDETECTIONANDRESOLUTIONSYSTEM”的美国非临时专利申请No.15/165,298的权益和优先权,该申请要求以下申请的权益和优先权:1)于2015年5月28日提交的标题为“AutomaticAnomalyDetectionandResolution”的美国临时申请No.62/167,851;2)于2015年7月31日提交的标题为“AutomaticAnomalyDetectionandResolution”的美国临时申请No.62/199,895;以及3)于2015年10月23日提交的标题为“AutomaticAnomalyDetectionandResolution”的美国临时申请No.62/245,706。上述专利申请中的每一个的全部内容通过引用并入本文,用于所有目的。
技术介绍
云计算是用于启用对可配置的计算资源(例如,网络、服务器、存储空间、应用和服务)的共享池的便利的按需网络访问的模型。通过云计算诸如经由网络提供或访问的服务可以被称为云服务。有很多需要由云服务提供商执行的处理,以使云服务对订阅客户可用。由于其复杂性,这种处理的大部分仍然是手动完成的。例如,供应用于提供这种云服务的资源会是非常劳动密集的过程。支持云计算系统的数据中心的尺寸往往非常大,包括数千个计算和存储服务器以及数百个网络设备和其它设备。例如,最近的统计数据表明,用于Oracle公司在全球提供的云计算系统的有80000个或更多个的虚拟机,其具有54 ...
【技术保护点】
一种方法,包括:由计算机系统确定定义异常界限的值集合,其中所述异常界限针对与云计算机系统所提供的服务有关的度量,其中所述服务由所述云计算机系统中的部件建立,并且其中所述部件包括在云计算机环境中执行的第一容器和第二容器,并且其中第一容器是第二容器中的孩子容器;将第一容器配置为包括异常检测和解决部件ADRC;由第一容器中的ADRC检测与所述云计算机系统中的所述服务的操作相关的异常的异常事件,其中基于所述度量的值不满足针对所述度量的所述异常界限来检测所述异常事件;识别用于在第一容器中解决所述异常的策略;确定所述策略中的规则被所述异常满足;以及发起校正动作以解决所述异常,所述校正动作是基于所述规则被满足而在所述策略中被识别的。
【技术特征摘要】
【国外来华专利技术】2015.05.28 US 62/167,851;2015.07.31 US 62/199,895;1.一种方法,包括:由计算机系统确定定义异常界限的值集合,其中所述异常界限针对与云计算机系统所提供的服务有关的度量,其中所述服务由所述云计算机系统中的部件建立,并且其中所述部件包括在云计算机环境中执行的第一容器和第二容器,并且其中第一容器是第二容器中的孩子容器;将第一容器配置为包括异常检测和解决部件ADRC;由第一容器中的ADRC检测与所述云计算机系统中的所述服务的操作相关的异常的异常事件,其中基于所述度量的值不满足针对所述度量的所述异常界限来检测所述异常事件;识别用于在第一容器中解决所述异常的策略;确定所述策略中的规则被所述异常满足;以及发起校正动作以解决所述异常,所述校正动作是基于所述规则被满足而在所述策略中被识别的。2.如权利要求1所述的方法,其中所述异常界限是为用户定义的异常定义的固定界限,并且其中所述值集合包括轮询间隔值、所述度量的最小量度、所述度量的软限制、所述度量的最大值,以及定义所述异常的最小发生次数的最小连续读数值。3.如权利要求2所述的方法,其中检测所述异常事件包括确定所述度量的值是否满足所述异常界限,并且其中,当所述度量的值小于所述最小量度以及等于或大于所述软限制时,该值不满足所述异常界限。4.如权利要求2或权利要求3所述的方法,其中基于所述最小连续读数被满足来进一步检测所述异常事件。5.如权利要求4所述的方法,其中所述异常界限是为用户定义的异常定义的季节性界限,并且其中所述值集合包括轮询间隔值、所述度量的最小量度、所述度量的软限制、所述度量的最大值、所述异常连续发生的持续时间、当所述季节性界限有效时的开始时间,以及当所述季节性界限有效时的结束时间。6.如权利要求5所述的方法,其中检测所述异常事件包括确定所述度量的值是否满足所述异常界限,并且其中,当所述度量的值小于所述最小量度以及等于或大于所述软限制时、当所述异常事件被检测达到所述持续时间以及所述异常事件在所述开始时间之后和所述结束时间之前被检测到时,该值不满足所述异常界限。7.如权利要求1至6中任一项所述的方法,其中确定所述值集合包括分析日志文件的时间序列数据,以计算用于所述异常界限的所述值集合。8.如权利要求1至7中任一项所述的方法,还包括:在确定用于在第一容器中解决所述异常的策略不能被识别时,通知第二容器所述异常不能在第一容器中被解决;以及识别用于在第二容器中解决所述异常的策略;确定在用于在第二容器中解决所述异常的策略中的规则被所述异常满足;以及基于该规则被满足,发起用于在第二容器中解决所述异常的策略中所识别出的校正动作。9.如权利要求1至8中任一项所述的方法,其中与所述服务相关的所述度量是针对提供所述服务的服务质量(QoS)而监视的多个度量中的一个。10.一种系统,包括:一个或多个处理器;以及存储器,所述存储器能够被所述一个或多个处理器访问,所述存储器存储指令,所述指令当由所述一个或多个处理器执行时,使所述一个或多个处理器:确定定义异常界限的值集合,其中所述异常界限针对与云计算机系统所提供的服务有关的度量,其中所述服务由所述云计算机系统中的部件建立,并且其中所述部件包括在云计算机环境中执行的第一容器和第二容器,并且其中第一容器是第二容器中的孩子容器;将第一容器配置为包括异常检测和解决部件ADRC;由第一容器中的ADRC检测与所述云计算机系统中的所述服务的操作相关的异...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。