The invention relates to a method for locating anomaly causes in cloud data centers based on statistical analysis. Monitoring multi-dimensional resource measurement of cloud data center nodes, using vector autoregressive model to predict resource utilization of nodes, detecting measurement anomalies of cloud services by comparing measurement prediction values and monitoring values, establishing dependency graphs according to the knowledge of complex dependencies among data center nodes, and sorting component anomalies to reduce alarm storms.
【技术实现步骤摘要】
一种基于统计分析的云数据中心服务异常根因定位方法
本专利技术涉及一种基于统计分析的云数据中心服务异常根因定位方法,属于软件
技术介绍
云数据中心时常会出现大规模服务降级和服务中断,从而严重影响服务可靠性与性能。服务性能衰减通常会表现为系统层的度量异常,以反映服务内部或底层基础设施中存在的问题,例如DDoS攻击、服务升级以及工作负载激增带来的异常资源使用。虚拟化技术将应用服务整合到少量的服务器中以降低操作成本(如,能源消耗)并最大化资源使用。然而,基于虚拟化的资源共享会造成相同主机上共享资源的服务之间竞争有限的系统资源(如,计算、带宽或内存),从而造成性能衰减。因此,不断检测系统异常(如异常的资源行为)以防止服务降级,并通过快速控制意外服务中断来提高服务可靠性,成为云服务监测的主要目标。然而,云服务规模巨大、体系结构复杂性,以及工作负载呈现多样性和动态性,使得在线异常检测具有挑战性。首先,异常检测方法需要在不明确正常状态或异常定义的情况下,能够自动适应云服务行为的变化。此外,能够应对多个层次的云服务抽象,从而分析处理多个服务度量。当前的异常检测方法通常基于 ...
【技术保护点】
1.一种基于统计分析的云数据中心服务异常根因定位方法,方法特征在于实现步骤如下:第一步,定时搜集各节点的多度量监测数据,
【技术特征摘要】
1.一种基于统计分析的云数据中心服务异常根因定位方法,方法特征在于实现步骤如下:第一步,定时搜集各节点的多度量监测数据,为在时间t监测得到的(1×n)向量,是度量m在时间t的监测数据,n是监测度量数量;第二步,根据历史监测数据,使用线性组合建模并预测度量值,其中,p表示滞后监测数据的数量,参数θ0表示(n×1)的常数向量,和构成(n×n)系数矩阵,表示的白噪声向量,使用n个方程组成求解参数值;第三步,计算预测误差为监测与预测之间的差值:,其中,为预测值,为监测值,这样检测异常资源使用的问题可以抽象为多...
【专利技术属性】
技术研发人员:周博,吴昊,王钟沛,张晓洲,刘延新,
申请(专利权)人:江苏润和软件股份有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。