【技术实现步骤摘要】
【国外来华专利技术】性能事件故障排除系统
[0001]本专利技术一般涉及数字计算机系统的领域,并且更具体地涉及性能事件故障排除。
技术介绍
[0002]拍字节数据被收集在公共和私有云中,其中时间序列数据来源于不同数据源,包括传感器网络、智能网格等。所收集的时间序列数据可具有非期望的变化或者指示异常的模式。用于实时检测根本原因的监测数据可以例如防止该异常累积和影响计算机系统的效率。
技术实现思路
[0003]本专利技术的各方面公开了用于故障排除系统的方法、计算机程序产品和系统。该方法包括一个或多个处理器识别数据源,数据源被配置成提供传感器数据以及将传感器数据加时间戳为一个或多个时间序列的第一集合,传感器数据包括第一组被测变量的值。该方法还包括一个或多个处理器确定传感器数据的子集的一个或多个被测变量的第二组的值指示异常。传感器数据的子集由数据源中的给定数据源提供并且覆盖时间窗口,给定数据源包括组件的集合。该方法还包括一个或多个处理器使用一种或多种相似度技术的集合来确定作为异常的根本原因候选的第三组的一个或多个被测变量,该一种或多种相似度技术用于在时间窗口中比较第二组被测变量的值和第三组被测变量的值。第三组的被测变量由组件的集合提供。对于相似度技术的集合中的每个相似度技术以及对于第二组中的每个被测变量,方法进一步包括一个或多个处理器将系数的集合分配给被测变量。使用相似度技术,系数的集合中的每个系数指示每个被测变量与第三组的被测变量的比较结果。方法进一步包括一个或多个处理器使用系数的集合确定给定数据源的组件的集合的特定子集是否可 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:由一个或多个处理器识别数据源,所述数据源被配置为提供传感器数据并对所述传感器数据加时间戳为一个或多个时间序列的第一集合,所述传感器数据包括第一组被测变量的值;由一个或多个处理器确定所述传感器数据的子集中的第二组的一个或多个被测变量的值指示异常,其中,所述传感器数据的子集由所述数据源中的给定数据源提供并覆盖时间窗口,所述给定数据源包括组件的集合;由一个或多个处理器使用一种或多种相似度技术的集合确定作为所述异常的根本原因候选的第三组的一个或多个被测变量,所述一种或多种相似度技术用于在所述时间窗口中比较所述第二组被测变量和所述第三组被测变量的值,其中,所述第三组的被测变量由所述组件的集合提供;对于所述相似度技术的集合中的每个相似度技术以及对于所述第二组中的每个被测变量,由一个或多个处理器向所述被测变量分配系数的集合,其中,所述系数的集合中的每个系数指示使用所述相似度技术的每个被测变量与所述第三组的被测变量的比较结果;由一个或多个处理器使用所述系数的集合来确定是否能够将所述给定数据源的所述组件的集合的特定子集识别为所述异常的根本原因;以及响应于确定能够将所述给定数据源的所述组件的集合的所述特定子集识别为所述异常的所述根本原因,由一个或多个处理器提供所述组件的所述特定子集作为所述异常的所述根本原因。2.根据权利要求1所述的方法,进一步包括:响应于确定不能将所述给定数据源的所述组件的集合的特定子集识别为所述异常的所述根本原因,由一个或多个处理器更新所述第三组被测变量;对于所述相似度技术的集合中的每个相似度技术和对于所述第二组中的每个被测变量,由一个或多个处理器向所述被测变量分配更新的系数的集合,其中,所述更新的系数的集合中的每个系数指示使用所述相似度技术的每个被测变量与所述更新的第三组的被测变量的比较结果;以及由一个或多个处理器使用所述更新的系数的集合来确定是否能够将所述给定数据源的所述组件的集合的所述特定子集识别为所述异常的所述根本原因。3.根据权利要求2所述的方法,其中,更新所述第三组被测变量还包括从包括以下的组中选择的动作:由一个或多个处理器从所述第三组中移除一个或多个被测变量;以及由一个或多个处理器将一个或多个被测变量添加到所述第三组。4.根据权利要求3所述的方法,其中,由所述组件的集合中的选择的组件提供所移除的或所添加的被测变量,所述方法进一步包括:由一个或多个处理器针对下一次迭代从所述组件的集合中排除所选择的组件。5.根据权利要求4所述的方法,进一步包括:由一个或多个处理器根据所述组件的集合的预定义属性并且以单调排序顺序对所述组件的集合进行排名,其中,所选择的组件是排名第一的组件。6.根据权利要求5所述的方法,其中,所述属性是过载程度。
7.根据权利要求1所述的方法,其中,所述组件的所述特定子集是所述组件的集合中的单个组件。8.根据权利要求1所述的方法,其中,确定是否能够将所述给定数据源的所述组件的集合的特定子集识别为所述异常的根本原因进一步包括:对于所述第二组中的每个被测变量和对于所述第三组中的每个被测变量,由一个或多个处理器组合相应的系数的集合,得到组合的系数;以及使用所述组合的系数确定是否能够将所述给定数据源的所述组件的集合的所述特定子集识别为所述异常的所述根本原因。9.根据权利要求8所述的方法,其中,组合所述系数的组合包括对所述系数的集合求和。10.根据权利要求1所述的方法,进一步包括:在比较所述时间窗口中的所述第二组被测变量和所述第三组被测变量的值之前,由一个或多个处理器在所述时间窗口中归一化所述第二组的被测变量和所述第三组被测变量的值。11.根据权利要求1所述的方法,其中,所述相似度技术的集合包括曼哈顿距离、欧几里得距离、动态时间规整(DTW)距离、斯皮尔曼和皮尔森度量。12.根据权利要求1所述的方法,其中,确定所述传感器数据的子集中的第二组的一个或多个所述被测变量的值指示异常进一步包括:由一个或多个处理器从所述数据源接收事件票,所述事件票指示所述异常。13.根据权利要求1所述的方法,其中,响应于接收事件票来确定所述传感器数据的子集中的第二组的一个或多个所述被测变量的值指示异常启动。14.根据权利要求1所述的方法,其中,所述第二组的被测变量包括从包括以下的组中选择的被测变量:(i)所述第一组被测变量中的被测变量和(ii)所述第一组的被测变量的组合。15.根据权利要求1所述的方法,其中,所述时间序列的第一集合中的每个时间序列包括相应的被测...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。