故障根因分析方法技术

技术编号:39574927 阅读:10 留言:0更新日期:2023-12-03 19:26
本发明专利技术提供了一种故障根因分析方法

【技术实现步骤摘要】
故障根因分析方法、装置、设备和可读存储介质


[0001]本专利技术涉及无线网络与人工智能领域,尤其是指一种故障根因分析方法

装置

设备和可读存储介质


技术介绍

[0002]现有资源池服务器硬盘

存储设备

网络端口或交换机故障主要通过监控
CPU、
内存

网络等性能指标监控,当性能指标超过预配置阈值时发送告警通知,由人工核查指标,以及服务器系统日志

网络日志等方式查找根原因

[0003]但是对于网络闪断即时断时续的故障场景,难以准确定位故障原因,具有效率低且不准确的缺点

并且由于服务器与存储节点间网络不稳定

抖动等原因造成存储设备在集群中不断地离线上线,易于造成资源池集群性能不稳定


技术实现思路

[0004]本专利技术的目的是提供一种故障根因分析方法

装置

设备和可读存储介质,用于解决在资源池发生故障时,故障定位效率低且不准确的问题

[0005]为了解决上述技术问题,本专利技术实施例提供一种故障根因分析方法,包括:
[0006]采集故障训练数据,所述故障训练数据包括故障文本数据和至少一第一监测构件的性能数据;
[0007]根据所述性能数据,利用色彩模式
RGB
三通道特性,构建性能图像;其中,每一第一监测组件对应一个性能图像,每一所述第一监测组件包括至少一所述第一监测构件;
[0008]根据所述性能图像

所述故障文本数据和预设损失函数,对多模态学习模型进行训练,获得用于故障根因分析的故障识别模型

[0009]可选地,所述方法还包括:
[0010]在获取待识别故障数据后,提取所述待识别故障数据中的故障文本数据和至少一第二监测构件的性能数据;
[0011]根据所述性能数据,利用色彩模式
RGB
三通道特性,构建性能图像;其中,每一第二监测组件对应一个性能图像,每一所述第二监测组件包括至少一所述第二监测构件;
[0012]将所述待识别故障数据中的故障文本数据和每一第二监测组件分别对应的性能图像,输入至所述故障识别模型,获得所述待识别故障数据的故障识别结果

[0013]可选地,根据所述性能数据,利用色彩模式
RGB
三通道特性,构建性能图像,包括:
[0014]按照性能指标类型分别对所述性能数据进行预处理;
[0015]利用色彩模式
RGB
三通道特性将预处理后的所述性能数据转化为多个性能曲线;其中,每一所述性能指标类型的所述性能数据对应一种颜色的性能曲线;
[0016]根据多个所述性能曲线,构建性能图像

[0017]可选地,所述性能数据的性能指标类型包括中央处理器
CPU
利用率

内存利用率

网络流量和网络时延中的一项或多项;
[0018]所述按照性能指标类型分别对所述性能数据进行预处理,包括以下的一项或多项:
[0019]通过线性变换方法分别将所述
CPU
利用率和所述内存利用率映射到相应的数据区间;
[0020]通过对数换算方法将所述网络流量的原始数值映射到相应的数据区间;
[0021]通过线性变换方法和
/
或对数换算方法将所述网络时延的原始数值映射到相应的数据区间,其中,在所述网络时延的原始数值小于或者等于第一阈值的情况下,通过线性变换方法将所述原始数值映射到相应的数据区间,在所述网络时延的原始数值大于第一阈值的情况下,通过对数换算方法将所述原始数值映射到相应的数据区间

[0022]可选地,所述根据多个所述性能曲线,构建性能图像,包括:
[0023]根据面积分布图方法将每一所述性能曲线分别转化为对应的第一性能图像;
[0024]将多个所述第一性能图像进行合成,构建性能图像

[0025]可选地,所述方法还包括:
[0026]通过滑动时间窗口采集待识别故障数据中的至少一第二监测构件的性能数据;
[0027]其中,所述滑动时间窗口每滑动第一预设时间采集一次所述性能数据,所述滑动时间窗口的长度为第二预设时间,所述第一预设时间小于所述第二预设时间

[0028]可选地,所述预设损失函数包括:
[0029]加权系数其中,
Y
为取值为
(0,1]的加权系数,
Z
为满足预设条件的所述性能图像的数量占所述性能图像总数量的比例值,所述满足预设条件包括:所述性能图像对应的所述性能数据中的
CPU
利用率小于第二阈值

内存利用率小于第三阈值

网络流量小于第四阈值和网络时延小于第五阈值

[0030]本专利技术实施例还提供一种故障根因分析装置,包括:
[0031]采集模块,用于采集故障训练数据,所述故障训练数据包括故障文本数据和至少一第一监测构件的性能数据;
[0032]图像构建模块,用于根据所述性能数据,利用色彩模式
RGB
三通道特性,构建性能图像;其中,每一第一监测组件对应一个性能图像,每一所述第一监测组件包括至少一所述第一监测构件;
[0033]模型训练模块,用于根据所述性能图像

所述故障文本数据和预设损失函数,对多模态学习模型进行训练,获得用于故障根因分析的故障识别模型

[0034]本专利技术实施例还提供一种故障根因分析设备,包括:处理器

存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如上任一项所述的故障根因分析方法

[0035]本专利技术实施例还提供一种可读存储介质,包括:所述可读存储介质上存储有程序,所述程序被处理器执行时实现如上任一项所述的故障根因分析方法的步骤

[0036]本专利技术的上述技术方案的有益效果如下:
[0037]上述方案中,获取故障训练数据,并将故障训练数据中的性能数据转化为性能图像,根据性能图像

故障文本数据和预设损失函数对多模态学习模型进行训练,获得用于故障根因分析的故障识别模型,通过故障识别模型可以实现故障快速定位,减少人工经验依
赖,提高运维效率

附图说明
[0038]图1为本专利技术实施例提供的故障根因分析方法的流程示意图;
[0039]图2为本专利技术实施例提供的故障识别模型处理性能图像的流程示意图;
[0040]图
3a
至图
3e
为本专利技术实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种故障根因分析方法,其特征在于,包括:采集故障训练数据,所述故障训练数据包括故障文本数据和至少一第一监测构件的性能数据;根据所述性能数据,利用色彩模式
RGB
三通道特性,构建性能图像;其中,每一第一监测组件对应一个性能图像,每一所述第一监测组件包括至少一所述第一监测构件;根据所述性能图像

所述故障文本数据和预设损失函数,对多模态学习模型进行训练,获得用于故障根因分析的故障识别模型
。2.
根据权利要求1所述的方法,其特征在于,所述方法还包括:在获取待识别故障数据后,提取所述待识别故障数据中的故障文本数据和至少一第二监测构件的性能数据;根据所述性能数据,利用色彩模式
RGB
三通道特性,构建性能图像;其中,每一第二监测组件对应一个性能图像,每一所述第二监测组件包括至少一所述第二监测构件;将所述待识别故障数据中的故障文本数据和每一第二监测组件分别对应的性能图像,输入至所述故障识别模型,获得所述待识别故障数据的故障识别结果
。3.
根据权利要求1或2所述的方法,其特征在于,根据所述性能数据,利用色彩模式
RGB
三通道特性,构建性能图像,包括:按照性能指标类型分别对所述性能数据进行预处理;利用色彩模式
RGB
三通道特性将预处理后的所述性能数据转化为多个性能曲线;其中,每一所述性能指标类型的所述性能数据对应一种颜色的性能曲线;根据多个所述性能曲线,构建性能图像
。4.
根据权利要求3所述的方法,其特征在于,所述性能数据的性能指标类型包括中央处理器
CPU
利用率

内存利用率

网络流量和网络时延中的一项或多项;所述按照性能指标类型分别对所述性能数据进行预处理,包括以下的一项或多项:通过线性变换方法分别将所述
CPU
利用率和所述内存利用率映射到相应的数据区间;通过对数换算方法将所述网络流量的原始数值映射到相应的数据区间;通过线性变换方法和
/
或对数换算方法将所述网络时延的原始数值映射到相应的数据区间,其中,在所述网络时延的原始数值小于或者等于第一阈值的情况下,通过线性变换方法将所述原始数值映射到相应的数据区间,在所述网络时延的原始...

【专利技术属性】
技术研发人员:梁双春
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1