【技术实现步骤摘要】
本公开涉及人工智能领域,尤其涉及服务器内存故障隔离方法、装置、存储介质及电子设备。
技术介绍
1、数据中心作为现代信息技术的核心,依赖于大规模服务器集群,用于处理海量数据并支持多样化的业务应用,而服务器内存故障也成为数据中心运维需要重点解决的问题。
2、当前,尽管内存ecc(error correcting code,纠错码)机制能够为服务器及其内存提供一定程度的高容错功能,但仅支持内存发生的可纠正错误(correctable errors,ce),对于内存发生的不可纠正错误(uncorrectable errors,uce),依然需要运维人员及时进行包括故障内存更换等处理。在内存发生不可纠正错误时,容易出现服务器宕机风险,造成服务中断,不仅影响业务连续性,还容易导致数据丢失。
3、因此,如何提前防范内存故障,成为本领域技术人员急需解决的技术问题。
技术实现思路
1、鉴于上述问题,本公开提供一种克服上述问题或者至少部分地解决上述问题的服务器内存故障隔离方法、装置、存
...【技术保护点】
1.一种服务器内存故障隔离方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于内存关键特征指标,获得目标服务器的目标内存特征数据,包括:
3.根据权利要求1所述的方法,其特征在于,所述内存故障预测模型的训练过程包括:
4.根据权利要求3所述的方法,其特征在于,在所述对所述历史运行数据进行特征工程处理,确定所述内存关键特征指标之前,所述方法还包括:
5.根据权利要求3所述的方法,其特征在于,所述利用所述历史内存特征数据对所述内存故障预测模型进行训练,获得训练好的所述内存故障预测模型,包括:
< ...【技术特征摘要】
1.一种服务器内存故障隔离方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于内存关键特征指标,获得目标服务器的目标内存特征数据,包括:
3.根据权利要求1所述的方法,其特征在于,所述内存故障预测模型的训练过程包括:
4.根据权利要求3所述的方法,其特征在于,在所述对所述历史运行数据进行特征工程处理,确定所述内存关键特征指标之前,所述方法还包括:
5.根据权利要求3所述的方法,其特征在于,所述利用所述历史内存特征数据对所述内存故障预测模型进行训练,获得训练好的所述内存故障预测模型,包括:
6.根据权利要求5所述的方法,其特征在于,所述故障类型标签包括无故障标签、可纠正错误标签和不可纠正...
【专利技术属性】
技术研发人员:张晓斌,刘畅,曹阳,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。