【技术实现步骤摘要】
CPU故障预测方法、模型训练方法、设备和存储介质
[0001]本专利技术涉及计算机
,尤其涉及一种CPU故障预测方法、模型训练方法、设备和存储介质。
技术介绍
[0002]随着云计算相关技术的高速发展,大量软件的开发和部署中利用到了云服务。其中,服务器硬件系统的可靠性、可用性和可服务性对于云计算和高性能计算尤为重要。
[0003]CPU故障是硬件系统常见的故障之一,CPU故障会产生可纠正错误(correctable error,简称CE)和不可纠正错误(uncorrectable error,简称UE),其中,UE会导致CPU宕机,进而对硬件系统的可靠性、可用性和可服务性产生不良影响。因此,有必要准确、高效的对CPU进行故障预测。
技术实现思路
[0004]本专利技术实施例提供一种CPU故障预测方法、模型训练方法、设备和存储介质,用以对CPU故障进行准确、高效的预测。
[0005]第一方面,本专利技术实施例提供一种CPU故障预测方法,所述方法包括:
[0006]获取目标时间段内服务器中影响CPU运行状态的多个部件分别对应的错误日志数据,所述错误日志数据对应于检测到相应部件存在可纠正错误时触发的;
[0007]根据与缓存介质相关的部件所对应的错误日志数据,确定缓存介质对应的第一故障统计特征,所述多个部件中包括与缓存介质相关的部件;
[0008]根据所述多个部件分别对应的错误日志数据,确定所述多个部件对应的第二故障统计特征;
[0009]将所述第一故障 ...
【技术保护点】
【技术特征摘要】
1.一种CPU故障预测方法,其特征在于,包括:获取目标时间段内服务器中影响CPU运行状态的多个部件分别对应的错误日志数据,所述错误日志数据对应于检测到相应部件存在可纠正错误时触发的;根据与缓存介质相关的部件所对应的错误日志数据,确定缓存介质对应的第一故障统计特征,所述多个部件中包括与缓存介质相关的部件;根据所述多个部件分别对应的错误日志数据,确定所述多个部件对应的第二故障统计特征;将所述第一故障统计特征和所述第二故障统计特征输入故障预测模型,以确定所述CPU是否会发生不可纠正错误。2.根据权利要求1所述的方法,其特征在于,所述与缓存介质相关的部件包括:多级缓存;所述根据与缓存介质相关的部件所对应的错误日志数据,确定缓存介质对应的第一故障统计特征,包括:根据所述多级缓存各自对应的错误日志数据中所包含的物理内存地址,确定不同物理内存地址对应的故障信息;根据所述不同物理内存地址对应的故障信息,确定所述缓存介质对应的第一故障统计特征。3.根据权利要求2所述的方法,其特征在于,目标缓存由多个缓存组构成,每个缓存组中包括多个缓存块,所述目标缓存是所述多级缓存中任一个;所述根据所述不同物理内存地址对应的故障信息,确定所述缓存介质对应的第一故障统计特征,包括:根据所述目标缓存中各缓存块与物理内存地址的映射关系以及所述目标缓存对应的错误日志数据中各物理内存地址对应的故障信息,确定所述目标缓存中各缓存块对应的第一故障特征;根据目标缓存组中多个缓存块各自对应的第一故障特征,确定所述目标缓存组对应的第二故障特征,所述目标缓存组是所述多个缓存组中任一个;确定所述多个缓存组中相邻的N个缓存组对应的第三故障特征,所述第三故障特征用于反映是否存在相邻的N个缓存组均发生故障,其中,N为大于1的整数;根据所述第一故障特征、所述第二故障特征和所述第三故障特征中的至少部分,确定所述缓存介质对应的第一故障统计特征。4.根据权利要求1所述的方法,其特征在于,所述与缓存介质相关的部件包括:多级缓存;所述根据与缓存介质相关的部件所对应的错误日志数据,确定缓存介质对应的第一故障统计特征,包括:根据所述多级缓存分别对应的错误日志数据,以及在所述目标时间段内所述多级缓存各自对应的未命中数据次数,确定所述缓存介质对应的第一故障统计特征;其中,任一级缓存对应的未命中次数是指所述CPU进行数据访问时未在所述任一级缓存中查到待访问数据的次数。5.根据权利要求1所述的方法,其特征在于,所述错误日志数据包含故障操作、故障原因;所述根据所述多个部件分别对应的错误日志数据,确定第二故障统计特征,包括:
确定目标部件、目标故障操作、目标故障原因分别对应的第四故障特征,其中,所述目标部件是所述多个部件中任一个,所述目标故障操作是所述多个部件对应的错误日志数据中包含的多个故障操作中任一个,所述目标故障原因是所述多个部件对应的错误日志数据中包含的多个故障原因中任一个;所述第四故障特征中包括相应目标部件或目标故障操作或目标故障原因的出现次数;根据所述目标部件、目标故障操作、目标故障原因分别对应的第四故障特征...
【专利技术属性】
技术研发人员:杜小明,马旭华,郑旭东,王雨农,
申请(专利权)人:杭州阿里巴巴飞天信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。