【技术实现步骤摘要】
一种故障处理方法、装置、设备及系统
[0001]本申请实施例涉及计算机
,尤其涉及一种故障处理方法、装置、设备及系统。
技术介绍
[0002]内存为计算机体系结构中的关键组件。随着数据量爆发式增长,服务器、存储阵列等数据处理设备需要越来越多的内存,内存容量也越来越大。内存故障率也随之逐渐增长,内存故障已经成为了影响计算机系统可靠运行的关键问题。
[0003]目前,当CPU获取数据时出错才能确定产生内存故障,CPU会将错误上报给基本输入输出系BIOS,然后BIOS按固定配置可以处理一些简单的内存故障。若想改变BIOS的配置,需要复位系统对BIOS进行升级。可见,BIOS处理内存故障的方式不够灵活,且复位系统导致计算机系统上运行的业务中断。
技术实现思路
[0004]本申请提供一种故障处理方法、装置、设备及系统,以期更加灵活的处理存储器中的故障,确保计算机系统的可靠运行。
[0005]第一方面,本申请实施例提供一种故障处理方法,包括:向基本输入输出系统BIOS发送第一命令,所述第一命令指示所 ...
【技术保护点】
【技术特征摘要】
1.一种故障处理方法,其特征在于,包括:向基本输入输出系统BIOS发送第一命令,所述第一命令指示所述BIOS对存储器中的第一存储区域进行故障检测,所述第一存储区域包括多个存储单元,所述多个存储单元的第一存储单元为产生故障的存储单元;接收所述BIOS发送的检测信息,所述检测信息用于指示所述第一存储区域中的故障检测结果;基于所述检测信息,确定故障处理策略。2.如权利要求1所述的方法,其特征在于,在向基本输入输出系统BIOS发送第一命令之前,所述方法还包括:接收基本输入输出系统BIOS发送的错误信息,所述错误信息用于指示所述第一存储单元产生故障。3.如权利要求1或2所述的方法,其特征在于,所述基于所述检测信息,确定故障处理策略,包括:根据所述存储器的历史错误信息和所述检测信息,确定所述故障处理策略。4.如权利要求3所述的方法,其特征在于,所述根据所述存储器的历史错误信息和所述检测信息,确定所述故障处理策略,包括:根据所述历史错误信息和所述检测信息,确定所述存储器中第二存储区域的故障概率,所述第二存储区域与所述第一存储区域有重合;根据所述第二存储区域的故障概率,确定所述故障处理策略。5.如权利要求1
‑
4任一项所述的方法,其特征在于,所述存储器为内存设备。6.权利要求1
‑
5任一项所述的方法,其特征在于,所述检测信息包括以下至少一个参数:所述第一存储区域中的故障存储单元的数量;所述第一存储区域中的故障类型;所述第一存储区域中的故障产生时间;第一指示信息,所述第一指示信息用于指示所述第一存储区域中产生故障的存储单元。7.如权利要求1
‑
6任一项所述的方法,其特征在于,所述方法还包括:向基本输入输出系统BIOS发送第二命令,所述第二命令指示所述BIOS执行所述故障处理策略。8.一种故障处理装置,其特征在于,所述故障处理装置包括:驱动组件单元,用于向基本输入输出系统BIOS发送第一命令,所述第一命令指示对存储器中的第一存储区域进行故障检测,所述第一存储区域包括多个存储单元,所述多个存储单元的第一存储单元为产生故障的存储单元;错误信息采集单元,用于接收所述BIOS发送的检测信息,并将所述检测信息发送给所述驱动组件单元;其中,所述检测信息用于指示所述第一存储区域中的故障检测结果;故障治理单元,用于从所述驱动组件单元获取所述检测信息,并基于所述检测信息确定故障处理策略。9.如权利要求8所述的故障处理装置,其特征在于,所述驱动组件单元部署于所述OS的内核态,所述故障治理单元部署于所述OS的用户态。10.如权利要求8或9所述的故障处理装置,其特征在于,在所述驱动组件单元向基本输入输出系统BIOS发送第一命令之前,
所述错误信息采集单元,还用于接收基本输入输出系统BIOS发送的错误信息,并将所述错误信息发送给所述驱动组件单元;其中,所述错误信息用于指示所述第一存储单元产生故障。11.如权利要求8
‑
10任一项所述的故障处理装置,其特征在于,所述故障治理单元,还用于:根据所述存储器的历史错误信息和所述检测信息,确定所述故障处理策略。12.如权利要求11所述的故障处理装置,其特征在于,所述故障治理单元,具体用于:根据所述历史错误信息和所述检测信息,确定所述存储器中第二存储区域的故障概率,所述第二存储区域与所述第一存储区域有重合;根据所述第二存储区域的故障概率,确定所述故障处理策略。13.如权利要求8
‑
12任一项所述的故障处理装置,其特征在于,所述存储器为内存设备。14.权利要求8
‑
13任一项所述的故障处理装置,其特征在于,所述检测信息包括以下至少一个参数:所述第一存储区域中的故障存储单元的数量;所述第一存储区域中的故障类型;所述第一存储区域中的故障产生时间;第一指示信息,所述第一指示信息用于指示所述第一存储区域中产生故障的存储单元。15.如权利要求8
‑
14任一项所述的故障处理装置,其特征在于,所述驱动组件单元,还用于:向基本输入输出系统BIOS发送第二命令,所述第二命令指示所述BIOS执行所述故障处理策略。16.一种故障处理设备,其特征在于,包括:通信接口,用于向基本输入输出系统BIOS发送第一命令,所述第一命令指示对存储器中的第一存储区域进行故障检测,所述第一存储区域包括多个存储单元,所述多个存储单元的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。