一种Linux系统下基于IDK内存注错的测试方法及系统技术方案

技术编号:16427701 阅读:38 留言:0更新日期:2017-10-21 22:18
本发明专利技术提供了一种Linux系统下基于IDK内存注错的测试方法及系统,通过模拟当内存出现可修复或者不可修复错误,检查相关硬件是否有报警,当内存阈值达到一定值后,内存指示灯点亮,前控板内存异常指示灯点亮,同时BMC下定位内存出现的异常,当报可修复的异常的时,通过清除阈值,使内存回复正常工作,当报不可修复的异常的时,更换内存;本发明专利技术快速简单实现模拟环境,测试相关功能是否实现,直接定位到故障内存的具体槽位,更高效的筛选出故障内存,简化测试流程,提高服务器的稳定性。

A test method and system based on IDK memory injection error in Linux system

Test method and system for IDK memory fault injection based on the present invention provides a Linux system through simulation when the memory can not repair or repair errors, check the relevant hardware if the alarm, when the memory threshold reaches a certain value, the memory indicator light, the control board memory abnormal indicator light, while abnormal BMC location memory appears, when abnormal when the newspaper could repair, by clearing the threshold, the memory back to normal work, when abnormal, reported irreparable, replace the memory of this invention is fast; to achieve a simple simulation environment, test related functions are realized, directly targeted to specific slot fault memory, more efficient screen out fault memory, simplify the testing process, improve the stability of the server.

【技术实现步骤摘要】
一种Linux系统下基于IDK内存注错的测试方法及系统
本专利技术涉及计算机服务器的
,具体涉及到一种Linux系统下基于IDK内存注错的测试方法及系统。
技术介绍
在服务器领域中,内存是服务器中重要的部件之一,它是与CPU进行沟通的桥梁。服务器中所有程序的运行都是在内存中进行的,因此内存的性能对服务器的影响非常大。内存(Memory)也被称为内存储器,其作用是用于暂时存放CPU中的运算数据,以及与硬盘等外部存储器交换的数据。只要服务器在运行中,CPU就会把需要运算的数据调到内存中进行运算,当运算完成后CPU再将结果传送出来,内存的运行也决定了服务器的稳定运行。内存是服务器系统的关键组成部分,内存的好坏直接影响服务器的正常工作。在现有技术中,当内存出错时,对内存的诊断技术较为复杂且稳定性无法得到保证,无法对内存简单快速稳定地诊断测试。
技术实现思路
基于上述问题,本专利技术提出一种Linux系统下基于IDK内存注错的测试方法及系统。本专利技术快速简单实现模拟环境,测试相关功能是否实现,直接定位到故障内存的具体槽位,更高效的筛选出故障内存,简化测试流程,提高服务器的稳定性。本专利技术提供如下技术方案:一方面,本专利技术提供一种Linux系统下基于IDK内存注错的测试方法,包括:步骤101,运行脚本程序,获取主机名,设置内存注错位置及内存阈值,执行内存注错;步骤102,判断内存阈值是否达到预设阈值,若是则内存指示灯点亮,前控板内存异常指示灯点亮;步骤103,BMC定位所述内存异常,并存储在BMC日志中;步骤104,判断所述内存异常的类型,所述类型包括可修复异常和不可修复异常,当所述内存异常为可修复异常则通过清除阈值来清除所述内存异常,当所述异常为不可修复异常则告警。其中,在运行脚本之前,将IDK工具复制到Linux系统下解压,进入IDK工具运行脚本程序。其中,所述内存注错可以注可修复错误或者不可修复错误。其中,所述预设阈值为2048。另外,本专利技术还提供一种Linux系统下基于IDK内存注错的测试系统,所述系统包括:注错模块,用于运行脚本程序,获取主机名,设置内存注错位置及内存阈值,执行内存注错;判断模块,用于判断内存阈值是否达到预设阈值,若是则内存指示灯点亮,前控板内存异常指示灯点亮;定位模块,用于BMC定位所述内存异常,并存储在BMC日志中;修复模块,用于判断所述内存异常的类型,所述类型包括可修复异常和不可修复异常,当所述内存异常为可修复异常则通过清除阈值来清除所述内存异常,当所述异常为不可修复异常则告警。其中,在运行脚本之前,将IDK工具复制到Linux系统下解压,进入IDK工具运行脚本程序。其中,所述内存注错可以注可修复错误或者不可修复错误。其中,所述预设阈值为2048。本专利技术提供了一种Linux系统下基于IDK内存注错的测试方法及系统,通过模拟当内存出现可修复或者不可修复错误,检查相关硬件是否有报警,当内存阈值达到一定值后,内存指示灯点亮,前控板内存异常指示灯点亮,同时BMC下定位内存出现的异常,当报可修复的异常的时,通过清除阈值,使内存回复正常工作,当报不可修复的异常的时,更换内存;本专利技术快速简单实现模拟环境,测试相关功能是否实现,直接定位到故障内存的具体槽位,更高效的筛选出故障内存,简化测试流程,提高服务器的稳定性。附图说明图1是本专利技术的方法步骤流程图;图2是本专利技术的系统结构框图。具体实施方式为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。本专利技术提供一种Linux系统下基于IDK内存注错的测试方法,包括:步骤101,运行脚本程序,获取主机名,设置内存注错位置及内存阈值,执行内存注错;将IDK工具复制到Linux系统下,关闭防火墙(iptables-F),安装Python-2.7.11(①tar–zxvfPython-2.7.11.tgz②cdPython-2.7.11③./configure④make⑤makeinstall),根据系统版本选择core版本解压缩(tar–zxvfidk_core_3.45_linux_rhel_7_2.tgz),开始监控(①cdidk_core②./install_driver.sh③./idk_core),解压缩IDK_Client_3.45.zip(unzipIDK_Client_3.45.zip),然后进入IDK_Client_3.45,运行python2test.py;Test.py脚本信息如下:importpurleyimportmathpur=purley.connect("localhost")die=purley.ondie.ondie(pur)sa=pur.at.ReverseTranslate({"socket":0,"imc":0,"channel":0,"dimm":0,"rank":0})["address"]#此处注错的位置foriinrange(2048):#此处是BIOSSetup下默认的阈值die.mem_inject_ondie(SA=sa,error_type="ECC_1",retries=3,target_channel="primary")pur.ShowMemErrors(),其中,#ECC_1为可修复的错误/异常,ECC_2为不可修复的错误/异常。步骤102,判断内存阈值是否达到预设阈值,若是则内存指示灯点亮,前控板内存异常指示灯点亮;当内存阈值达到一定值后,该一定值为预设阈值,内存指示灯就会亮,前控板内存异常指示灯会亮。步骤103,BMC定位所述内存异常,并存储在BMC日志中;BMC下也可定位那个内存出现的异常,用户可根据BMC下报的日志做相关的操作。步骤104,判断所述内存异常的类型,所述类型包括可修复异常和不可修复异常,当所述内存异常为可修复异常则通过清除阈值来清除所述内存异常,当所述异常为不可修复异常则告警。当报可修复的error的时候,用户可通过清除阈值,所述清除阈值为自动清除或手动清除,使内存回复正常工作;当报不可修复的error的时候,用户就必须更换内存,以保证服务器的稳定性。本专利技术提供了一种Linux系统下基于IDK内存注错的测试方法,通过模拟当内存出现可修复或者不可修复错误,检查相关硬件是否有报警,当内存阈值达到一定值后,内存指示灯点亮,前控板内存异常指示灯点亮,同时BMC下定位内存出现的异常,当报可修复的异常的时,通过清除阈值,使内存回复正常工作,当报不可修复的异常的时,更换内存;本专利技术快速简单实现模拟环境,测试相关功能是否实现,直接定位到故障内存的具体槽位,更高效的筛选出故障内存,简化测试流程,提高服务器的稳定性。本专利技术的实施方式还提供了一种Linux系统下基于IDK内存注错的测试系统,包括:注错模块201,用于运行脚本程序,获取主机名,设置内存注错位置及内存阈值,执行内存注错;将IDK工具复制到Linux系统下,关闭防火墙(iptables-F),安装Python-2.7.11(①tar–zxvfPython-2本文档来自技高网...
一种Linux系统下基于IDK内存注错的测试方法及系统

【技术保护点】
一种Linux系统下基于IDK内存注错的测试方法,其特征在于:步骤101,运行脚本程序,获取主机名,设置内存注错位置及内存阈值,执行内存注错;步骤102,判断内存阈值是否达到预设阈值,若是则内存指示灯点亮,前控板内存异常指示灯点亮;步骤103,BMC定位所述内存异常,并存储在BMC日志中;步骤104,判断所述内存异常的类型,所述类型包括可修复异常和不可修复异常,当所述内存异常为可修复异常则通过清除阈值来清除所述内存异常,当所述异常为不可修复异常则告警。

【技术特征摘要】
1.一种Linux系统下基于IDK内存注错的测试方法,其特征在于:步骤101,运行脚本程序,获取主机名,设置内存注错位置及内存阈值,执行内存注错;步骤102,判断内存阈值是否达到预设阈值,若是则内存指示灯点亮,前控板内存异常指示灯点亮;步骤103,BMC定位所述内存异常,并存储在BMC日志中;步骤104,判断所述内存异常的类型,所述类型包括可修复异常和不可修复异常,当所述内存异常为可修复异常则通过清除阈值来清除所述内存异常,当所述异常为不可修复异常则告警。2.根据权利要求1所述的方法,其特征在于:在运行脚本之前,将IDK工具复制到Linux系统下解压,进入IDK工具运行脚本程序。3.根据权利要求1所述的方法,其特征在于:所述内存注错可以注可修复错误或者不可修复错误。4.根据权利要求1所述的方法,其特征在于:所述预设阈值为2048。5.一种L...

【专利技术属性】
技术研发人员:刘浩君
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1