The invention discloses a power cycle stability test method for server GPU equipment, which includes: copying the switch test script to the server system; executing the switch test script and setting the switch number to N times; according to the set switch number, the switch test script makes the server run N times of switch operation, and automatically acquires G in the server during each switch process. The hardware information of PU device is compared with that of standard GPU device, and the result of comparison is output. This method can effectively find a series of abnormal stability problems such as GPU device deceleration, GPU device loss, GPU device register error. It is simple to operate, greatly reduces the time of manual operation and intervention, and has strong practicability, and greatly saves time and cost.
【技术实现步骤摘要】
一种服务器GPU设备powercycle稳定性测试方法
本本专利技术涉及服务器开关机测试领域,具体涉及一种服务器GPU设备powercycle稳定性测试方法。
技术介绍
目前随着AI技术应用越来越广泛,带有GPU设备的服务器产品是不可缺少的重要硬件部分,用于图形、图像处理领域的GPU可以并行处理大量数据,非常适合深度学习的高并行、高本地化数据场景,是目前主流的AI人工智能计算架构。GPU目前在服务器产品中占主导地位,在实际设计中,GPU的数量较多,针对GPU设备稳定性测试部分在服务器开发过程中是必不可少的部分,而目前服务器GPU设备powercycle稳定性测试技术不够方便高效,给服务器开发带来不便。
技术实现思路
为解决上述问题,本专利技术提供一种服务器GPU设备powercycle稳定性测试方法,可方便有效地测试GPU设备powercycle稳定性。本专利技术的技术方案是:一种服务器GPU设备powercycle稳定性测试方法,包括:将开关机测试脚本拷贝到服务器系统下;执行开关机测试脚本,设置开关机次数为N次;开关机测试脚本根据所设置开关机次数,使服务器运行N次开 ...
【技术保护点】
1.一种服务器GPU设备powercycle稳定性测试方法,其特征在于,包括:将开关机测试脚本拷贝到服务器系统下;执行开关机测试脚本,设置开关机次数为N次;开关机测试脚本根据所设置开关机次数,使服务器运行N次开关机动作,并在每次开关机过程中,自动获取服务器中GPU设备硬件信息,将所获取的GPU设备硬件信息与标准GPU设备硬件信息比较,输出比较结果。
【技术特征摘要】
1.一种服务器GPU设备powercycle稳定性测试方法,其特征在于,包括:将开关机测试脚本拷贝到服务器系统下;执行开关机测试脚本,设置开关机次数为N次;开关机测试脚本根据所设置开关机次数,使服务器运行N次开关机动作,并在每次开关机过程中,自动获取服务器中GPU设备硬件信息,将所获取的GPU设备硬件信息与标准GPU设备硬件信息比较,输出比较结果。2.根据权利要求1所述的服务器GPU设备powercycle稳定性测试方法,其特征在于,还包括:开关机测试脚本通过将其添加到开机启动脚本中,实现服务器运行N次开关机动作。3.根据权利要求1所述的服务器GPU设备powercycle稳定性测试方法,其特征在于,还包括:将GPU设备信息获取脚本拷贝到服务器系统下;开关机测试脚本在每次开关机过程中,通过调用并运行GPU设备信息获取脚本自动获取服务器中GPU设备硬件信息,将所获取的GPU设备硬件信息与标准GPU设备硬件信息比较,输出比较结果。4.根据权利要求3所述的服务器GPU设备powercycle稳定性测试方法,其特征在于,所述自动获取服务器中GPU设备硬件信息,将所获取的GPU设备硬件信息与标准GPU设备硬件信息比较,输出比较结果,包括:自动获取服务器中GPU设备硬件信息;判断GPU设备信息获取脚本是否为第一次执行;若是,则将该次获取的服务器中GPU设备硬件信息保存,并作为标准GPU设备硬件信息;将所获取的...
【专利技术属性】
技术研发人员:徐伟超,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。