一种Linux下人工交互的NVIDIA GPU自动化测试方法技术

技术编号:10866753 阅读:212 留言:0更新日期:2015-01-07 07:58
本发明专利技术公开了一种Linux下人工交互的NVIDIA GPU自动化测试方法,其具体实现过程为:搭建测试平台;准备测试环境;确认GPU数量;安装GPU驱动工具;确认GPU信息;运行压力测试并泉城监控;确认结果后结束测试。该一种Linux下人工交互的NVIDIA GPU自动化测试方法与现有技术相比,通过系统从硬件抓取到的信息与人工交互确认,对NVIDIA GPU能够达到双层验证效果,并且可以自动检测判断有无未识别的GPU卡,实用性强,有效确保了服务器的稳定性,是验证产品质量的非常有效的方法。

【技术实现步骤摘要】
—种Linux下人工交互的NVIDIA GPU自动化测试方法
本专利技术涉及服务器配件测试
,具体地说是一种实用性强、Linux下人工交互的NVIDIA GPU自动化测试方法。
技术介绍
随着服务器行业的高速发展,在各个领域中越来越多的客户采用大批量的服务器运行自己的核心应用。目前国内各个服务器供应商,为了满足图形计算和大型集群计算需求的客户,推出多款计算能力更强的配置NVIDIA GPU的高性能服务器。 针对NVIDIA GPU配置的服务器系统,多数是基于手动的方式进行系统下的调试配置及压力测试,这样就会加大人力和时间的投入,同时人为输入复杂指令容易产生错误。 随着服务器出货量的不断增加,在保证产品的稳定性及可靠性之外,产品检测的流程化、自动化、高效化也变得必不可少。 GPU从硬件上支持T&L (TransformandLighting,多边形转换与光源处理),而T&L是3D渲染中的一个重要部分,也可以称为“几何处理”。同时GPU已经不再局限于3D图形处理了,事实也证明在浮点运算、并行计算等部分计算方面,GPU可以提供数十倍乃至于上百倍于CPU的性能。 在高性能业务的3D图形处理及浮点运算、并行计算中,GPU会产生大量的散热,GPU的散热及性能带宽测试变的尤为重要。 基于此,现提供,该方法通过编写自动化测试脚本实现,尽可能减少人工交互过程,实现流水线化检测的目的,实用性强。
技术实现思路
本专利技术的技术任务是针对以上不足之处,提供一种实用性强、Linux下人工交互的NVIDIA GPU自动化测试方法。 ,其具体实现过程为:一、搭建测试平台,安装NVIDIAGPU到服务器;二、准备测试环境;三、确认GPU被识别数量,待全部确认正常后进入下一步;四、安装GPU驱动并自动加载CUDA安装配置;五、确认并判断GPU信息是否相符,相符则进入下一步;六、运行压力测试,在测试过程中对脚本参数选项修改,以实现进行不同压力值的测试项及不同的测试时间;七、查看确认结果是否满足GPU出厂标准;八、测试结束。 所述测试环境包括安装操作系统、选择磁盘分区及软件包,所述的操作系统是指Redhat Linux 系统或 Centos 系统。 所述步骤三中GPU识别数量的判断通过人工交互完成,该识别过程包括:通过系统命令对NVIDIA GPU的数量进行判断;人工手动输入订单实际GPU数量进行比对,正确则自动进行下一步。 所述步骤四的详细过程为: 在/etc/rc.local文件中写入屏蔽firewall、selinux及删除系统自带显卡驱动;自动安装GPU驱动,失败自动生成log文件以供分析,成功则自动加载CUDA安装配置。 所述步骤五中GPU信息的判断人工交互完成,其详细过程为:自动安装freeglut、cuda驱动,失败则自动生成log文件以供分析; 将CUDA的PATH及LD_LIBRARY_PATH路径的环境配置写入/root/, bashrc文件;自动显示GPU信息型号,失败则提示check,成功则自动重启,并进入下一步。 本专利技术的,具有以下优点: 该专利技术的通过系统命令及自动加载CUDA TOOL软件对GPU数量及型号进行检测,加以人工交互确认,提高检测的精准度;使用自动化测试脚本,通过对GPU驱动、环境配置以及压力测试的自动安装运行,大大减少了人力及时间的投入,提高产能;实现NVIDIA GPU服务器产品检测的流程化、自动化、高效化,实用性强,适用范围广泛,易于推广。 【附图说明】 附图1为本专利技术实现流程图。 【具体实施方式】 下面结合附图和具体实施例对本专利技术作进一步说明。 本专利技术提供,如附图1所示,其具体实现过程为:一、搭建测试平台,安装NVIDIAGPU到服务器;二、准备测试环境;三、确认GPU被识别数量,待全部确认正常后进入下一步;四、安装GPU驱动并自动加载CUDA安装配置;五、确认并判断GPU信息是否相符,相符则进入下一步;六、运行压力测试,在测试过程中对脚本参数选项修改,以实现进行不同压力值的测试项及不同的测试时间;七、查看确认结果是否满足GPU出厂标准;八、测试结束。 所述测试环境包括安装操作系统、选择磁盘分区及软件包,所述的操作系统是指Redhat Linux 系统或 Centos 系统。 所述步骤三中GPU识别数量的判断通过人工交互完成,该识别过程包括:通过系统命令对NVIDIA GPU的数量进行判断;人工手动输入订单实际GPU数量进行比对,正确则自动进行下一步。 部分脚本内容如下: a='lspci |grep _i 〃3D controller: nVidia |wc -1' echo -n 〃Please Enter Physical GPU Number [1/2]:〃 read Num case ${Num} inI) if [ ! $a == I ]; then echo -e 〃\033[41;37m GPU missing \033[0m else./gpu.shFi0 所述步骤四的详细过程为:在/etc/rc.local文件中写入屏蔽firewall、selinux及删除系统自带显卡驱动;自动安装GPU驱动,失败自动生成log文件以供分析,成功则自动加载CUDA安装配置。 部分脚本内容如下: setenforce O echo ^setenforce 0〃 >>/etc/rc.localecho 〃iptables _F〃 >>/etc/rc.localecho 〃rmmod nouveau〃 >>/etc/rc.local sh NVIDIA-Linux-x86_64-319.60.run -a _s —no-x-check if [$!= 0 ]; then echo -e 〃\033[31m \033[05m GPU driver install FAIL\033[0m echo 〃GPU driver FAIL〃 >> /root/gpu_log.txt else sh /home/cuda.sh。 所述步骤五中GPU信息的判断人工交互完成,其详细过程为:自动安装freeglut、cuda驱动,失败则自动生成log文件以供分析; 将CUDA的PATH及LD_LIBRARY_PATH路径的环境配置写入/root/, bashrc文件;自动显示GPU信息型号,失败则提示check,成功则自动重启,并进入下一步。 部分脚本内容如下: sh cuda_5.5.22_linux_64.run -silent -toolkit -samplesif [$!= 0 ]; then echo -e 〃\033[31m \033[05m CUDA install fail\033[0mecho 〃cuda install fail〃 >>/root/gpu_log.txtfi echo ^export PATH=/usr/local/cuda-5.5/bin:SPATH^ >&本文档来自技高网...

【技术保护点】
一种Linux下人工交互的NVIDIA GPU自动化测试方法,其特征在于其具体实现过程为:一、搭建测试平台,安装NVIDIA GPU到服务器;二、准备测试环境;三、确认GPU被识别数量,待全部确认正常后进入下一步;四、安装GPU驱动并自动加载CUDA安装配置;五、确认并判断GPU信息是否相符,相符则进入下一步;六、运行压力测试,在测试过程中对脚本参数选项修改,以实现进行不同压力值的测试项及不同的测试时间;七、查看确认结果是否满足GPU出厂标准;八、测试结束。

【技术特征摘要】
1.一种Linux下人工交互的NVIDIA GPU自动化测试方法,其特征在于其具体实现过程为: 一、搭建测试平台,安装NVIDIAGPU到服务器; 二、准备测试环境; 三、确认GPU被识别数量,待全部确认正常后进入下一步; 四、安装GPU驱动并自动加载CUDA安装配置; 五、确认并判断GPU信息是否相符,相符则进入下一步; 六、运行压力测试,在测试过程中对脚本参数选项修改,以实现进行不同压力值的测试项及不同的测试时间; 七、查看确认结果是否满足GPU出厂标准; 八、测试结束。2.根据权利要求1所述的一种Linux下人工交互的NVIDIAGPU自动化测试方法,其特征在于:所述测试环境包括安装操作系统、选择磁盘分区及软件包,所述的操作系统是指Redhat Linux 系统或 Centos 系统。3.根据权利要求2所述的一种Linux下人工交互的NVIDIAGPU自动化测试方法,其特征在于:所述步骤三中GPU识别数量的判断通过人工交互完成,该...

【专利技术属性】
技术研发人员:苗永威田绍清
申请(专利权)人:浪潮电子信息产业股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1