The present invention relates to the field of computer software development, in particular to an automatic detection method of multi GPU PCIE SWITCH calculation server, this method can support multiple GPU PCIE SWITCH calculation server for automatic test. The invention can automatically PCIE SWITCH server GPU collocation and consumption reduction (Thermal), PCI Express band width (bandwidth), Stress server pressure testing, greatly improve work efficiency, so as to effectively solve the problem of huge workload. The whole test flow test method is simple, highly automated, practical, and can save manpower and improve test efficiency. It is a very effective method to verify the quality of products.
【技术实现步骤摘要】
一种支持多GPU的计算型服务器的自动测试方法
本专利技术涉及计算机软件开发领域,具体涉及一种支持多GPU的PCIE-SWITCH计算型服务器的自动检测方法,通过该方法对PCIE-SWITCH服务器进行测试,能够有效检测PCIE-SWITCH服务器存在的异常状况,可以减少人力、物力及流程管理的成本,提高测试覆盖率。
技术介绍
目前在整机柜服务器领域,大型高性能、计算型服务器(PCIE-SWITCH)支持16张235瓦功率的GPU(GraphicProcessingUnit图形处理器),通过PCIE(总线和接口标准PeripheralComponentInterfaceExpress)retimer卡(时间修正卡)和MiniSASHD高速线缆外接一台服务器server使用,此时PCIE-SWITCH相当于服务器server端的PCIE设备,测试时PCIE-SWITCH也需要与服务器server联合测试。因为PCIE-SWITCH最多可支持16张GPU卡,当搭配Nvidia的GPU,使用NVQual工具测试GPU时,测试项较多、每个测试项较长,故工作量极大。针对上述问题,本申请专利技术了一种支持多GPU的PCIE-SWITCH计算型服务器的自动化测试方法,能够自动进行PCIE-SWITCH服务器搭配GPU进行减耗(Thermal)、PCIExpress频带宽度(bandwidth)、服务器承受压力Stress的测试,大大提高工作效率,从而有效地解决上述工作量巨大的问题。整个测试流程测试方法操作简单,自动化程度高,实用性较强,能够节省人力,提高测试效率,是验证产品 ...
【技术保护点】
一种支持多GPU的PCIE‑SWITCH计算型服务器的自动检测方法,该检测方法具体包括如下步骤:a、将PCIE‑SWITCH服务器与server连接;b、开启PCIE‑SWITCH服务器,1分钟后开启server;c、将测试主程序拷贝在server的操作系统下面;d、根据测试需求配置配置文件;e、运行测试主程序。
【技术特征摘要】
1.一种支持多GPU的PCIE-SWITCH计算型服务器的自动检测方法,该检测方法具体包括如下步骤:a、将PCIE-SWITCH服务器与server连接;b、开启PCIE-SWITCH服务器,1分钟后开启server;c、将测试主程序拷贝在server的操作系统下面;d、根据测试需求配置配置文件;e、运行测试主程序。2.如权利要求1所述的自动检测方法,其特征还在于,是用MiniSASHD线缆将PCIE-SWITCH服务器与server连接。3.如权利要求2所述的自动检测方法,其特征还在于,所述的测试主程序具体包括如下步骤:读取通过命令行输入的参数;判断参数值,当参数值为f时,传递参数并读取配置文件;卸载操作系统自带的nvidia驱动,安装NVQual测试程序,并启动该测试程序进行GPU测试;当参数值为h时,显示帮助信息;当参数值为v时,显示版本信息;当参数值为h、v、f以外的值时,显示错误信息。4.如权利要求3所述的自动检测方法,其特征在于,所述的NVQual测试程序,具体包括以下步骤:读取用户设置的减耗循环检测参数,根据用户设定的检测次数,对GPU进行thermal循环检测。5.如权利要求4所述的自动检测方法,其特征在于,所述的NVQua...
【专利技术属性】
技术研发人员:肖欢,韩超,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。