【技术实现步骤摘要】
一种测试GPU速率切换的方法及系统
本申请涉及GPU(GraphicsProcessingUnit,图形处理器)测试
,特别是涉及一种测试GPU速率切换的方法及系统。
技术介绍
随着人工智能技术的发展,AI计算对服务器的性能及稳定性提出了更高的要求。AI服务器中广泛采用CPU+GPU的异构形式,在AI服务器的研发与设计过程中,通常采用多项测试来保证服务器的稳定性,其中,对AI服务器中GPU稳定性的测试尤其重要。而对GPU稳定性的测试中,GPU速率切换测试又是一种有效的测试手段。因此,如何对GPU进行速率切换测试,从而验证GPU的稳定性,进而验证AI服务器的稳定性,是个重要问题。目前对GPU进行速率切换测试的方法,通常是测试人员逐个输入指令获取某个GPU的PCIEbusnumber,然后通过指令对当前GPU进行速率切换测试。然而,目前对GPU进行速率切换测试的方法中,由于一个系统中包含若干GPU,且每个系统中的GPUPCIEbusnumber可能存在差异。测试人员需要对系统中所有GPU的PCIEbusnu ...
【技术保护点】
1.一种测试GPU速率切换的方法,其特征在于,所述方法包括:/n获取当前系统中所有GPU的bus number,并将所述bus number存储至第一文件中,其中,任一GPU与一个bus number相匹配;/n获取测试总次数,并定义一测试次数变量,所述测试次数变量用于统计测试次数;/n依次读取所述第一文件中所有GPU的bus number;/n判断是否读取成功;/n如果读取成功,对当前系统中所有GPU依次进行gen1、gen2和gen3切换测试;/n对当前系统中所有GPU测试结束后,对测试次数变量加1,重新依次读取所述第一文件中所有GPU的bus number,直到测试次 ...
【技术特征摘要】
1.一种测试GPU速率切换的方法,其特征在于,所述方法包括:
获取当前系统中所有GPU的busnumber,并将所述busnumber存储至第一文件中,其中,任一GPU与一个busnumber相匹配;
获取测试总次数,并定义一测试次数变量,所述测试次数变量用于统计测试次数;
依次读取所述第一文件中所有GPU的busnumber;
判断是否读取成功;
如果读取成功,对当前系统中所有GPU依次进行gen1、gen2和gen3切换测试;
对当前系统中所有GPU测试结束后,对测试次数变量加1,重新依次读取所述第一文件中所有GPU的busnumber,直到测试次数变量达到测试总次数;
如果读取失败,测试结束。
2.根据权利要求1所述的一种测试GPU速率切换的方法,其特征在于,所述对当前系统中所有GPU依次进行gen1、gen2和gen3切换测试,包括:
对第一个GPU分别进行gen1、gen2和gen3切换测试;
判断第一个GPU的gen1、gen2和gen3切换测试是否均测试合格;
如果是,判定第一个GPU的速率切换测试合格;
如果否,判定第一个GPU的速率切换测试不合格;
将测试不合格相关的错误信息保存至第二文件中,并从第一文件中删除当前GPU,其中,所述错误信息包括:当前GPU的busnumber、报错时间以及当前报错在报错总数量中的次序;
对第二个GPU分别进行gen1、gen2和gen3切换测试,直到对当前系统中所有GPU分别进行gen1、gen2和gen3切换测试完毕。
3.根据权利要求1所述的一种测试GPU速率切换的方法,其特征在于,将测试结果存储至本地测试日志中。
4.根据权利要求1-3中任一所述的一种测试GPU速率切换的方法,其特征在于,对测试结果进行显示。
5.一种测试GPU速率切换的系统,其特征在于,所述系...
【专利技术属性】
技术研发人员:孔祥源,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。