System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术具体涉及测试领域,具体是一种国产异构平台人工智能加速卡的训练性能测试方法及系统。
技术介绍
1、随着语言大模型、数据分析及高性能数据分析等计算密集型人工智能应用的增多,人工智能(ai)成为数字经济的重要基础设施。所谓异构计算,就是将不同厂家、不同架构的芯片放在一个统一的计算机系统中,通过软件的调度,来实现人工智能计算的一种方式。目前采用cpu+专用ai芯片的国产异构平台成为高性能计算的首选。相比于传统的中央处理器(cpu)和图形处理器(gpu),配有人工智能加速卡的国产异构平台具有更高的计算效率,它最大的优点是具有比传统处理器具备更高的效率和更低延迟的计算性能。人工智能加速卡的主要特点是高并发、高性能,可以大幅缩短训练模型的时间,提高训练效率。
2、加速卡是一种可直接插接到服务器的标准总线接口插槽上,实现加密运算、解密运算和解压缩运算功能的板卡,在将加速卡插接到服务器的标准总线接口插槽之后,通常还需要对加速卡的性能进行测试。
3、随着国内关键核心技术自主可控应用工作的加速推进,国产人工智能加速卡开始奋起直追,逐步推出新产品,但国产加速卡在不同的硬件平台上的性能无法直接比较,各厂家均采用自己的一套软件和测试方法进行性能测试,各家得分不能直接进行横向对比得出性能优劣。经检索,公开号为cn106815110a的专利技术专利公开了一种加速卡测试方法及装置,方法应用于测试服务器,包括:获取并安装qat驱动程序;获取并安装openssl驱动程序;接收外部设备发送的测试请求,根据所述测试请求触发所述qat驱动
技术实现思路
1、本专利技术的目的在于提供一种国产异构平台人工智能加速卡的训练性能测试方法及系统,以解决上述
技术介绍
中提出的目前业界采用的测试方法往往比较复杂,通用性不强,不方便评估的问题。
2、为实现上述目的,本专利技术提供如下技术方案:
3、一种国产异构平台人工智能加速卡的训练性能测试方法,包括以下步骤:
4、s10、确认测试指标,在终端系统将模型训练到目标质量指标的速度;
5、s20、搭建测试环境,准备软硬件平台,其中,硬件平台采用一机四卡的配置模式,所述软件平台为ai基准性能测试软件;
6、s30、采用固定ai框架和模型下的使用性能对比作为评测指标,选取具有通用性的ai框架和模型,执行测试过程,运行训练数据;
7、s40、当训练结果为达到精度指标时,记录模型训练所用的时间、性能结果、功耗结果,完成测试。
8、作为本专利技术进一步的方案:所述测试指标包括训练跑分、训练精度、训练能耗和最大吞吐性能。
9、作为本专利技术再进一步的方案:所述一机四卡的配置模式为异构计算平台和四个人工智能加速卡。
10、作为本专利技术再进一步的方案:选用ai基准性能测试软件,进行基准性能测试的方法,包括以下步骤:
11、s21、运行mlperf,进行ai基准测试,mlperf训练基准测试代表了流行的ai用例,包括语音识别、自然语言处理、推荐系统、目标检测、图像分类等;
12、s22、将mlperf库拷到本地,建立镜像,启动镜像,调整参数,启动benchmark记录测试结果。
13、作为本专利技术再进一步的方案:步骤s30中,ai框架选择时,选取paddlepaddle作为训练框架,进行安装,并设置可训练参数。
14、作为本专利技术再进一步的方案:步骤s30中,选取ai模型时,选用盘古大模型作为优先选用的测试模型,进行安装。
15、作为本专利技术再进一步的方案:步骤s30中,执行测试过程,运行训练数据的方法,包括以下步骤:
16、s31、进行目标训练,导入训练数据,并进行配置,在当前路径下生成train文件夹;
17、s32、进入train目录,训练脚本log中包括性能信息,包括数据准确率及吞吐量等;
18、s33、获得测试结果,完成测试。
19、作为本专利技术再进一步的方案:步骤s40中,根据训练结果文件,记录训练吞吐量数值和正确率情况,评估即时准确率,生成训练性能测试结果,完成测试。
20、一种国产异构平台人工智能加速卡的训练性能测试系统,包括:
21、测试指标确认模块,所述测试指标确认模块用于确认测试指标,在终端系统将模型训练到目标质量指标的速度,测试指标主要包括四个:训练跑分、训练精度、训练能耗和最大吞吐性能;
22、测试环境搭建模块,所述搭建测试环境用于搭建测试环境,所述测试环境包括硬件测试平台和软件测试平台,其中,硬件测试平台采用一机四卡的配置模式进行硬件平台搭建,所述软件平台为ai基准性能测试软件;
23、测试模块,所述测试模块用于采用固定ai框架和模型下的使用性能对比作为评测指标,选取具有通用性的ai框架和模型,执行测试过程,运行训练数据;
24、训练结果判断模块,所述训练结果判断模块用于判断训练结果是否达到精度指标,当训练结果达到精度指标时,记录模型训练所用的时间、性能结果、功耗结果,完成测试。
25、作为本专利技术再进一步的方案:所述一机四卡的配置模式为异构计算平台和四个人工智能加速卡,所述异构计算平台与四个人工智能加速卡通过pcie总线连接。
26、与现有技术相比,本专利技术的有益效果是:本专利技术能够对国产异构计算平台下的不同人工智能加速卡的训练性能测试提供一种通用测试方法,来实现对国产异构计算平台下训练性能的调测,提高了人工智能加速卡的测试效率;本专利技术对人工智能加速卡进行了训练性能测试,确保能够在国产国产异构平台上测试人工智能加速卡训练性能指标,而且对不同的人工智能加速卡均适用,方便实用,方便地实现了在国产异构计算平台上的人工智能加速卡训练性能测试。
本文档来自技高网...【技术保护点】
1.一种国产异构平台人工智能加速卡的性能测试方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的国产异构平台人工智能加速卡的性能测试方法,其特征在于,所述测试指标包括训练跑分、训练精度、训练能耗和最大吞吐性能。
3.根据权利要求1所述的国产异构平台人工智能加速卡的性能测试方法,其特征在于,所述一机四卡的配置模式为异构计算平台和四个人工智能加速卡。
4.根据权利要求1所述的国产异构平台人工智能加速卡的性能测试方法,其特征在于,选用AI基准性能测试软件,进行基准性能测试的方法,包括以下步骤:
5.根据权利要求1所述的国产异构平台人工智能加速卡的性能测试方法,其特征在于,步骤S30中,AI框架选择时,选取PaddlePaddle作为训练框架,进行安装,并设置可训练参数。
6.根据权利要求1所述的国产异构平台人工智能加速卡的性能测试方法,其特征在于,步骤S30中,选取AI模型时,选用盘古大模型作为优先选用的测试模型,进行安装。
7.根据权利要求1所述的国产异构平台人工智能加速卡的性能测试方法,其特征在于,步骤S
8.根据权利要求1所述的国产异构平台人工智能加速卡的性能测试方法,其特征在于,步骤S40中,根据训练结果文件,记录训练吞吐量数值和正确率情况,评估即时准确率,生成训练性能测试结果,完成测试。
9.一种国产异构平台人工智能加速卡的性能测试系统,其特征在于,包括:
10.根据权利要求1所述的国产异构平台人工智能加速卡的性能测试系统,其特征在于,所述一机四卡的配置模式为异构计算平台和四个人工智能加速卡,所述异构计算平台与四个人工智能加速卡通过PCIE总线连接。
...【技术特征摘要】
1.一种国产异构平台人工智能加速卡的性能测试方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的国产异构平台人工智能加速卡的性能测试方法,其特征在于,所述测试指标包括训练跑分、训练精度、训练能耗和最大吞吐性能。
3.根据权利要求1所述的国产异构平台人工智能加速卡的性能测试方法,其特征在于,所述一机四卡的配置模式为异构计算平台和四个人工智能加速卡。
4.根据权利要求1所述的国产异构平台人工智能加速卡的性能测试方法,其特征在于,选用ai基准性能测试软件,进行基准性能测试的方法,包括以下步骤:
5.根据权利要求1所述的国产异构平台人工智能加速卡的性能测试方法,其特征在于,步骤s30中,ai框架选择时,选取paddlepaddle作为训练框架,进行安装,并设置可训练参数。
6.根据权利要求1所述的国产异构平...
【专利技术属性】
技术研发人员:吴登勇,马丽丽,吴德超,
申请(专利权)人:西安超越申泰信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。