【技术实现步骤摘要】
基于流水线控制的GPU服务器图形处理性能检测分析方法
[0001]本专利技术涉及GPU服务器图形处理性能检测分析
,具体地说是一种 基于流水线控制的GPU服务器图形处理性能检测分析方法。
技术介绍
[0002]GPU服务器是一种用于计算机科学
的计算机及其配套设备,于 2017年5月31日启用。采用新一代E5
‑
2600 v3/v4系列处理器 系统可靠性和可用性高丰富的I/O扩展Nvidia Tesla P100*8。GPU服务器 的主要功能为:地理空间数据的3D可视化,视频稳像、过滤、马赛克、转码 等应用研究与教育,例如成像和处理、结构化分析和计算物理学等天体物理 学,计算流媒体动力学,动画制作,高性能计算等气象预报,量子物理,生物 化学,设计,地质勘查等行业用户。
[0003]复杂GPU服务器硬件产品,服务器运行时GPU性能及图形处理负载不同, 实时衡量分析海量服务器的GPU负载和性能变化过程复杂,无法及时分析服务 器GPU压力及性能情况。
技术实现思路
[0004] ...
【技术保护点】
【技术特征摘要】
1.一种基于流水线控制的GPU服务器图形处理性能检测分析方法,其特征在于,该方法具体如下:S1、启动配置流水线任务:流水线控制GPU服务器图形性能检测分析的过程,分布依次执行;S2、准备压测docker镜像环境:针对不同服务器架构和GPU卡,下载不同的压测docker镜像系统;S3、执行GPU压测脚本:在运行的压测docker镜像系统中执行GPU监视脚本、GPU负载压力测试脚本、GPU图形处理性能基准测试脚本,执行过程中输出GPU温度、GPU内存占用、错误次数、FPS、Frametime和性能得分值;S4、结构化处理GPU压测结构:采用结构化处理规则从压测结果中匹配获取相关数据;S5、通过AI模型分析GPU压测结果:采用数据分析模型及算法分析数据流,生成相关差异指标数据;S6、图形处理性能稳定性评估:依据差异指标数据和评估指标,通过加权综合计算稳定性评估指标总值,评估图形处理性能稳定鲁棒性。2.根据权利要求1所述的基于流水线控制的GPU服务器图形处理性能检测分析方法,其特征在于,步骤S1中的启动配置流水线任务的实现过程具体如下:S101、启动流水线并发任务;S102、git下载流水线任务配置;S103、解析配置并提取参数;其中,参数包括任务周期信息、GPU服务器列表信息、访问目标服务器密钥信息及AI服务中心地址信息;S104、执行流水线控制过程。3.根据权利要求1所述的基于流水线控制的GPU服务器图形处理性能检测分析方法,其特征在于,步骤S2中的准备压测docker镜像环境的实现过程具体如下:S201、获取目标GPU服务器架构及GPU卡信息;S202、匹配压测docker镜像系统及版本;S203、下载匹配的压测docker镜像系统到目标GPU服务器,docker镜像系统内GPU卡驱动已安装,压测执行脚本存储在docker镜像系统内的固定目录;S204、启动目标GPU服务器上的docker镜像系统;S205、多个目标GPU服务器的情况并行执行步骤S201到步骤S204。4.根据权利要求1所述的基于流水线控制的GPU服务器图形处理性能检测分析方法,其特征在于,步骤S3中的执行GPU压测脚本的实现过程具体如下:S301、登录已运行的压测docker镜像系统;S302、启动GPU状态监视脚本;S303、监视脚本每5秒采集GPU状态,GPU状态包括GPU内存占用信息及GPU温度信息;S304、启动GPU负载压力测试脚本;S305、执行GPU负载压力测试,并输出GPU内核温度信息、GPU内存占用信息及错误次数;S306、启动GPU图形处理性能基准测试脚本;S307、执行GPU图形处理性能基准测试,并输出FPS、Frametime和性能得分值。5.根据权利要求1所述的基于流...
【专利技术属性】
技术研发人员:况天宝,唐晓东,潘峰,于沈课,
申请(专利权)人:浪潮云信息技术股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。