一种GPU的设备信息获取方法及装置制造方法及图纸

技术编号:20622112 阅读:26 留言:0更新日期:2019-03-20 14:13
本申请提供了一种GPU的设备信息获取方法,所述方法包括:分别从系统层和物理层获取GPU设备数量及GPU的ID;判断从系统层获取的GPU设备数量及GPU的ID与从物理层获取的GPU设备数量及GPU的ID是否相同;判断相同时,分别从所述系统层和所述物理层获取GPU的设备信息。利用本申请提供了一种GPU的设备信息获取方法,操作简单,实用性强,能够减少了人工操作及干预的时间。本申请还提供了一种GPU的设备信息获取装置。

A GPU Equipment Information Acquisition Method and Device

This application provides a GPU device information acquisition method, which includes: acquiring the number of GPU devices and the ID of GPU from the system layer and the physical layer respectively; judging whether the number of GPU devices and the ID of GPU obtained from the system layer are the same as the number of GPU devices obtained from the physical layer and the ID of GPU; and acquiring GPU device information from the system layer and the physical layer respectively when identical. This application provides a GPU device information acquisition method, which is simple to operate and practical, and can reduce the time of manual operation and intervention. The application also provides a GPU device information acquisition device.

【技术实现步骤摘要】
一种GPU的设备信息获取方法及装置
本专利技术涉及计算机
,尤其涉及一种GPU的设备信息获取方法及装置。
技术介绍
目前随着AI技术应用越来越广泛,带有GPU设备的服务器产品是不可缺少的重要硬件部分,用于图形、图像处理领域的GPU可以并行处理大量数据,非常适合深度学习的高并行、高本地化数据场景,是目前主流的AI人工智能计算架构。NVIDIA的GPU目前在服务器产品中占主导地位,在实际设计中,GPU的数量动辄8个,16个,未来设计可能会更多的数量,针对此状况服务器产品开发过程中对于GPU信息抓取比对暂时没有一个有效直观的工具及方法,依靠人为的进行每个GPU设备的信息比对效率比较低而且出现遗漏错误。而且目前开发过程中已经有出现系统下GPU数量在不同环境下信息不同的异常发生。
技术实现思路
为了解决现有技术存在的上述技术问题,本申请提供了一种GPU的设备信息获取方法及装置,应用于服务器GPU设备的数量及信息抓取,操作简单,实用性强,能够减少了人工操作及干预的时间。本申请提供了一种GPU设备的信息获取方法,所述方法包括:分别从系统层和物理层获取GPU设备数量及GPU的ID;判断从系统层获取的GPU设备数量及GPU的ID与从物理层获取的GPU设备数量及GPU的ID是否相同;判断相同时,分别从所述系统层和所述物理层获取GPU的设备信息。可选的,若从所述系统层获取的GPU设备数量及GPU的ID与从所述物理层获取的GPU设备数量及GPU的ID不同,所述方法还包括:中断进程,并及时的进行错误提示。可选的,所述GPU的设备信息至少包括以下其中一种:GPU设备的带宽速率、GPU数量和显卡基本输入输出系统VBIOS。可选的,所述分别从所述系统层和所述物理层获取GPU的设备信息后,所述方法还包括:将从所述系统层和所述物理层获取的所述GPU的设备信息,分别保存到不同的日志文件中。可选的,所述方法还包括,对所述GPU的ID进行排序处理。本申请实施例还提供了一种GPU设备的信息获取装置,所述装置包括:第一获取模块、判断模块和第二获取模块;所述第一获取模块,用于分别从系统层和物理层获取GPU设备数量及GPU的ID;所述判断模块,用于判断从系统层获取的GPU设备数量及GPU的ID与从物理层获取的GPU设备数量及GPU的ID是否相同;所述第二获取模块,用于判断相同时,分别从所述系统层和所述物理层获取GPU的设备信息。可选的,其特征在于,若从所述系统层获取的GPU设备数量及GPU的ID与从所述物理层获取的GPU设备数量及GPU的ID不同,所述判断模块,还用于:中断进程,并及时的进行错误提示。可选的,其特征在于,所述GPU的设备信息至少包括以下其中一种:GPU设备的带宽速率、GPU数量和显卡基本输入输出系统VBIOS。可选的,所述装置还包括:存储模块;所述存储模块,用于将从所述系统层和所述物理层获取的所述GPU的设备信息,分别保存到不同的日志文件中。可选的,所述第一获取模块和所述第二获取模块,还用于对所述GPU的ID进行排序处理。与现有技术相比,本专利技术至少具有以下优点:本申请提供了一种GPU设备的信息获取方法,所述方法包括:分别从系统层和物理层获取GPU设备数量及GPU的ID;判断从系统层获取的GPU设备数量及GPU的ID与从物理层获取的GPU设备数量及GPU的ID是否相同;若相同,分别从所述系统层和所述物理层获取GPU信息。利用本申请提供了一种GPU设备的信息获取方法,操作简单,实用性强,能够减少了人工操作及干预的时间。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本申请实施例一提供的一种GPU设备的信息获取方法的流程图;图2为本申请实施例二提供的一种GPU设备的信息获取装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一:本申请实施例一提供了一种GPU设备的信息获取方法,下面结合附图进行具体说明。参见图1,该图为本申请实施例一提供的一种GPU设备的信息获取方法的流程图。所述方法包括以下步骤:S101:分别从系统层和物理层获取GPU设备数量及GPU的ID。S102:判断从系统层获取的GPU设备数量及GPU的ID与从物理层获取的GPU设备数量及GPU的ID是否相同。S103:判断相同时,分别从所述系统层和所述物理层获取GPU的设备信息。下面具体介绍本申请实施例所述方法的实现过程:1.GPU设备数量及ID的获取分别通过NVIDIAdriver中nvidia-smi工具从系统层获取服务器端识别到的GPU设备数量及ID,物理层面通过lspci获取服务器识别到的GPU设备数量及BUSID,并将两者进行比对判断.如果两次获取到的设备信息不同会中断程序进程,并及时的进行错误信息输出提醒开发测试人员,需要及时的查看问题所在.如果信息比对相同,程序继续向下执行.#!/bin/bashCur_Dir=`dirname$0`rm-rf$Cur_Dir/GPU_pci_info.log$Cur_Dir/GPU_smi_info.log#删除脚本生成的历史记录日志nvidia-smi-a|grep"ProductName"-B1|grepGPU|cut-d":"-f2-$NF|tr[a-z][A-Z]>$Cur_Dir/smi_list_tmp#使用驱动nvidia-smi工具从系统层获取GPU设备的IDlspci|grepNVIDIA|grep"VGAcompatiblecontroller"|awk'{print$1}'|tr[a-z][A-Z]>$Cur_Dir/pci_list_tmp#获取GPU设备的BUSID号cat$Cur_Dir/smi_list_tmp|sort>$Cur_Dir/smi_listcat$Cur_Dir/pci_list_tmp|sort>$Cur_Dir/pci_list#分别对上面部分获取到的ID号进行排序处理diff$Cur_Dir/smi_list$Cur_Dir/pci_listif[!$?-eq0];thenecho"GPUDeviceQualityisDifferentinNVIDIA-SMIandPCIDevice,PleaseCheckIt!!!!!"exit1fi#比对两种方式获取到的GPUID设备数量及地址是否相同,并作出相对应的响应操作2.GPU设备信息的获取此部分仍旧是通过两种途径分别取抓取GPU设备信息,分别是通过NVIDIAdriver中nvidia-smi工具从系统层和lspci从物理层上获取.最终将两种途径获取到GPU设备信息分别保存到不同的日志记录中,方便后本文档来自技高网
...

【技术保护点】
1.一种GPU设备的信息获取方法,其特征在于,所述方法包括:分别从系统层和物理层获取GPU设备数量及GPU的ID;判断从系统层获取的GPU设备数量及GPU的ID与从物理层获取的GPU设备数量及GPU的ID是否相同;判断相同时,分别从所述系统层和所述物理层获取GPU的设备信息。

【技术特征摘要】
1.一种GPU设备的信息获取方法,其特征在于,所述方法包括:分别从系统层和物理层获取GPU设备数量及GPU的ID;判断从系统层获取的GPU设备数量及GPU的ID与从物理层获取的GPU设备数量及GPU的ID是否相同;判断相同时,分别从所述系统层和所述物理层获取GPU的设备信息。2.根据权利要求1所述的GPU的设备信息获取方法,其特征在于,若从所述系统层获取的GPU设备数量及GPU的ID与从所述物理层获取的GPU设备数量及GPU的ID不同,所述方法还包括:中断进程,并及时的进行错误提示。3.根据权利要求1所述的GPU设备的信息获取方法,其特征在于,所述GPU的设备信息至少包括以下其中一种:GPU设备的带宽速率、GPU数量和显卡基本输入输出系统VBIOS。4.根据权利要求1所述的GPU设备的信息获取方法,其特征在于,所述分别从所述系统层和所述物理层获取GPU的设备信息后,所述方法还包括:将从所述系统层和所述物理层获取的所述GPU的设备信息,分别保存到不同的日志文件中。5.根据权利要求1所述的GPU设备的信息获取方法,其特征在于,所述方法还包括,对所述GPU的ID进行排序处理。6.一种GPU设备的信息获取装置,其特征在于,所述装...

【专利技术属性】
技术研发人员:徐伟超
申请(专利权)人:浪潮电子信息产业股份有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1