【技术实现步骤摘要】
本申请涉及服务器硬件管理与设备定位,尤其涉及一种机架式服务器pcie设备定位方法和装置。
技术介绍
1、在云计算、人工智能及高性能计算领域的快速发展推动下,数据中心对算力的需求日益增长,机架式服务器作为核心算力载体,其高密度部署和高扩展性愈发重要。2u机架式服务器凭借在空间占用与硬件扩展性间的良好平衡,被广泛应用于ai推理、分布式计算等场景,需支持多张pcie设备(如gpu卡、高速网卡)的高密度部署。为实现这一目标,2u服务器常通过riser卡与cable-riser线缆将主板pcie信号延伸至后窗,形成集中的pcie槽位集群,最多可支持10张gpu卡同时运行,以满足大规模并行计算需求。
2、目前,机架式服务器中pcie设备的定位主要采用固定槽位编号-主板逻辑地址绑定机制。该技术方案通过服务器bios或bmc预先记录pcie槽位物理编号与主板逻辑地址的对应关系,当pcie设备插入后,系统扫描逻辑地址识别设备,并借助预设映射表确定其物理位置,运维人员通过逻辑地址查询槽位编号来定位设备。
3、但在高密度2u机架式服务
...【技术保护点】
1.一种机架式服务器PCIe设备定位方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述依序控制单个所述PCIe进行内存压力测试,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据所述内存压力测试的温度确定各个所述PCIe对应的IO区域,包括:
4.根据权利要求3所述的方法,其特征在于,在获取温度变化情况过程中还包括:
5.根据权利要求1所述的方法,其特征在于,所述二级地址是基于地址识别模块确定的,所述地址识别模块安装于Riser卡的PCB板与PCIe挡片之间空白区域,所述地址识别模块
<...【技术特征摘要】
1.一种机架式服务器pcie设备定位方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述依序控制单个所述pcie进行内存压力测试,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据所述内存压力测试的温度确定各个所述pcie对应的io区域,包括:
4.根据权利要求3所述的方法,其特征在于,在获取温度变化情况过程中还包括:
5.根据权利要求1所述的方法,其特征在于,所述二级地址是基于地址识别模块确定的,所述地址识别模块安装于riser卡的pcb板与pcie挡片之间空白区域,所述地址识别模块至少包括:
6.根据权利要求5所述的方法,其特征在于,所述弹性金属簧...
【专利技术属性】
技术研发人员:万大炎,杨立,田威,张少鹏,高会苗,
申请(专利权)人:安擎计算机信息股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。