一种网络测试方法和装置制造方法及图纸

技术编号:24466422 阅读:36 留言:0更新日期:2020-06-10 18:43
本发明专利技术公开了一种网络测试方法和装置,该方法包括:为人工智能开发平台上的节点配置为跨节点运算提供无限带宽网络的网卡,并将无限带宽网络的配置和驱动下发到节点;在节点上为网卡安装驱动并检测驱动是否正常,并响应于异常而获取错误分析日志并重新安装后再次检测;检测网卡的固件版本以确定固件是否需要升级,响应于固件需要升级而升级固件;根据配置来测试无限带宽网络的带宽和延迟、以及节点的负载情况以生成并分析测试报告;采集网卡的参数信息并反馈到人工智能开发平台以进行进一步处理;响应于测试报告指示网络正常而卸载驱动以还原节点。本发明专利技术能够快速发现异常节点和排查问题,提高工程师部署效率和服务产品竞争力。

A network testing method and device

【技术实现步骤摘要】
一种网络测试方法和装置
本专利技术涉及计算机
,更具体地,特别是指一种网络测试方法和装置。
技术介绍
AIStation是浪潮自主研发的人工智能开发平台,面向深度学习开发场景,整合计算资源、数据资源以及AI开发环境,实现计算资源统一分配调度、训练数据集中管理并加速、模型流程化开发训练,为AI研发构建敏捷高效的一体化平台。支持具有资源池化特性的GPU(图形处理器)服务器,可以实现跨节点资源分配,便于云平台GPU池化管理。AIStation平台普遍使用Mellanox网卡,Mellanox网卡在跨节点运算时提供高速稳定的InfiniBand网络,但是在AIStation安装部署过程中并不能测试网卡是否正常工作,需要人工检查,工作效率低下。针对现有技术中人工智能开发平台上的网络测试检查消耗人工、效率低下的问题,目前尚无有效的解决方案。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提出一种网络测试方法和装置,能够快速发现异常节点和排查问题,提高工程师部署效率和服务产品竞争力。基于上述目的,本专利技本文档来自技高网...

【技术保护点】
1.一种网络测试方法,其特征在于,包括执行以下步骤:/n为人工智能开发平台上的节点配置为跨节点运算提供无限带宽网络的网卡,并将所述无限带宽网络的配置和驱动下发到所述节点;/n在所述节点上为所述网卡安装所述驱动并检测所述驱动是否正常,并且响应于所述驱动异常而获取错误分析日志并重新安装后再次检测;/n响应于所述驱动正常而检测所述网卡的固件版本以确定所述固件是否需要升级,并且响应于所述固件需要升级而升级所述固件;/n响应于所述固件升级完成或者不需要升级而根据所述配置来测试所述无限带宽网络的带宽和延迟、以及所述节点的负载情况以生成并分析测试报告;/n响应于所述测试报告指示网络异常而采集所述网卡的参数信...

【技术特征摘要】
1.一种网络测试方法,其特征在于,包括执行以下步骤:
为人工智能开发平台上的节点配置为跨节点运算提供无限带宽网络的网卡,并将所述无限带宽网络的配置和驱动下发到所述节点;
在所述节点上为所述网卡安装所述驱动并检测所述驱动是否正常,并且响应于所述驱动异常而获取错误分析日志并重新安装后再次检测;
响应于所述驱动正常而检测所述网卡的固件版本以确定所述固件是否需要升级,并且响应于所述固件需要升级而升级所述固件;
响应于所述固件升级完成或者不需要升级而根据所述配置来测试所述无限带宽网络的带宽和延迟、以及所述节点的负载情况以生成并分析测试报告;
响应于所述测试报告指示网络异常而采集所述网卡的参数信息并反馈到所述人工智能开发平台以进行进一步处理;
响应于所述测试报告指示网络正常而卸载所述驱动以还原所述节点;
其中所述配置包括所述网卡的类型和拓扑结构,根据所述网卡的类型和拓扑结构来为所述网卡分组,并为每组网卡设定相同或不同最大传输单元数值来测试以生成并分析所述测试报告。


2.根据权利要求1所述的方法,其特征在于,根据所述配置来测试所述无限带宽网络的带宽和延迟、以及所述节点的负载情况包括:
在所述节点中指定一个第一节点,根据所述配置来测试所述无限带宽网络在所述第一节点的带宽和延迟、以及所述第一节点的负载情况;
基于所述第一节点的带宽和延迟、以及所述第一节点的负载情况来确定使所述无限带宽网络在所述第一节点最优化的字节长度和最大传输单元值,并根据所述最优化的字节长度和最大传输单元值来调整所述配置;
根据调整过的配置来测试所述无限带宽网络在除所述第一节点以外的其它节点的带宽和延迟、以及节点的负载情况。


3.根据权利要求1所述的方法,其特征在于,为人工智能开发平台上的节点配置为跨节点运算提供无限带宽网络的网卡包括:为不同节点配置不同网卡;将所述无限带宽网络的配置和驱动下发到所述节点包括:为不同网卡生成相对应的不同配置并下发到不同节点;所述网卡包括mellanox网卡;测试所述无限带宽网络的带宽和延迟以生成并分析测试报告包括:仅测试mellanox网卡提供的所述无限带宽网络而生成所述测试报告。


4.根据权利要求1所述的方法,其特征在于,测试所述无限带宽网络的带宽和延迟以生成并分析测试报告包括:分别通过收发不同字节长度的数据包,并根据所述数据包的字节长度来分别测试对网卡速率和延迟的影响以生成测试报告。


5.根据权利要求4所述的方法,其特征在于,所述测试报告指示网络正常包括:所述测试报告确定网卡速率和延迟处于预定阈值范围内:响应于所述测试报告指示网络异常而采集所述网卡的参数信息并反馈到所述人工智能开发平台以进行进一步处理包括:基于所述参数信息确定所述网卡的槽位和所述节点的基本输入输出系统和基板管理控制器的固件版本,并判断是否更换槽位和/或升级固件。


6.一种网络测试装置,其特征在于,包...

【专利技术属性】
技术研发人员:王连伟
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1