【技术实现步骤摘要】
AI运算装置的信号故障定位方法及定位系统
[0001]本专利技术实施例涉及AI运算装置故障分析
,尤其涉及一种AI运算装置的信号故障定位方法及定位系统。
技术介绍
[0002]AI(Artificial Intelligence,人工智能)技术在现代社会中的应用越来越广泛,AI运算装置上通常包括多个模块和承载该模块的主板,例如加速模块或运算模块等,多个模块之间存在数量巨大的链路,任何一条链路出现问题都会影响对应的两个模块之间的通信性能。
[0003]现有技术由于无法确定具体故障位置,对存在通信故障的两个模块的做法是整板替换,也即将两个模块均替换为新的模块,或者将主板进行替换,而这种方法将会极大地提高AI运算装置的维修成本,造成资源浪费。
技术实现思路
[0004]本专利技术提供一种AI运算装置的信号故障定位方法及定位系统,以精确定位AI运算装置的故障位置。
[0005]第一方面,本专利技术实施例提供了一种AI运算装置的信号故障定位方法,所述AI运算装置包括UBB和设置于所述UBB上的N个 ...
【技术保护点】
【技术特征摘要】
1.一种AI运算装置的信号故障定位方法,所述AI运算装置包括UBB和设置于所述UBB上的N个OAM模块,每个OAM模块对应UBB上的N
‑
1个SerDes,每个OAM模块对应的其中一个SerDes与其余至少一个OAM模块对应的其中一个SerDes电连接,N≥2,其特征在于,所述信号故障定位方法包括;将存在信号故障的两个OAM模块中的第一OAM模块替换为测试板,以使所述测试板上的N
‑
1组高密接口与第一OAM模块所对应的N
‑
1个SerDes一一对应电连接;其中,所述测试板与第一OAM模块匹配,所述测试板上包括N
‑
1组高密接口,每组高密接口配置有与对应的SerDes上差分端口一一对应的差分接口;将待连接高密接口连接至预设仪器,并根据所述预设仪器测试的结果分析故障位置;其中,所述待连接高密接口为测试板上对应第二OAM模块的高密接口,所述第二OAM模块为存在信号故障的两个OAM模块中未替换的OAM模块。2.根据权利要求1所述的信号故障定位方法,其特征在于,所述将待连接高密接口连接至预设仪器包括:将所述待连接高密接口连接至矢量网络分析仪,根据所述矢量网络分析仪预设参数确定OAM模块故障或UBB故障。3.根据权利要求2所述的AI运算装置的信号故障定位方法,其特征在于,所述预设参数包括阻抗,若所述待连接高密接口上的每对差分接口连接至所述矢量网络分析仪后测试的阻抗均符合预设条件,则确定是OAM模块故障;若所述待连接高密接口上有至少一对差分接口连接至所述矢量网络分析仪后测试的阻抗不符合所述预设条件,则确定是UBB故障。4.根据权利要求3所述的AI运算装置的信号故障定位方法,其特征在于,确定是OAM模块故障之后还包括;将所述待连接高密接口上的每对差分接口连接至高速示波器;控制第二OAM模块向所述待连接高密接口发送数据,并根据所述高速示波器测试的眼图确定是否为所述第二OAM模块的发送端故障。5.根据权利要求3所述的AI运算装置的信号故障定位方法,其特征在于,确定是OAM模块故障之后还包括:将所述待连接高密接口的每对差分接口连接至误码仪,利用误码仪向所述第二OAM模块的接收端发送数据,根据误码率确定是否为所述第二OAM模块的接收端故障。6....
【专利技术属性】
技术研发人员:俞武,明庆勇,师亚帆,
申请(专利权)人:上海燧原科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。