一种板卡监控结合算力的网络设备健康评估方法技术

技术编号:37708784 阅读:11 留言:0更新日期:2023-06-01 23:59
本发明专利技术公开了一种板卡监控结合算力的网络设备健康评估方法,包括:根据DCRMS中网络设备的板卡,设置监测指标,并将监测指标关系映射生成监控标记;根据生成监控标记中的板卡IP解析监控标记,并通过故障预测模型分别对监测指标进行故障预测,得到监控指标预测结果;根据监控指标预测结果,分别计算各项监控指标预测结果的得分,并将得分汇总,得到网络设备的综合健康评估得分;当综合健康评估得分为1

【技术实现步骤摘要】
一种板卡监控结合算力的网络设备健康评估方法


[0001]本专利技术属于绿色机房
,具体地,涉及一种板卡监控结合算力的网络设备健康评估方法。

技术介绍

[0002]数据中心机房监控系统(Datacenter computer room monitoring systen,DCRMS)是网络设备运行基础环境,基础环境是否正常,直接影响机房内网络设备的正常运行,网络设备主要由多板卡组成,每个板卡包括独立的CPU、内存等,目前主要通过CPU、内存、风扇使用率和温度等进行DCRMS的评估,没有考虑网络设备的老旧、算力不足等情况。
[0003]网络设备的年限、算力等健康度指标,是评估网络设备健康重要度指标,网络设备使用时间比较长和高算力长时间运转,直接影响网络设备的整体性能。

技术实现思路

[0004]针对现有技术中存在的问题,本专利技术提供了一种板卡监控结合算力的网络设备健康评估方法,对DCRMS中的网络设备通过板卡算力指标监测结合板卡寿命指标,预测网络设备的健康程度。
[0005]为实现上述技术目的,本专利技术采用如下技术方案:一种板卡监控结合算力的网络设备健康评估方法,具体包括如下步骤:
[0006]步骤1、根据DCRMS中网络设备的板卡,设置监测指标,并将监测指标关系映射生成监控标记;
[0007]步骤2、根据生成监控标记中的板卡IP解析监控标记,并通过故障预测模型分别对监测指标进行故障预测,得到监控指标预测结果;
[0008]步骤3、根据监控指标预测结果,分别计算各项监控指标预测结果的得分,并将得分汇总,得到综合健康评估得分;当综合健康评估得分为1

3分时,所述网络设备为不健康状态;当综合健康评估得分为3

6分时,所述网络设备为亚健康状态;当综合健康评估得分为6

9分时,所述网络设备为健康状态。
[0009]进一步地,所述监控指标包括:板卡基础指标、板卡算力指标、板卡寿命指标;所述板卡基础指标包括:CPU、内存、硬盘三个维度。
[0010]进一步地,所述板卡算力指标中算力的计算过程为:
[0011][0012]其中,C
br
为分布式组网内各地方边缘点的算力节点的总算力需求,n为逻辑运算芯片数量,i为n的索引,f(a
i
)为逻辑运算的映射函数,α
i
为第i个逻辑运算芯片的映射比例系
数,q1(TOPS)为逻辑运算的冗余算力;m为并行计算芯片数量,j为m的索引,f(b
j
)为并行计算的映射函数,β
j
为第j个并行计算芯片的映射比例系数,q2(FLOPS)为并行计算的冗余算力;p为神经网络加速芯片的数量,k为p的索引,f(c
k
)为神经网络加速的映射函数,γ
k
为第k个神经网络加速芯片的映射比例系数,q3(FLOPS)为神经网络加速的冗余算力。
[0013]进一步地,所述监控标记格式为:板卡IP###板卡板卡基础指标###板卡寿命指标###板卡算力指标###关联板卡。
[0014]进一步地,所述故障预测模型为:
[0015]Y(t)=F(u(t),a(t))
[0016]其中,Y(t)为监控指标预测结果,u(t)为监测指标,a(t)为各种不明因素,t为时间,F()为故障预测的变化函数。
[0017]进一步地,所述监控指标预测结果中若板卡基础指标预测结果的三个维度均正常,则板卡基础指标预测结果得3分;若板卡基础指标预测结果的三个维度中的任意1个或2个出现异常,则板卡基础指标预测结果得分2分;若板卡基础指标预测结果的三个维度均异常,则板卡基础指标预测结果得分1分。
[0018]进一步地,所述监控指标预测结果中若板卡寿命指标预测结果在一年内,则板卡寿命指标预测结果得分为2分;若板卡寿命指标预测结果在一年到两年之间,则板卡寿命指标预测结果得分为3分;若板卡寿命指标预测结果在两年到三年之间,则板卡寿命指标预测结果得分为1分。
[0019]进一步地,所述监控指标预测结果中若板卡算力指标预测结果显示本次多块板卡预测的算力均比上一次多块板卡预测的算力增加50%以上,且板卡基础指标预测结果中出现异常的超过1个,或本次多块板卡预测的算力均与上一次多块板卡预测的算力之差不超过50%,则板卡算力指标预测结果得分为1分;若板卡算力指标预测结果显示本次多块板卡预测的算力均比上一次多块板卡预测的算力增加50%以上,且板卡基础指标预测结果中未出现异常,则板卡算力指标预测结果得分为3分;若板卡算力指标预测结果显示本次多块板卡预测的算力均比上一次多块板卡预测的算力增加50%以上,且板卡基础指标预测结果中只有1个异常,则板卡算力指标预测结果得分为2分。
[0020]进一步地,本专利技术还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序使计算机执行所述的板卡监控结合算力的网络设备健康评估方法。
[0021]进一步地,本专利技术还提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行计算机程序时,实现所述的板卡监控结合算力的网络设备健康评估方法。
[0022]与现有技术相比,本专利技术具有如下有益效果:本专利技术网络设备健康评估方法通过根据DCRMS中网络设备的板卡,设置监测指标,并生成监控标记,通过监控标记可以快速了解各监控指标评分情况;本专利技术通过板卡算力指标预测结果代替传统软件监控和硬件关注质保设置不同阈值避免误报部分对设备进行监控预警,从而避免了现有技术过多关注网络,业务应用软件健康程度,而忽略硬件健康的情况。
附图说明
[0023]图1为本专利技术板卡监控结合算力的网络设备健康评估方法的流程图;
[0024]图2为本专利技术中对监测指标进行故障预测的流程图。
具体实施方式
[0025]下面将结合本专利技术的附图,对本专利技术中的技术方案进行清楚、完整的描述,显然,所描述仅仅是本专利技术一部分,而不是全部。基于本专利技术中的具体实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0026]如图1为本专利技术板卡监控结合算力的网络设备健康评估方法,具体包括如下步骤:
[0027]步骤1、根据DCRMS中网络设备的板卡,设置监测指标,并将监测指标关系映射生成监控标记,本专利技术中监控标记格式为:板卡IP###板卡板卡基础指标###板卡寿命指标###板卡算力指标###关联板卡,现有技术中的各指标的评分情况需要逐条查询数据库获取,通过生成监控标记可通过监测指标一次性查询得到评分结果,避免反复查询数据库造成的资源消耗。
[0028]本专利技术中监控指标包括:板卡基础指标、板卡算力指标、板卡寿命指标,全方面了解网络设备的健康情况,由于现有技术注重软件健康度,本专利技术从板卡监控指标出发,更加细颗粒度地了解网络设备的健康情况;同时,准确判断网本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种板卡监控结合算力的网络设备健康评估方法,其特征在于,具体包括如下步骤:步骤1、根据DCRMS中网络设备的板卡,设置监测指标,并将监测指标关系映射生成监控标记;步骤2、根据生成监控标记中的板卡IP解析监控标记,并通过故障预测模型分别对监测指标进行故障预测,得到监控指标预测结果;步骤3、根据监控指标预测结果,分别计算各项监控指标预测结果的得分,并将得分汇总,得到所述网络设备的综合健康评估得分;当综合健康评估得分为1

3分时,所述网络设备为不健康状态;当综合健康评估得分为3

6分时,所述网络设备为亚健康状态;当综合健康评估得分为6

9分时,所述网络设备为健康状态。2.根据权利要求1所述的一种板卡监控结合算力的网络设备健康评估方法,其特征在于,所述监控指标包括:板卡基础指标、板卡算力指标、板卡寿命指标;所述板卡基础指标包括:CPU、内存、硬盘三个维度。3.根据权利要求2所述的一种板卡监控结合算力的网络设备健康评估方法,其特征在于,所述板卡算力指标中算力的计算过程为:其中,C
br
为分布式组网内各地方边缘点的算力节点的总算力需求,n为逻辑运算芯片数量,i为n的索引,f(a
i
)为逻辑运算的映射函数,α
i
为第i个逻辑运算芯片的映射比例系数,q1(TOPS)为逻辑运算的冗余算力;m为并行计算芯片数量,j为m的索引,f(b
j
)为并行计算的映射函数,β
j
为第j个并行计算芯片的映射比例系数,q2(FLOPS)为并行计算的冗余算力;p为神经网络加速芯片的数量,k为p的索引,f(c
k
)为神经网络加速的映射函数,γ
k
为第k个神经网络加速芯片的映射比例系数,q3(FLOPS)为神经网络加速的冗余算力。4.根据权利要求1所述的一种板卡监控结合算力的网络设备健康评估方法,其特征在于,所述监控标记格式为:板卡IP###板卡板卡基础指标###板卡寿命指标###板卡算力指标###关联板卡。5.根据权利要求1所述的一种板卡监控结合算力的网络设备健康评估方法,其特...

【专利技术属性】
技术研发人员:王健沈丽萍许春来罗俊陈昊庞鹤
申请(专利权)人:中通服网盈科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1