一种数据中心网络设备板卡级温度反演方法、系统及介质技术方案

技术编号:37457742 阅读:13 留言:0更新日期:2023-05-06 09:30
本申请涉及一种数据中心网络设备板卡级温度反演方法、系统及介质,方法包括以下具体步骤:采集数据中心网络设备历史运行过程中各个板卡的接口数据、设备的运行数据以及设备的温度数据,进行数据清洗和归一化并按照时间对齐构建数据集;对于同一块板卡上的所有接口数据通过数据融合进行降维;设计全连接神经网络模型1;设计全连接神经网络模型2;分别对2个全连接神经网络模型进行训练;输入目标板卡的接口数据,模型2的输出即为目标板卡的温度。本申请通过冻结除目标板卡外其他板卡的数据,实现目标板卡对应的温度的反演,提高了数据中心设备运维管理的精细程度和效率。备运维管理的精细程度和效率。备运维管理的精细程度和效率。

【技术实现步骤摘要】
一种数据中心网络设备板卡级温度反演方法、系统及介质


[0001]本申请涉及数据中心设备数据挖掘和温度计算领域,具体涉及一种数据中心网络设备板卡级温度反演方法、系统及介质。

技术介绍

[0002]数据中心是新型电力系统数字化和智能化的基础支撑设施,数据中心的稳定运行是电力系统各类业务稳定运行的保障。网络设备如交换机、路由器等设备是数据中心的重要组成部分,尤其是核心交换机,由于连接着大量的服务器和其他设备等,当其发生故障时会对数据中心大部分设备造成影响,因此网络设备安全稳定的运行是数据中心稳定运行的基本保障。在新型电力系统的背景下,各类业务的数据量越来越大且实时性要求越来越高,导致了电网数据中心的设备面临着高度繁忙的情况,温度监控是保障设备安全的一种有效手段。
[0003]核心网络设备通常由多块板卡组成,然而,现有基于SNMP协议的机房设备运行数据监测只能监测网络设备整体的温度,无法对每块板卡的温度进行监测,造成了运维精度不够的问题,因此,准确的板卡级温度监测成为网络设备运维的迫切需求。
[0004]随着人工智能浪潮的迭起,神经网络和深度学习应用到了越来越多的领域之中,神经网络通过其强大的非线性拟合能力可以建立相互关联的不同数据之间的联系,基于此,利用数据中心海量的历史监测信息,使用神经网络模型有助于快速、准确的实现板卡级的温度反演,保障数据中心设备的运行安全。

技术实现思路

[0005]本申请实施例的目的在于提供一种数据中心网络设备板卡级温度反演方法、系统及介质,提高了数据中心设备运维管理的精细程度和效率。
[0006]为实现上述目的,本申请提供如下技术方案:
[0007]第一方面,本申请实施例提供一种数据中心网络设备板卡级温度反演方法,包括以下具体步骤:
[0008]步骤1:采集数据中心网络设备历史运行过程中各个板卡的接口数据、设备的运行数据以及设备的温度数据,进行数据清洗和归一化并按照时间对齐构建数据集;
[0009]步骤2:对于同一块板卡上的所有接口数据通过数据融合进行降维,每块板卡分别用平均带宽利用率和平均接口流量进行描述;
[0010]步骤3:设计全连接神经网络模型1,模型的输入数据为网络设备每块板卡分别用平均带宽利用率和平均接口流量,模型的输出数据为网络设备的CPU利用率和内存利用率,其中输入层维度为2K,K为网络设备的板卡数量,输出层的维度为2;
[0011]步骤4:设计全连接神经网络模型2,模型的输入数据为网络设备的CPU利用率和内存利用率,模型的输出数据为网络设备的温度数据,其中输入层的维度为2,输出层的维度为1;
[0012]步骤5:通过贝叶斯优化确定全连接神经网络模型1和2的隐藏层的层数以及神经元的个数,分别对2个全连接神经网络模型进行训练;
[0013]步骤6:输入目标板卡的接口数据,将网络设备的其他板卡数据置0,进行归一化和降维之后输入训练好的全连接神经网络模型1,并将其输出作为全连接神经网络模型2的输入,则模型2的输出即为目标板卡的温度。
[0014]所述步骤2中的平均带宽利用率和平均接口流量分别为:
[0015][0016][0017]其中m为板卡网络接口的数量。
[0018]所述步骤3中的全连接神经网络模型1的损失函数为:
[0019][0020]y
i
=[CPU_u
i
,RAM_u
i
][0021]其中N为数据样本数量,y
i
为实测值,为预测值。
[0022]所述步骤4中的全连接神经网络模型2的损失函数为:
[0023][0024]Z
i
=Temp
[0025]其中N为数据样本数量,z
i
为实测值,为预测值。
[0026]第二方面,本申请实施例提供一种数据中心网络设备板卡级温度反演系统,包括,
[0027]数据采集模块,采集数据中心网络设备历史运行过程中各个板卡的接口数据、设备的运行数据以及设备的温度数据,进行数据清洗和归一化并按照时间对齐构建数据集;
[0028]数据融合模块,对于同一块板卡上的所有接口数据通过数据融合进行降维,每块板卡分别用平均带宽利用率和平均接口流量进行描述;
[0029]模型建立模块,设计全连接神经网络模型1,模型的输入数据为网络设备每块板卡分别用平均带宽利用率和平均接口流量,模型的输出数据为网络设备的CPU利用率和内存利用率,其中输入层维度为2K,K为网络设备的板卡数量,输出层的维度为2,设计全连接神经网络模型2,模型的输入数据为网络设备的CPU利用率和内存利用率,模型的输出数据为网络设备的温度数据,其中输入层的维度为2,输出层的维度为1;
[0030]模型训练模块,通过贝叶斯优化确定全连接神经网络模型1和2的隐藏层的层数以及神经元的个数,分别对2个全连接神经网络模型进行训练;
[0031]目标板卡的温度输出模块,输入目标板卡的接口数据,将网络设备的其他板卡数据置0,进行归一化和降维之后输入训练好的全连接神经网络模型1,并将其输出作为全连接神经网络模型2的输入,则模型2的输出即为目标板卡的温度。
[0032]第三方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有程序代码,所述程序代码被处理器执行时,实现如上所述的数据中心网络设备板卡级温度反演方法的步骤。
[0033]与现有技术相比,本专利技术的有益效果是:
[0034]通过级联两个全连接神经网络模型分别建立板卡级数据与设备级运行数据之间的联系和设备运行数据与设备温度之间的联系,通过平均法降低输入维度提高神经网络模型的计算效率和准确率,通过冻结除目标板卡外其他板卡的数据,实现目标板卡对应的温度的反演,提高了数据中心设备运维管理的精细程度和效率。
附图说明
[0035]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0036]图1是本申请实施例方法的流程图;
[0037]图2本申请实施例方法的神经网络模型的示意图;
[0038]图3是本申请实施例方法的计算目标板卡温度的示意图;
[0039]图4是本申请实施例的系统框图。
具体实施方式
[0040]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0041]下面结合图1

图3,介绍本专利技术的具体实施方式为一种数据中心网络设备板卡级温度反演方法,包括以下具体步骤:
[0042]步骤1:以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据中心网络设备板卡级温度反演方法,其特征在于,包括以下具体步骤:步骤1:采集数据中心网络设备历史运行过程中各个板卡的接口数据、设备的运行数据以及设备的温度数据,进行数据清洗和归一化并按照时间对齐构建数据集;步骤2:对于同一块板卡上的所有接口数据通过数据融合进行降维,每块板卡分别用平均带宽利用率和平均接口流量进行描述;步骤3:设计全连接神经网络模型1,模型的输入数据为网络设备每块板卡分别用平均带宽利用率和平均接口流量,模型的输出数据为网络设备的CPU利用率和内存利用率,其中输入层维度为2K,K为网络设备的板卡数量,输出层的维度为2;步骤4:设计全连接神经网络模型2,模型的输入数据为网络设备的CPU利用率和内存利用率,模型的输出数据为网络设备的温度数据,其中输入层的维度为2,输出层的维度为1;步骤5:通过贝叶斯优化确定全连接神经网络模型1和2的隐藏层的层数以及神经元的个数,分别对2个全连接神经网络模型进行训练;步骤6:输入目标板卡的接口数据,将网络设备的其他板卡数据置0,进行归一化和降维之后输入训练好的全连接神经网络模型1,并将其输出作为全连接神经网络模型2的输入,则模型2的输出即为目标板卡的温度。2.根据权利要求1所述的一种数据中心网络设备板卡级温度反演方法,其特征在于,所述步骤2中的平均带宽利用率和平均接口流量分别为:分别为:其中m为板卡网络接口的数量。3.根据权利要求1所述的一种数据中心网络设备板卡级温度反演方法,其特征在于,所述步骤3中的全连接神经网络模型1的损失函数为:y
i
=[CPU_u
i
,RAM_u
i
]其中N为数据样本数量,y
i
为实测值,为预测值。4.根...

【专利技术属性】
技术研发人员:庄严郭岳李想李德识胡耀东黄超董亮朱兆宇柯旺松梁源郭兆丰廖荣涛贺亮冯伟东王婕袁慧龙霏王逸兮王晟玮罗弦李磊姚渭菁王博涛胡欢君周蕾
申请(专利权)人:武汉大学国网湖北送变电工程有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1