System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种故障检测方法、装置、电子设备及存储介质制造方法及图纸_技高网

一种故障检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40916337 阅读:4 留言:0更新日期:2024-04-18 14:43
本发明专利技术公开了一种故障检测方法,该方法包括:获取液冷服务器的状态监测参数;其中,状态监测参数包括液冷系统运行参数、水质指标参数以及部件温度参数中的至少一个;根据状态监测参数获取状态表征参数,并根据状态表征参数构建状态表征向量;将状态表征向量与各个故障类型的故障表征向量分别进行相似度比对,以获取液冷服务器的预测故障类型。本发明专利技术实施例的技术方案,实现了液冷服务器的故障预测,并且给出了具体的故障类型,提高了故障检测的时效性,避免了故障发生对服务器造成损伤,而多类型状态监测参数的获取,提高了故障检测的准确性,避免了环境因素对故障检测的干扰。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种故障检测方法、装置、电子设备及存储介质


技术介绍

1、随着计算机技术的不断进步,数据中心进入到加速发展阶段,由于现有的数据中心机房的散热功能并不完善,因此液冷服务器的部署成为了数据中心解决散热问题的重要举措。

2、为了确保液冷服务器的运行安全,针对液冷服务器的故障检测,现有技术通常是获取液冷服务器的实际温度值,进而根据多个实际温度值生成实际温度曲线,并将上述实际温度曲线与预存的故障状态下的故障温度曲线进行匹配,根据匹配结果确定液冷服务器是否存在运行故障。

3、然而,上述故障检测方式,当液冷服务器出现显著的温度变化时,实质上已对服务器本身造成了较为严重的损坏,在检测时间上存在严重的滞后性,同时,上述故障检测方式的误判率较高,例如,环境温度等外部因素的正常变化也可能被误认为是服务器本身温度的异常变化。


技术实现思路

1、本专利技术提供了一种故障检测方法、装置、电子设备及存储介质,以解决液冷服务器的故障检测滞后的问题。

2、根据本专利技术的一方面,提供了一种故障检测方法,包括:

3、获取液冷服务器的状态监测参数;其中,所述状态监测参数包括液冷系统运行参数、水质指标参数以及部件温度参数中的至少一个;

4、根据所述状态监测参数获取状态表征参数,并根据所述状态表征参数构建状态表征向量;

5、将所述状态表征向量与各个故障类型的故障表征向量分别进行相似度比对,以获取所述液冷服务器的预测故障类型。

6、所述液冷系统运行参数包括冷板入口温度、冷板出口温度、冷板入口流量、冷板出口流量、冷板入口压力、冷板出口压力、冷液分配装置入口压力以及冷液分配装置出口压力中的至少一个;和/或所述水质指标参数包括电导率、浊度、酸碱度以及金属离子含量中的至少一个;和/或所述部件温度参数包括中央处理器温度、机械硬盘温度、内存温度以及高速串行计算机扩展总线标准卡温度中的至少一个。通过获取与各种故障类型具有关联关系的多种监测参数,不但扩展了液冷服务器的监测范围,而且为不同类型故障的实时监测提供了数据基础,确保了液冷服务器的运行安全,提升了故障监测的全面性。

7、所述状态表征参数包括升降趋势表征参数、缓变趋势表征参数、突变趋势表征参数以及相关性表征参数中的至少一个。所述升降趋势表征参数包括冷板入口温度升降趋势、冷板出口温度升降趋势、冷板入口流量升降趋势、冷板出口流量升降趋势、冷板入口压力升降趋势、冷板出口压力升降趋势、冷液分配装置入口压力升降趋势、冷液分配装置出口压力升降趋势、冷板出入口压力差升降趋势、中央处理器温度升降趋势、机械硬盘温度升降趋势、内存温度升降趋势以及高速串行计算机扩展总线标准卡温度升降趋势中的至少一个;和/或所述缓变趋势表征参数包括电导率缓变趋势、浊度缓变趋势、酸碱度缓变趋势以及金属离子含量缓变趋势中的至少一个;和/或所述突变趋势表征参数包括冷板入口流量突变趋势;和/或所述相关性表征参数包括所述冷板入口压力与所述部件温度参数的相关性、冷板出入口压力差与所述电导率的相关性、所述冷板出入口压力差与所述浊度的相关性、所述冷板出入口压力差与所述金属离子含量的相关性、所述部件温度参数与所述金属离子含量的相关性以及所述部件温度参数与所述电导率的相关性中的至少一个。不同变化趋势类型下的状态表征参数,反映了状态监测参数的不同变化规律,而通过各个状态监测参数多样化的变化趋势,实现了液冷服务器多故障类型的实时监测,进一步确保了液冷服务器的运行安全。

8、所述根据所述状态监测参数获取状态表征参数,包括如下至少一项:基于曼-肯德尔检验方法,获取升降趋势表征参数;基于线性回归模型,获取缓变趋势表征参数;基于高斯分布模型,获取突变趋势表征参数;基于相关系数,获取相关性表征参数。曼-肯德尔检验方法实现了状态监测参数中存在异常变化趋势的监测参数的获取,即异常数据的提前获取,从而实现了异常状态监测参数的数据预警;基于线性回归模型获取到的缓变趋势表征参数,避免了无规律性的随机数据变化对缓变趋势判断结果的影响,也避免了将突变数据误判断为缓变数据,提高了缓变趋势表征参数的获取准确性;基于高斯分布模型获取到的突变趋势表征参数,避免了无规律性的随机数据变化对突变趋势判断结果的影响,也免了将缓变数据误判断为突变数据,提高了突变趋势表征参数的获取准确性;相关系数不但可以表征具备相同升降趋势的状态监测参数之间的相关性,还可以表征不存在相同升降趋势以及升降趋势不完全匹配的状态监测参数之间的线性相关程度,提高了相关性表征参数的获取准确性。

9、所述故障类型包括冷板焊缝裂纹故障、冷板鼓包裂纹故障、冷板腐蚀故障以及水路堵塞故障中的至少一个。上述故障类型分别从冷板焊缝破裂、冷板蠕变鼓包、冷板被腐蚀以及冷却液体流通不畅的角度进行了故障分析,实现了多类型的故障获取,提升了故障监测的全面性,进一步确保了液冷服务器的运行安全。

10、若所述部件温度参数包括多个部件的温度,且所述金属离子含量包括多种金属离子的含量;所述根据所述状态监测参数获取状态表征参数,具体包括:若任意部件的温度与任意金属离子的含量的相关性为相关关系,则确定所述部件温度参数与所述金属离子含量的相关性为相关关系。相比于计算每个部件的温度,分别与各个金属离子的含量之间的相关性,本专利技术实施例中,仅通过一个状态表征参数,即部件温度参数与金属离子含量的相关性,即可反映液冷服务器的部件温度与冷却液体的金属离子含量之间的关联关系,简化了状态表征向量的参数结构,降低了状态表征向量的构建复杂度,提高了状态表征向量与各个故障表征向量的比对效率。

11、根据本专利技术的另一方面,提供了一种故障检测装置,包括:

12、状态监测参数获取模块,用于获取液冷服务器的状态监测参数;其中,所述状态监测参数包括液冷系统运行参数、水质指标参数以及部件温度参数中的至少一个;

13、状态表征向量获取模块,用于根据所述状态监测参数获取状态表征参数,并根据所述状态表征参数构建状态表征向量;

14、故障类型预测模块,用于将所述状态表征向量与各个故障类型的故障表征向量分别进行相似度比对,以获取所述液冷服务器的预测故障类型。

15、根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:

16、至少一个处理器;以及

17、与所述至少一个处理器通信连接的存储器;其中,

18、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的故障检测方法。

19、根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的故障检测方法。

20、本专利技术实施例的技术方案,在获取液冷服务器的状态监测参数后,根据状态监测参数获取状态表征参数,并根据状态表征参数构建本文档来自技高网...

【技术保护点】

1.一种故障检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述状态表征参数包括升降趋势表征参数、缓变趋势表征参数、突变趋势表征参数以及相关性表征参数中的至少一个。

3.根据权利要求2所述的方法,其特征在于,所述液冷系统运行参数包括冷板入口温度、冷板出口温度、冷板入口流量、冷板出口流量、冷板入口压力、冷板出口压力、冷液分配装置入口压力以及冷液分配装置出口压力中的至少一个;

4.根据权利要求3所述的方法,其特征在于,所述升降趋势表征参数包括冷板入口温度升降趋势、冷板出口温度升降趋势、冷板入口流量升降趋势、冷板出口流量升降趋势、冷板入口压力升降趋势、冷板出口压力升降趋势、冷液分配装置入口压力升降趋势、冷液分配装置出口压力升降趋势、冷板出入口压力差升降趋势、中央处理器温度升降趋势、机械硬盘温度升降趋势、内存温度升降趋势以及高速串行计算机扩展总线标准卡温度升降趋势中的至少一个;

5.根据权利要求2所述的方法,其特征在于,所述根据所述状态监测参数获取状态表征参数,包括如下至少一项:

6.根据权利要求2所述的方法,其特征在于,所述故障类型包括冷板焊缝裂纹故障、冷板鼓包裂纹故障、冷板腐蚀故障以及水路堵塞故障中的至少一个。

7.根据权利要求4所述的方法,其特征在于,若所述部件温度参数包括多个部件的温度,且所述金属离子含量包括多种金属离子的含量;

8.一种故障检测装置,其特征在于,包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的故障检测方法。

...

【技术特征摘要】

1.一种故障检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述状态表征参数包括升降趋势表征参数、缓变趋势表征参数、突变趋势表征参数以及相关性表征参数中的至少一个。

3.根据权利要求2所述的方法,其特征在于,所述液冷系统运行参数包括冷板入口温度、冷板出口温度、冷板入口流量、冷板出口流量、冷板入口压力、冷板出口压力、冷液分配装置入口压力以及冷液分配装置出口压力中的至少一个;

4.根据权利要求3所述的方法,其特征在于,所述升降趋势表征参数包括冷板入口温度升降趋势、冷板出口温度升降趋势、冷板入口流量升降趋势、冷板出口流量升降趋势、冷板入口压力升降趋势、冷板出口压力升降趋势、冷液分配装置入口压力升降趋势、冷液分配装置出口压力升降趋势、冷板出入口压力差升降趋势、中央处理器温度升降趋势、机械硬盘温度升降趋势、...

【专利技术属性】
技术研发人员:李亚华焦向昆李想
申请(专利权)人:曙光信息产业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1