一种基于红外图像的服务器热故障监测及诊断方法技术

技术编号:16334852 阅读:23 留言:0更新日期:2017-10-03 15:11
本发明专利技术公开了一种基于红外图像的服务器热故障监测及诊断方法,其包括:采集服务器不同热故障状态下的红外图像及可见光图像;利用基于图像配准的标准化方法对每一种热故障状态下的图像进行倾斜校正处理,并采用手动分割方法确定红外图像中包含服务器的感兴趣区域;将确定的感兴趣区域图像转换成对应的灰度图像,并对其提取基于图像熵的特征;采用PCA方法对所获得的全局熵以及局部熵行列均值特征进行降维处理;降维后得到的特征主成分用于训练支持向量机分类器;采集待检测的服务器所对应的红外图像及可见光图像,通过训练好的SVM模型诊断出所述服务器的热故障状态类型。本发明专利技术极大地提高了数据中心管理人员的管理效率,便于工程调试和系统维护。

Method for monitoring and diagnosing thermal fault of server based on infrared image

The invention discloses a monitoring and diagnosis server hot fault method based on infrared image which includes infrared images and visible light images of different thermal fault state acquisition server; using the method of image registration based on the standard image of each thermal fault state of the tilt correction processing, and determined to contain server interested in the infrared image region using manual segmentation method; will determine the ROI image into grayscale image and the corresponding, and the image feature extraction based on entropy; using PCA method to reduce the dimension of the global entropy obtained by local entropy and mean rank characteristics; principal component obtained after dimensionality reduction for training support vector machine classifier; infrared image and visible light image to be detected by the server corresponding to the diagnosis by trained SVM model a The hot failure state type of the server. The invention greatly improves the management efficiency of data center managers, and is convenient for engineering debugging and system maintenance.

【技术实现步骤摘要】

本专利技术属于图像处理
,具体的说是涉及一种基于红外图像的服务器热故障监测及诊断方法
技术介绍
在数据中心规模高速扩张的同时,服务器的高密度集成导致其发热量增长,为了使服务器在合适环境下正常运行,而不致发生由于温度过高引发的宕机事故,很多数据中心不得不提高制冷空调的功率,这样造成数据中心能耗高、效率低下的现象。因此,精准地监测与控制机房温度,提高空调制冷效率、实现数据中心的节能降耗成为数据中心建设和维护过程中不可忽视的问题。具体的说,数据中心内部温度分布不平衡现象是影响制冷效率的主因之一,数据中心中超高热服务器数量约占5%。由此可见我们既需要解决这5%的超高热机柜的散热问题,也需要很好地解决大多数“高热”机柜的散热问题。同时需要说明的是,我们不能用“超高热”散热方法解决“高热”机柜的散热问题,也不能用常规机房空调的方法来解决“过热”问题。如通过调整负载分布,调整制冷资源分布,或人工作业等方式,排除局部高温或高热源头(简称热点),进而可以实现平衡温度的目的。因此需要对数据中心内部环境温度场进行有效感知和分析。目前,对大型数据中心的温度场测量,通用的方法是将大量温度传感器置于数据中心关键位置;然后,通过某种方法收集所有传感器的测量数据。早期的测量方法使用的是有线传感器,但是昂贵的安装及配置成本阻碍其广泛使用。虽然无线传感器具有低成本、无侵入式测量等优点,但是Chieh-JanMikeLiang等人在“RACNet:AHigh-FidelityDataCenterSensingNetwork”文中指出了数据中心的电磁环境不利于传感器网络的大规模无线通信。另外,无论采用上述何种传感器网络覆盖一个大型数据中心,都要解决对上万节点的三维坐标标定、后期维护、数据管理等问题。同时,温度传感器空间分辨率不足,无法得到热点的详细信息。若传感器没有部署在合适的位置,我们不能准确地获得的热点的大小及温度最值,这将无法为后续处理提供充分的信息。
技术实现思路
鉴于已有技术存在的缺陷,本专利技术的目的是要提供一种基于红外图像的服务器热故障监测及诊断方法,该方法利用红外图像温度与灰度之间的关系,感知服务器温度异常点,从而对服务器热故障状态进行判断,极大地提高了数据中心管理人员的管理效率,便于工程调试和系统维护,同时提高数据中心空调系统的制冷效率,利于数据中心节能减排。为了实现上述目的,本专利技术的技术方案:一种基于红外图像的服务器热故障监测及诊断方法,其特征在于,包括如下步骤:步骤1、采集服务器不同热故障状态下的红外图像及可见光图像,使得每一热故障状态对应服务器的一种热故障状态类型;步骤2、基于图像配准的标准化方法对每一种热故障状态下的两幅图像进行倾斜校正处理,并采用手动分割方法确定红外图像中感兴趣区域,所述感兴趣区域至少包含服务器所在区域;步骤3、对所确定的感兴趣区域的图像转换成对应的灰度图像并基于图像灰度分布的特征,自所述灰度图像中提取所对应的图像熵特征,以获得与当前所提取的红外图像相对应的图像灰度分布的聚集特征以及空间特征;所述的图像熵特征包括图像的全局熵和局部熵行列均值;步骤4、采用PCA方法对所提取的全局熵以及局部熵行列均值特征进行降维处理;步骤5、基于经步骤4处理后的全局熵的主成分以及局部熵行列均值特征的主成分,并通过支持向量机分类器进行训练,以获得各热故障状态下各自所对应的诊断模型;步骤6、采集待检测的服务器所对应的红外图像及可见光图像,经步骤2-4处理后,通过所述诊断模型诊断出其所对应的服务器的热故障状态类型。进一步的,所述步骤2包括如下步骤:步骤21、使得红外热像仪和可见光照相机位于同一拍摄位置并采集服务器的图像数据;步骤22、使得红外热像仪所采集的图像数据以及可见光照相机所采集的图像数据被调整至同一图像分辨率;步骤23、建立被调整的两幅图像数据之间一对一的像素关系,以获得可见光照相机所采集的图像数据上任意位置所对应的温度数据,进而完成两幅图像的图像配准工作;步骤24、将图像的温度分布特征几何变换至一个标准的模板;该模板是与服务器实际长宽成比例的标准矩形。进一步的,所述步骤3包括如下步骤:步骤31、将所确定的感兴趣区域的图像转换成对应的灰度图像;步骤32、对所述灰度图像进行图像的全局熵特征提取,即灰度图像的全局灰度熵H(I)对应的公式,如下式所示:其中,Pi表示图像中灰度值为i的像素所占的比例;步骤33、对所述灰度图像进行图像的局部熵特征提取,即首先将图像的像素灰度与图像的邻域灰度均值组成特征二元组,记为(i,j),则某像素位置上的灰度值与其周围像素灰度分布的综合特征为其中,i表示像素的灰度值,j表示其对应的邻域灰度均值,f(i,j)为特征二元组出现的频数,M×N为所提取的局部窗口的尺度值,进而图像的局部熵特征对应的公式,如下式所示:步骤34、将图像的局部熵特征的行列均值作为服务器热故障诊断的图像特征参数;其中所述的局部熵行均值是指计算图像中每一行的像素的局部熵均值;所述的局部熵列均值是指计算图像中每一列的像素的局部熵均值。与现有技术相比,本专利技术的有益效果:本专利技术通过采用红外热像仪监测大型数据中心温度场,能够更加直观通过红外图像实时监测服务器运行状态,发现异常温度特征,高效识别出务器热故障成因,从而为数据中心管理人员提供工程维护参考,同时平衡数据中心内部温度场的温度,以提高空调系统的制冷效率。附图说明图1是本专利技术所述方法对应的步骤流程框图;图2是服务器在不同故障情况下运行的红外图像;图3是服务器在不同故障情况下运行的红外图像标准化后的图像。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。鉴于目前采用的温度传感器测量数据中心温度场的方法的不足之处(但是不论使用有线或者无线传感器网络,都要解决对上万节点的三维坐标标定、后期维护、数据管理等问题,工作量巨大。另外传感器分辨率不高,无法提供热点的充分信息。),本专利技术提出了一种采用基于红外图像的服务器热故障监测及诊断方法,其通过提取服务器红外图像的特征信息即基于全局熵及局部熵行列均值特征的红外图像处理技术,来对服务器热故障进行监测及诊断,以识别服务器处于何种热故障状态,从而诊断出服务器的高温成因,进而达到优化数据中心管理,提高空调制冷效率目的。其中,红外热成像技术(IRT)具有非接触检测、无电磁干扰、安全可靠和监测范围大等优点。相比温度传感器,热成像摄像头可以获取更直观的二维热分布图像,利用图像处理技术能够进一步的分析热点即用红外图像温度与灰度之间的关系,感知服务器温度异常点,从而对服务器热故障状态进行判断,极大地提高了数据中心管理人员的管理效率,便于工程调试和系统维护,同时提高数据中心空调系统的制冷效率,利于数据中心节能减排。且可实现在无需停机的情况下监测电气设备故障方面,因而红外热像技术扮演很重要的角色。基于上述原理,本专利技术所述的一种基于红外图像的服务器热故障监测及诊断方法,其特征在于,包括如下步骤:如图1,步骤本文档来自技高网
...
一种基于红外图像的服务器热故障监测及诊断方法

【技术保护点】
一种基于红外图像的服务器热故障监测及诊断方法,其特征在于,包括如下步骤:步骤1、采集服务器不同热故障状态下的红外图像及可见光图像,使得每一热故障状态对应服务器的一种热故障状态类型;步骤2、基于图像配准的标准化方法对每一种热故障状态下的两幅图像进行倾斜校正处理,并采用手动分割方法确定红外图像中感兴趣区域,所述感兴趣区域至少包含服务器所在区域;步骤3、对所确定的感兴趣区域的图像转换成对应的灰度图像并基于图像灰度分布的特征,自所述灰度图像中提取所对应的图像熵特征;所述的图像熵特征包括图像的全局熵和局部熵行列均值;步骤4、采用PCA方法对所提取的全局熵以及局部熵行列均值特征进行降维处理;步骤5、基于经步骤4处理后的全局熵的主成分以及局部熵行列均值特征的主成分,并通过支持向量机分类器进行训练,以获得各热故障状态下各自所对应的诊断模型;步骤6、采集待检测的服务器所对应的红外图像及可见光图像,经步骤2‑4处理后,通过所述诊断模型诊断出其所对应的服务器的热故障状态类型。

【技术特征摘要】
1.一种基于红外图像的服务器热故障监测及诊断方法,其特征在于,包括如下步骤:步骤1、采集服务器不同热故障状态下的红外图像及可见光图像,使得每一热故障状态对应服务器的一种热故障状态类型;步骤2、基于图像配准的标准化方法对每一种热故障状态下的两幅图像进行倾斜校正处理,并采用手动分割方法确定红外图像中感兴趣区域,所述感兴趣区域至少包含服务器所在区域;步骤3、对所确定的感兴趣区域的图像转换成对应的灰度图像并基于图像灰度分布的特征,自所述灰度图像中提取所对应的图像熵特征;所述的图像熵特征包括图像的全局熵和局部熵行列均值;步骤4、采用PCA方法对所提取的全局熵以及局部熵行列均值特征进行降维处理;步骤5、基于经步骤4处理后的全局熵的主成分以及局部熵行列均值特征的主成分,并通过支持向量机分类器进行训练,以获得各热故障状态下各自所对应的诊断模型;步骤6、采集待检测的服务器所对应的红外图像及可见光图像,经步骤2-4处理后,通过所述诊断模型诊断出其所对应的服务器的热故障状态类型。2.根据权利要求1所述的方法,其特征在于:所述步骤2包括如下步骤:步骤21、使得红外热像仪和可见光照相机位于同一拍摄位置并采集服务器的图像数据;步骤22、使得红外热像仪所采集的图像数据以及可见光照相机所采集的图像数据...

【专利技术属性】
技术研发人员:刘航谢婷
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1