一种基于热成像技术的服务器智能调温与故障检测系统和方法技术方案

技术编号:26418099 阅读:19 留言:0更新日期:2020-11-20 14:13
本发明专利技术公开了一种基于热成像技术的服务器智能调温与故障检测系统和方法,涉及服务器系统设计领域。所述系统包括服务器、红外探测器及成像设备;服务器包括主板和FPGA处理芯片,FPGA处理芯片接收红外探测器发送的服务器各器件的温度信息,并进行调温或故障处理;红外探测器安装在服务器主板上,用于吸收服务器各器件的红外辐射并将其转换为电信号后传输给FPGA处理芯片及成像设备;成像设备用于显示服务器的红外热像图进行故障排查。本发明专利技术将热成像技术应用在服务器温度控制领域,把服务器散热系统和故障检测系统结合为一体,从而将温度监控覆盖到整个服务器,实现服务器故障检测和调温散热的智能化,提升了监控效率,节约了资源。

【技术实现步骤摘要】
一种基于热成像技术的服务器智能调温与故障检测系统和方法
本专利技术实施例涉及服务器系统设计领域,具体来说涉及一种基于热成像技术的服务器智能调温与故障检测系统和方法。
技术介绍
随着服务器行业及相关技术的发展,其设计越来越复杂,集成度也越来越高,服务器中需运行更多更复杂的程序及存储海量的数据,高速运行的CPU及PCH等模块也需要更高效的散热系统,这就要求更完善的服务器故障检测和调温系统。热成像技术是利用红外探测器和光学成像物镜接收被测目标的红外辐射能量分布图形反射到红外探测器的光敏器件上,由此产生红外热像图将不可见变为可见,从而根据热图像上的不同颜色显示被测物体的不同温度。随着红外成像技术的发展,红外热像仪的灵敏度和热分辨率越来越高,可以对目标进行远距离热状态成像和测温并实现智能分析。目前热成像技术已应用在电路故障检测领域,实现对故障元器件进行精准定位。当线路短路或开路时,元器件的能耗发生变化,这会直接影响元器件的温度,与正常状态下的红外热像图进行对比就能分辨出故障器件和线路。目前,服务器硬件故障诊断使用的方法是通过BMCweb抓取各类报错信息,再针对这些报错采取相应的接触式测量,获取信号质量及状态信息以具体排查硬件方面的错误。而在温度监控方面,在服务器设计过程中应用多种温度传感器以全面监测各部分温度,用户可以在BMCweb上读取各类温度,风扇也会根据BMC抓取到的温度调整速度以散热并实现温度的调控。但其还存在以下不足之处:1)在故障检测方面,首先,BMC告警只能监测到服务器发生了某一类故障,例如某个电的电平异常及系统异常掉电等,提醒工程师服务器发生的故障现象,但不能将其定位在具体的器件上,工程师仍然需要针对现象目测电路板是否有撞件现象,用万用表进行电压量测或者使用示波器进行波形抓取。这种接触式的测量无法远程对客户机房中发生的问题进行分析,同时需要工程师具有较高的专业知识并对服务器电路图的设计充分把握。其次,这种方式只能在故障发生之后处理,无法对其进行预判,有些硬件线路问题在上电开机后可能会烧坏整块主板,需要在上电前排查这类问题,而BMC无法对其进行检测。2)在温度调控方面,当前技术的缺点主要体现在以下几个方面:使用BMC实时显示从服务器各处的温度传感器抓取到的温度,轮询速度为秒级,存在很大延时;在服务器主板及其他板卡上布局一定的温度传感器,反映服务器各个重要模块的温度,主要包括入风口、出风口、背板等,只能笼统的反映当前的系统温度,主要需要CPU及内存等部件自带的温度传感器监测具体位置的温度,无法覆盖到服务器各个位置;服务器的散热系统有自动调速功能,针对温度传感器获取的温度进行判断,当达到设定的温度阈值时会加大散热效率,当温度回落后将减小散热效率,散热系统针对服务器温度变化采取的散热措施存在延时,无法精确进行散热方案的调整。3)故障检测和温度调控分属两个不同的系统,增大了设计的复杂度。
技术实现思路
本专利技术实施例提供了一种基于热成像技术的服务器智能调温与故障检测系统和方法,解决服务器硬件线路故障检测不全面、温度监控覆盖面小及散热方案调整不及时的问题,并将故障检测和温度调控系统合并,提升监控效率。为实现上述目的,本专利技术公开了如下技术方案:一方面,本专利技术提供一种基于热成像技术的服务器智能调温与故障检测系统,所述系统包括服务器、红外探测器及成像设备;服务器包括主板和FPGA处理芯片,FPGA处理芯片接收红外探测器发送的服务器各器件的温度信息,并进行调温或故障处理;红外探测器安装在服务器主板上,用于吸收服务器各器件的红外辐射并将其转换为电信号后传输给FPGA处理芯片及成像设备;成像设备用于显示服务器的红外热像图。基于上述方案,进一步的,所述服务器还包括BMC及散热系统,FPGA处理芯片接收服务器各器件的温度信息,然后提供相应的调温方案或故障解决方案给散热系统,并将各器件温度信息及故障器件信息传递给BMC。进一步的,所述散热系统包括风扇或液冷装置。进一步的,所述系统还包括终端,终端用于接收BMC传递的各器件温度信息及故障器件信息,并将处理意见反馈至BMC。如上所述的系统,当服务器某器件温度异常升高时,FPGA处理芯片提供相应的故障解决方案给散热系统,散热系统通知服务器各个模块器件保存正在运行的程序和数据,有序进行故障处理,并将故障器件的脚位或线路信息通过BMC传递给终端,一方面给设备提供充分的缓冲时间保存数据,防止异常断电造成数据丢失,最小化减少损失,另一方面给用户提供反应时间,及时进行故障处理。当服务器各器件温度正常升高时,FPGA处理芯片制定合适的散热方案传递给散热系统,散热系统针对不同的器件进行散热处理,保证各模块温度均衡且保持在稳定的范围内,同时FPGA处理芯片将各器件温度信息传递给BMC。进一步的,如上所述的系统,在服务器上电前,通过成像设备观察服务器的红外热像图进行故障排查,服务器上电后,通过FPGA处理芯片进行温度信息分析处理。另一方面,本专利技术提供一种基于热成像技术的服务器智能调温与故障检测方法,所述方法包括以下步骤:采用红外探测器吸收服务器各器件的红外辐射,将其转换为电信号后传输给FPGA处理芯片及成像设备;通过成像设备观察服务器的红外热像图进行服务器故障排查;FPGA处理芯片接收红外探测器发送的服务器各器件的温度信息,并进行调温或故障处理。基于上述方法,进一步的,所述FPGA处理芯片进行调温或故障处理,包括提供相应的调温方案或故障解决方案给散热系统,并将各器件温度信息及故障器件信息传递给BMC,具体包括下述步骤:当服务器某器件温度异常升高时,FPGA处理芯片提供相应的故障解决方案给散热系统,散热系统通知服务器各个模块器件保存正在运行的程序和数据,有序进行故障处理,并将故障器件的脚位或线路信息通过BMC传递给终端;当服务器各器件温度正常升高时,FPGA处理芯片制定合适的散温方案传递给散热系统,散热系统针对不同的器件进行散热处理,同时FPGA处理芯片将各器件温度信息传递给BMC。如上所述的方法,还包括下述步骤:终端接收BMC传递的各器件温度信息及故障器件信息,并将处理意见反馈至BMC。进一步的,如上所述的方法,在服务器上电前,通过成像设备观察服务器的红外热像图进行故障排查,服务器上电后,通过FPGA处理芯片进行温度信息分析处理。
技术实现思路
中提供的效果仅仅是实施例的效果,而不是专利技术所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:本申请实施例提供的一种基于热成像技术的服务器智能调温与故障检测系统,系统包括服务器、红外探测器及成像设备;服务器包括主板和FPGA处理芯片,FPGA处理芯片接收红外探测器发送的服务器各器件的温度信息,并进行调温或故障处理;红外探测器安装在服务器主板上,用于吸收服务器各器件的红外辐射并将其转换为电信号后传输给FPGA处理芯片及成像设备;成像设备用于显示服务器的红外热像图进行本文档来自技高网
...

【技术保护点】
1.一种基于热成像技术的服务器智能调温与故障检测系统,其特征在于,包括服务器、红外探测器及成像设备;/n服务器包括主板和FPGA处理芯片,FPGA处理芯片接收红外探测器发送的服务器各器件的温度信息,并进行调温或故障处理;/n红外探测器安装在服务器主板上,用于吸收服务器各器件的红外辐射并将其转换为电信号后传输给FPGA处理芯片及成像设备;/n成像设备用于显示服务器的红外热像图。/n

【技术特征摘要】
1.一种基于热成像技术的服务器智能调温与故障检测系统,其特征在于,包括服务器、红外探测器及成像设备;
服务器包括主板和FPGA处理芯片,FPGA处理芯片接收红外探测器发送的服务器各器件的温度信息,并进行调温或故障处理;
红外探测器安装在服务器主板上,用于吸收服务器各器件的红外辐射并将其转换为电信号后传输给FPGA处理芯片及成像设备;
成像设备用于显示服务器的红外热像图。


2.根据权利要求1所述的一种基于热成像技术的服务器智能调温与故障检测系统,其特征在于,所述服务器还包括BMC及散热系统,FPGA处理芯片接收服务器各器件的温度信息,然后提供相应的调温方案或故障解决方案给散热系统,并将各器件温度信息及故障器件信息传递给BMC。


3.根据权利要求2所述的一种基于热成像技术的服务器智能调温与故障检测系统,其特征在于,所述散热系统包括风扇或液冷装置。


4.根据权利要求2所述的一种基于热成像技术的服务器智能调温与故障检测系统,其特征在于,所述系统还包括终端,终端用于接收BMC传递的各器件温度信息及故障器件信息,并将处理意见反馈至BMC。


5.根据权利要求4所述的一种基于热成像技术的服务器智能调温与故障检测系统,其特征在于,当服务器某器件温度异常升高时,FPGA处理芯片提供相应的故障解决方案给散热系统,散热系统通知服务器各个模块器件保存正在运行的程序和数据,有序进行故障处理,并将故障器件的脚位或线路信息通过BMC传...

【专利技术属性】
技术研发人员:赵子腾
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1