设备温度检测方法、装置、设备及存储介质制造方法及图纸

技术编号:36229661 阅读:11 留言:0更新日期:2023-01-04 12:29
本发明专利技术提供了一种设备温度检测方法、装置、设备及存储介质,设备包括多个芯片,所述方法包括:采集每一个芯片的初始温度值,并生成初始温度值集合;预设第一筛选条件,并基于第一筛选条件对初始温度值集合进行第一筛选,获得第一筛选集合;预设第二筛选条件,并基于第二筛选条件对第一筛选集合进行第二筛选,获得第二筛选集合;其中,第二筛选条件基于第一筛选集合的平均值获得;基于第二筛选集合,获取设备的设备上限温度值以及设备下限温度值。设备的设备上限温度值以及设备下限温度值。设备的设备上限温度值以及设备下限温度值。

【技术实现步骤摘要】
设备温度检测方法、装置、设备及存储介质


[0001]本申请涉及计算机领域,更具体地,涉及一种设备温度检测方法、装置、设备及存储介质。

技术介绍

[0002]随着信息产业的快速发展,对于芯片的运算速度要求随之增加。芯片的尺寸越来越小,同时运算速度越来越快,设备中包含的芯片数量增加,集成度提升的同时,功耗越来越高,造成设备的发热量越来越高。
[0003]随着大数据和深度学习得到越来越多应用,芯片的算力和吞吐率成为评价芯片的重要指标,芯片需要在尽可能短的时间里完成计算,并且完成相同计算消耗的能量越小越好。一般情况下,每台设备都采用多个处理器以及多个板卡设计,每个板卡上都可以包含多个芯片,用于保证设备拥有足够的算力。但是设备中包含的芯片的分布较为分散,导致设备内部的发热量比较分散,因此对于设备准确温度的测量变得越来越困难。
[0004]如果设备温度的检测不准确,设备内的元器件可能在高温下工作,不仅造成设备工作性能的下降,严重时甚至造成硬件的损坏。例如,当芯片的工作温度超过上限温度时,必须通过降频来降低芯片的工作温度,保证芯片在所能承受的温度以内正常工作。因此,科学有效并且快速的检测设备温度,显得尤为重要。

技术实现思路

[0005]本申请的一些实施方式提供了可至少部分解决现有技术中存在的上述问题的设备温度检测方法、装置、设备及存储介质。
[0006]根据本申请的一个方面,提供一种设备温度检测方法,所述设备包括多个芯片,所述方法可包括:采集每一个所述芯片的初始温度值,并生成初始温度值集合;预设第一筛选条件,并基于所述第一筛选条件对所述初始温度值集合进行第一筛选,获得第一筛选集合;预设第二筛选条件,并基于所述第二筛选条件对所述第一筛选集合进行第二筛选,获得第二筛选集合;其中,所述第二筛选条件基于所述第一筛选集合的平均值获得;基于所述第二筛选集合,获取所述设备的设备上限温度值以及设备下限温度值。
[0007]在本申请一个实施方式中,所述第一筛选条件可包括去除小于第一温度阈值以及大于第二温度阈值的所述初始温度值。
[0008]在本申请一个实施方式中,所述第二筛选条件可包括去除所述第一筛选集合中小于第三温度阈值以及大于第四温度阈值的所述初始温度值,其中,所述第三温度阈值为所述第一筛选集合的平均值与第一预设值之差,所述第四温度阈值为所述第一筛选集合的平均值与第二预设值之和。
[0009]在本申请一个实施方式中,所述设备包括至少一个板卡,所述板卡包括多个所述芯片,所述方法可还包括:基于所述第一筛选条件和所述第二筛选条件对每个所述板卡的多个所述初始温度值进行筛选,获得每个所述板卡的板卡上限温度值以及板卡下限温度
值;将多个所述板卡上限温度值中的最大值作为所述设备上限温度值和将多个所述板卡下限温度值中的最小值作为所述设备下限温度值。
[0010]在本申请一个实施方式中,所述方法还可包括:基于所述设备的所述设备上限温度值以及所述下限温度值调整所述设备的散热方式;或基于所述板卡上限温度值以及所述板卡下限温度值调整所述板卡的散热方式;其中,所述散热方式包括调整所述设备或者所述板卡的通风量和调整所述芯片的工作频率。
[0011]在本申请一个实施方式中,所述采集每一个所述芯片的初始温度值,并生成初始温度值集合,可包括:检测所述初始温度值的获取时间,并将所述获取时间与时间阈值进行对比;若所述获取时间大于所述时间阈值,对应的所述初始温度值赋无效温度值;去除所述无效温度值后的所述初始温度值组成所述初始温度值集合。
[0012]在本申请一个实施方式中,所述方法还可包括:对所述无效温度值对应的所述芯片或者与所述芯片连接的连接线进行复位操作。
[0013]本申请另一方面提供了一种设备温度检测装置,所述设备可包括多个芯片,所述装置可包括:温度采集模块,用于采集每一个所述芯片的初始温度值,并生成初始温度值集合;筛选模块,用于预设第一筛选条件,并基于所述第一筛选条件对所述初始温度值集合进行第一筛选,获得第一筛选集合;预设第二筛选条件,并基于所述第二筛选条件对所述第一筛选集合进行第二筛选,获得第二筛选集合;其中,所述第二筛选条件基于所述第一筛选集合的平均值获得;温度确定模块,用于基于所述第二筛选集合,获取所述设备的设备上限温度值以及设备下限温度值。
[0014]在本申请一个实施方式中,所述第一筛选条件可包括去除小于第一温度阈值以及大于第二温度阈值的所述初始温度值。
[0015]在本申请一个实施方式中,所述第二筛选条件包括去除所述第一筛选集合中小于第三温度阈值以及大于第四温度阈值的所述初始温度值,其中,所述第三温度阈值为所述第一筛选集合的平均值与第一预设值之差,所述第四温度阈值为所述第一筛选集合的平均值与第二预设值之和。
[0016]在本申请一个实施方式中,所述设备包括至少一个板卡,所述板卡包括多个所述芯片,其中,所述筛选模块还可用于基于所述第一筛选条件和所述第二筛选条件对每个所述板卡的多个所述初始温度值进行筛选,获得每个所述板卡的板卡上限温度值以及板卡下限温度值;所述温度确定模块还可用于将多个所述板卡上限温度值中的最大值作为所述设备上限温度值和将多个所述板卡下限温度值中的最小值作为所述设备下限温度值。
[0017]本申请再一方面提供了一种电子设备,所述电子设备可包括:至少一个板卡,包含多个芯片;以及控制板,包含:存储器和处理器;其中,所述存储器中存储有可被所述处理器执行的应用程序,用于使得所述处理器执行如上述的设备温度检测方法;其中,所述板卡通过信号连接接口与所述控制板形成信号连接,所述板卡通过电源连接接口与电源形成电力连接。
[0018]本申请又一方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序使得计算机执行上述任一项的设备温度检测方法。
[0019]根据本申请示例性的实施方式,通过对初始温度值进行第一筛选和第二筛选,去除部分异常的初始温度值,可以获得更准确的板卡温度值以及设备温度值。
附图说明
[0020]通过阅读参照以下附图所作的对非限制性实施例的详细描述,本申请的其它特征、目的和优点将会变得更明显。其中:图1为根据本申请实施方式的设备温度检测方法1000的流程图;图2为根据本申请示例性实施方式的设备温度检测装置2000的示意图;图3为根据本申请示例性实施方式的控制板结构图;图4为根据本申请示例性实施方式的电子设备示意图。
具体实施方式
[0021]为了更好地理解本申请,将参考附图对本申请的各个方面做出更详细的说明。应理解,这些详细说明只是对本申请的示例性实施方式的描述,而非以任何方式限制本申请的范围。在说明书全文中,相同的附图标号指代相同的元件。表述“和/或”包括相关联的所列项目中的一个或多个的任何和全部组合。
[0022]在附图中,为了便于说明,已稍微调整了元素的大小、尺寸和形状。附图仅为示例而并非严格按比例绘制。如在本文中使用的,用语“大致”、“大约”以及类似的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种设备温度检测方法,其特征在于,所述设备包括多个芯片,所述方法包括:采集每一个所述芯片的初始温度值,并生成初始温度值集合;预设第一筛选条件,并基于所述第一筛选条件对所述初始温度值集合进行第一筛选,获得第一筛选集合;预设第二筛选条件,并基于所述第二筛选条件对所述第一筛选集合进行第二筛选,获得第二筛选集合;其中,所述第二筛选条件基于所述第一筛选集合的平均值获得;基于所述第二筛选集合,获取所述设备的设备上限温度值以及设备下限温度值。2.根据权利要求1所述的设备温度检测方法,其特征在于,所述第一筛选条件包括去除小于第一温度阈值以及大于第二温度阈值的所述初始温度值。3.根据权利要求1所述的设备温度检测方法,其特征在于,所述第二筛选条件包括去除所述第一筛选集合中小于第三温度阈值以及大于第四温度阈值的所述初始温度值,其中,所述第三温度阈值为所述第一筛选集合的平均值与第一预设值之差,所述第四温度阈值为所述第一筛选集合的平均值与第二预设值之和。4.根据权利要求1至3任一项所述的设备温度检测方法,其特征在于,所述设备包括至少一个板卡,所述板卡包括多个所述芯片,所述方法还包括:基于所述第一筛选条件和所述第二筛选条件对每个所述板卡的多个所述初始温度值进行筛选,获得每个所述板卡的板卡上限温度值以及板卡下限温度值;将多个所述板卡上限温度值中的最大值作为所述设备上限温度值和将多个所述板卡下限温度值中的最小值作为所述设备下限温度值。5.根据权利要求4所述的设备温度检测方法,其特征在于,所述方法还包括:基于所述设备的所述设备上限温度值以及所述设备下限温度值调整所述设备的散热方式;或基于所述板卡上限温度值以及所述板卡下限温度值调整所述板卡的散热方式;其中,所述散热方式包括调整所述设备或者所述板卡的通风量和调整所述芯片的工作频率。6.根据权利要求1所述的设备温度检测方法,其特征在于,所述采集每一个所述芯片的初始温度值,并生成初始温度值集合,包括:检测所述初始温度值的获取时间,并...

【专利技术属性】
技术研发人员:刘世君张超栗鹏飞王英华吕林君姜嘉欢
申请(专利权)人:中科声龙科技发展北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1