当前位置: 首页 > 专利查询>之江实验室专利>正文

一种计算设备散热的方法、装置、存储介质及电子设备制造方法及图纸

技术编号:38687593 阅读:20 留言:0更新日期:2023-09-02 23:01
本说明书公开了一种计算设备散热的方法、装置、存储介质及电子设备,本方法通过确定各时刻的计算设备的芯片的特征以及计算设备的散热单元中冷却介质的特征确定训练样本,并获取散热单元的控制指令作为训练样本的标注,然后针对每个特征维度,根据该维度的特征对训练样本进行排序以确定该维度的样本序列,再确定标注相同且连续的各训练样本组成的待选样本组,并确定包含训练样本数量不小于预设数量的待选样本组作为目标样本组,根据各目标样本组以及各目标样本组对应的标注确定控制规则,进一步对计算设备进行散热控制。本方法通过对历史上控制指令、芯片特征以及散热单元中冷却介质的特征的学习生成控制规则,使计算设备可以自行进行散热控制。自行进行散热控制。自行进行散热控制。

【技术实现步骤摘要】
一种计算设备散热的方法、装置、存储介质及电子设备


[0001]本说明书涉及计算机
,尤其涉及一种计算设备散热的方法、装置、存储介质及电子设备。

技术介绍

[0002]随着计算机技术的飞速发展,各种计算设备被广泛使用,为各种业务提供算力支撑。
[0003]通常情况下,业务平台的计算设备需要在业务产品的整个生命周期内,为业务的正常运行提供算力支撑。然而,由于计算设备体积有限,内部包含众多大功率电子元件,当计算设备在长时间、高负荷的运行使内部热量积累,而散热控制单元无法及时的将热量散出时,会导致芯片过热计算性能降低。更甚在有些情况下导致芯片损毁,因此,能否及时有效的散热对计算设备而言极为重要。黑盒人工智能技术生产的计算设备散热模型不可被信任,存在错误控制散热系统导致服务器内昂贵芯片损坏的风险。而可解释人工智能可生产能被人理解、信任、修改的白盒模型。
[0004]基于此,本说明书提供一种采用了可解释人工智能技术的计算设备散热的方法。

技术实现思路

[0005]本说明书提供一种计算设备散热的方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
[0006]本说明书采用下述技术方案:本说明书提供一种计算设备散热的方法,所述方法包括:针对每个时刻,确定该时刻计算设备的芯片的特征以及该时刻所述计算设备的散热单元中冷却介质的特征,根据确定出的各特征确定该时刻的训练样本;获取该时刻所述计算设备的散热单元对应的控制指令,作为该时刻的训练样本的标注;针对每个特征维度,按照预设顺序,根据各训练样本中该特征维度的特征,对各训练样本进行排序,确定该特征维度的样本序列;在该特征维度的样本序列中,确定标注相同且连续的各训练样本组成的待选样本组,并确定包含训练样本数量不小于预设数量的待选样本组,作为目标样本组;针对确定出的目标样本组对应的每个标注,将对应该标注的目标样本组中该特征维度的取值区间,作为该标注对应的控制指令的子条件;针对每个控制指令,根据该控制指令在各特征维度下确定出的子条件,确定控制规则;根据当前时刻所述计算设备的芯片的特征,当前时刻所述计算设备的散热单元中冷却介质的特征,以及确定出的控制规则,确定目标操作指令,根据所述目标操作指令对所述计算设备进行散热。
[0007]可选地,确定该时刻计算设备的芯片的特征以及该时刻所述计算设备的散热单元中冷却介质的特征,具体包括:根据该时刻计算设备的芯片的状态确定该时刻计算设备的芯片的特征,以及根据该时刻所述计算设备的散热单元中冷却介质的状态确定该时刻所述计算设备的散热单元中冷却介质的特征;其中,所述计算设备的芯片包括主芯片和辅芯片;所述计算设备的芯片状态至少包括所述主芯片的温度、所述辅芯片的温度、所述主芯片的运算单元使用比例、所述辅芯片的运算单元使用比例;所述计算设备的散热单元中冷却介质的状态至少包括冷却介质的温度、冷却介质的流量与冷却介质的压力。
[0008]可选地,所述散热单元包括风扇、进液阀与进液泵;所述计算设备的散热单元对应的控制指令包括风扇转速、进液阀开度与进液泵转速。
[0009]可选地,确定对应该标注的目标样本组的中该特征维度的取值区间,作为该标注对应的控制指令的子条件,具体包括:根据对应该标注的目标样本组中该特征维度的特征的最小值及最大值,确定对应该标注的目标样本组中该特征维度的取值区间,作为该标注对应的控制指令的子条件。
[0010]可选地,针对每个控制指令,根据该控制指令在各特征维度下确定出的子条件,确定控制规则,具体包括:针对每个控制指令,将该控制指令在各特征维度下确定出的子条件通过并运算和/或交运算进行组合,确定该控制指令对应的控制规则。
[0011]可选地,所述训练样本还包括根据所述计算设备的散热单元对应的控制指令确定的所述计算设备的散热单元的功耗特征,以及根据所述计算设备的芯片的特征确定的所述计算设备的芯片的散热特征。
[0012]可选地,根据当前时刻所述计算设备的芯片的特征,当前时刻所述计算设备的散热单元中冷却介质的特征,以及确定出的控制规则,确定目标操作指令,具体包括:根据当前时刻所述计算设备的芯片状态确定当前时刻所述计算设备的芯片维度的特征,并根据当前时刻所述散热控制单元中冷却介质的状态确定当前时刻所述计算设备的散热单元中冷却介质的特征;针对每个控制规则,判断当前时刻所述计算设备的芯片的特征,与当前时刻所述计算设备的散热单元中冷却介质的特征是否均符合该控制规则各维度的特征对应的子条件;若是,将该控制规则作为目标规则;从各目标规则对应的控制指令中确定功耗最小的控制指令,作为目标操作指令。
[0013]本说明书提供了一种计算设备散热的装置,所述装置包括:第一确定模块,用于针对每个时刻,确定该时刻计算设备的芯片的特征以及该时刻所述计算设备的散热单元中冷却介质的特征,根据确定出的各特征确定该时刻的训练样本;获取模块,用于获取该时刻所述计算设备的散热单元对应的控制指令,作为该时刻的训练样本的标注;排序模块,用于针对每个特征维度,按照预设顺序,根据各训练样本中该特征维度
的特征,对各训练样本进行排序,确定该特征维度的样本序列;第二确定模块,用于在该特征维度的样本序列中,确定标注相同且连续的各训练样本组成的待选样本组,并确定包含训练样本数量不小于预设数量的待选样本组,作为目标样本组;针对确定出的目标样本组对应的每个标注,将对应该标注的目标样本组中该特征维度的取值区间,作为该标注对应的控制指令的子条件;第三确定模块,用于针对每个控制指令,根据该控制指令在各特征维度下确定出的子条件,确定控制规则;散热模块,用于根据当前时刻所述计算设备的芯片的特征,当前时刻所述计算设备的散热单元中冷却介质的特征,以及确定出的控制规则,确定目标操作指令,根据所述目标操作指令对所述计算设备进行散热。
[0014]本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述计算设备散热的方法。
[0015]本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述计算设备散热的方法。
[0016]本说明书采用的上述至少一个技术方案能够达到以下有益效果:本方法通过确定各时刻的计算设备的芯片的特征以及计算设备的散热单元中冷却介质的特征确定训练样本,并获取散热单元的控制指令作为训练样本的标注,然后针对每个特征维度,根据该维度的特征对训练样本进行排序以确定该维度的样本序列,再确定标注相同且连续的各训练样本组成的待选样本组,并确定包含训练样本数量不小于预设数量的待选样本组作为目标样本组,根据各目标样本组以及各目标样本组对应的标注确定控制规则,进一步对计算设备进行散热控制。
[0017]本方法通过对历史上控制指令、芯片特征以及散热单元中冷却介质的特征的学习生成控制规则,使计算设备可以自行进行散热控制。
附图说明
[0018]此处所说明的附图用来提供对本说明书的进一步理解,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算设备散热的方法,其特征在于,所述方法包括:针对每个时刻,确定该时刻计算设备的芯片的特征以及该时刻所述计算设备的散热单元中冷却介质的特征,根据确定出的各特征确定该时刻的训练样本;获取该时刻所述计算设备的散热单元对应的控制指令,作为该时刻的训练样本的标注;针对每个特征维度,按照预设顺序,根据各训练样本中该特征维度的特征,对各训练样本进行排序,确定该特征维度的样本序列;在该特征维度的样本序列中,确定标注相同且连续的各训练样本组成的待选样本组,并确定包含训练样本数量不小于预设数量的待选样本组,作为目标样本组;针对确定出的目标样本组对应的每个标注,将对应该标注的目标样本组中该特征维度的取值区间,作为该标注对应的控制指令的子条件;针对每个控制指令,根据该控制指令在各特征维度下确定出的子条件,确定控制规则;根据当前时刻所述计算设备的芯片的特征,当前时刻所述计算设备的散热单元中冷却介质的特征,以及确定出的控制规则,确定目标操作指令,根据所述目标操作指令对所述计算设备进行散热。2.如权利要求1所述的方法,其特征在于,确定该时刻计算设备的芯片的特征以及该时刻所述计算设备的散热单元中冷却介质的特征,具体包括:根据该时刻计算设备的芯片的状态确定该时刻计算设备的芯片的特征,以及根据该时刻所述计算设备的散热单元中冷却介质的状态确定该时刻所述计算设备的散热单元中冷却介质的特征;其中,所述计算设备的芯片包括主芯片和辅芯片;所述计算设备的芯片状态至少包括所述主芯片的温度、所述辅芯片的温度、所述主芯片的运算单元使用比例、所述辅芯片的运算单元使用比例;所述计算设备的散热单元中冷却介质的状态至少包括冷却介质的温度、冷却介质的流量与冷却介质的压力。3.如权利要求1所述的方法,其特征在于,所述散热单元包括风扇、进液阀与进液泵;所述计算设备的散热单元对应的控制指令包括风扇转速、进液阀开度与进液泵转速。4.如权利要求1所述的方法,其特征在于,确定对应该标注的目标样本组的中该特征维度的取值区间,作为该标注对应的控制指令的子条件,具体包括:根据对应该标注的目标样本组中该特征维度的特征的最小值及最大值,确定对应该标注的目标样本组中该特征维度的取值区间,作为该标注对应的控制指令的子条件。5.如权利要求1所述的方法,其特征在于,针对每个控制指令,根据该控制指令在各特征维度下确定出的子条件,确定控制规则,具体包括:针对每个控制指令,将该控制指令在各特征维度下确定出的子条件通过并运算和/或交运算进行组合,确定该控制指令对应的控制...

【专利技术属性】
技术研发人员:刘懿程稳李勇陈光曾令仿吴运翔吕波陈晨朱健
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1