一种基于GAN网络的GPU全片温度分布估计方法技术

技术编号:36708334 阅读:10 留言:0更新日期:2023-03-01 09:32
本发明专利技术属于GPU热稳定性领域,公开了一种基于GAN网络的GPU全片温度分布估计方法,数据集的构建;GAN网络结构构建;模型训练与优化,最终需要达到生成模型速度和网络精度的平衡,为后续热管理过程提供实时可靠的芯片温度分布数据。本发明专利技术具有所提出的GPU温度分布估计方法能较好的平衡精度和速度,可以在GPU实时系统中运行。系统中运行。系统中运行。

【技术实现步骤摘要】
一种基于GAN网络的GPU全片温度分布估计方法


[0001]本专利技术属于GPU热稳定性领域,尤其涉及一种基于GAN网络的GPU全片温度分布估计方法。

技术介绍

[0002]随着大数据、人工智能等领域问题求解的规模越来越大,计算复杂度急剧提升,图形处理器(Graphic Processing Unit,GPU)已经从仅作为帮助CPU处理图形渲染效率问题的图形领域,逐渐扩展到对计算能力要求高的领域,例如高性能计算、数据中心、互联网、云计算、大数据、深度学习等领域。与CPU相比,GPU拥有数成百上千个核心运算单元,可并行运行大量计算,具有更强大的计算能力,在计算密集型问题求解方面所表现出明显优势。然而由于GPU中包含着高密度并行计算单元,使得GPU在性能高于CPU的同时功耗也高于CPU,随之带来的芯片热相关问题也影响了芯片系统的稳定性和性能,并成为制约GPU发展的重要问题。
[0003]为增强芯片系统热稳定性和降低因热相关问题所造成的性能损失,研究人员曾提出一些热管理方法如任务迁移,功率预算,动态电压频率调节方案等。这些方法的实现需要依赖准确的芯片热点分布,但是受限于片上温度传感器数量和位置,芯片系统所提供的温度数据不能准确的还原热点分布,因此需要结合热模型重建芯片的温度分布。现有的方法主要包括两大类,一种是根据功率信息建立热模型求解温度分布,例如HotSpot;另一种是根据温度信息通过插值获得温度分布,以上方法分别在计算复杂度和精度方面存在缺陷。近年来所兴起的机器学习方法也被应用于重建芯片温度分布,但多数研究集中于CPU方面,对GPU的温度分布研究较少,因此本专利技术提出一种基于神经网络的GPU全片温度分布估计方法,特别采用GAN网络模型。生成对抗网络(Generative adversarial networks,GAN)是生成模型目前最好的一种方法,主要应用于计算机视觉和自然语言处理。本专利技术对利用其在图像生成和超分辨率方面的优势建立GPU的全片温度分布图。
[0004]通过上述分析,现有技术存在的问题及缺陷为:
[0005]GPU温度分布是GPU热管理算法的前提,但是从有限数量的片上温度传感器所获得的数据难以准确的还原芯片温度分布,同时还需要考虑芯片系统运行过程中实时性的要求,现有的方法如有限元和插值法只能单方面满足精度或速度要求;在神经网络方面,现有的基于LSTM网络和GAN网络在CPU温度分布上已经取得初步成效,但却少有针对GPU热问题的解决方案。考虑到GPU结构的复杂性,其高维度的输入和输出会对芯片系统的实时性造成负面影响,并且模型的精度会对芯片的热安全性及系统性能带来挑战。因此本专利技术针对以上问题提出一个合适的解决方案。

技术实现思路

[0006]针对现有技术存在的问题,本专利技术提供了一种基于GAN网络的GPU全片温度分布估计方法。
[0007]本专利技术是这样实现的,一种基于GAN网络的GPU全片温度分布估计方法,其特征在于,该方法具体包括:
[0008]S1:数据集的构建;
[0009]S2:GAN网络结构构建;
[0010]S3:模型训练与优化,最终需要达到生成模型速度和网络精度的平衡,为后续热管理过程提供实时可靠的芯片温度分布数据。
[0011]进一步,所述S1中数据集的构建主要来自GPU系统管理接口,包括GPU片上温度传感器的温度,GPU核心及内存频率,GPU存储命中率;GPU全片温度分布图来自红外热成像仪器,并与以上数据共同构成数据对。
[0012]进一步,所述GAN网络由生成器G和鉴别器D构成,所述生成器G和鉴别器D主要采用卷积层和全连接层搭建。
[0013]进一步,所述生成器G是生成近似真实的样本以欺骗鉴别器,生成网络的输入为向量,首先经过一层全连接层对数据维度变换,然后通过reshape层将向量转换为二维矩阵的图片,最后通过若干卷积层对特征进行提取并生成GPU全片的温度分布;
[0014]所述鉴别器D是去区分真实样本和生成样本,通过对抗训练不断提高各自能力,最终达到纳什均衡状态,输入为生成网络生成的图片和GPU真实温度分布图进行随机排序的矩阵数据,通过若干卷积层和全连接层最终输出判别的结果。
[0015]进一步,所述S3模型训练与优化需要考虑模型在训练时的收敛性以及推理时的速度和精度,在训练过程中由于生成器或鉴别器一方能力过强导致梯度消失的问题,采用Wasserstein距离作为目标函数,Wasserstein距离能很好的度量两个分布之间的差异,即使两个分布之间没有交集或者交集很小。
[0016]进一步,所述生成器G的输入为GPU性能信息包括GPU核心频率、GPU存储频率、GPU核心利用率,GPU存储命中率以及GPU片上温度传感器温度数据所组成的向量,这些数据在GPU运行过程中通过性能监控器实时获取,输出数据为GPU全片温度分布图;真实的温度分布图和生成的温度分布图按照一定比例随机的输入鉴别器,鉴别器在鉴别真伪后通过最小化Wasserstein距离更新鉴别器和生成器的参数,最终完成网络的训练。
[0017]进一步,所述优化的过程主要通过调整生成器的深度以及对输入进行主成分提取以降低输入维度,目的是需要在精度可接受的范围内尽可能的提升速度。
[0018]进一步,所述数据集的采集过程需运行不同类型的工作负载,包括计算密集型,存储密集型,以及系统型任务,最后为保证频率丰富性,在频率设定为在允许范围内的随机频率。
[0019]进一步,所述网络精度的调节可以通过增加卷积核的大小以及增加网络深度完成。
[0020]进一步,所述GAN网络完成训练后,在保持模型结构的不变的条件下,对输入数据采用主成分分析方法降低维度,对卷积层网络采用剪枝方法加快计算速度,最后以压缩后的网络参数作为初始参数进行网络微调训练。
[0021]结合上述的技术方案和解决的技术问题,本专利技术所要保护的技术方案所具备的优点及积极效果为:
[0022]第一、针对上述现有技术存在的技术问题以及解决该问题的难度,紧密结合本发
明的所要保护的技术方案以及研发过程中结果和数据等,详细、深刻地分析本专利技术技术方案如何解决的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:
[0023](1)网络模型输入数据易于获得:采样GPU片上温度传感器的温度数据,工作频率,利用率作为生成网络的输入,以上数据在GPU运行时可实时获取。
[0024](2)采用生成对抗的方法训练网络模型,利用GAN在图像生成和超分辨率方面的优势,生成的GPU全片温度分布可以等同于真实分布,精确度高。同时在图像生成方面GAN网络的生成器结构较传统生成网络简单,因此在推理阶段速度较快。
[0025](3)采用模型压缩方法对生成网络进行优化,包括但不限于主成分分析,剪枝等。这些方法以较小的训练时间成本换取生成网络推理的速度的提升,保证模型在GPU芯片系统的实时运行。
[0026]第二,把技术方案看做一个整体或者从产本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于GAN网络的GPU全片温度分布估计方法,其特征在于,该方法具体包括:S1:数据集的构建;S2:GAN网络结构构建;S3:模型训练与优化,最终需要达到生成模型速度和网络精度的平衡,为后续热管理过程提供实时可靠的芯片温度分布数据。2.根据权利要求1所述的基于GAN网络的GPU芯片全片温度分布估计方法,其特征在于,所述S1中数据集的构建主要来自GPU系统管理接口,包括GPU片上温度传感器的温度,GPU核心及内存频率,GPU核心及存储命中率;GPU全片温度分布图来自红外热成像仪器,并与以上数据共同构成数据对。3.根据权利要求1所述的基于GAN网络的GPU芯片全片温度分布估计方法,其特征在于,所述GAN网络由生成器G和鉴别器D构成,所述生成器G和鉴别器D主要采用卷积层和全连接层搭建。4.根据权利要求3所述的基于GAN网络的GPU芯片全片温度分布估计方法,其特征在于,所述生成器G是生成近似真实的样本以欺骗鉴别器,生成网络的输入为向量,首先经过一层全连接层对数据维度变换,然后通过reshape层将向量转换为二维矩阵的图片,最后通过若干卷积层对特征进行提取并生成GPU全片的温度分布;所述鉴别器D是去区分真实样本和生成样本,通过对抗训练不断提高各自能力,最终达到纳什均衡状态,输入为生成网络生成的图片和GPU真实温度分布图进行随机排序的矩阵数据,通过若干卷积层和全连接层最终输出判别的结果。5.根据权利要求1所述的基于GAN网络的GPU芯片全片温度分布估计方法,其特征在于,所述S3模型训练与优化需要考虑模型在训练时的收敛性以及推理时的速度和精度,在训练过程中由于生成器或鉴别器一方能力过强导致梯度消失...

【专利技术属性】
技术研发人员:王海杨钦惠郭宪章黄乐天
申请(专利权)人:电子科技大学长三角研究院湖州
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1