【技术实现步骤摘要】
GPU模块低功耗时钟树处理方法
[0001]本专利技术属于数字集成电路低功耗物理设计
,涉及GPU模块低功耗时钟树处理方法。
技术介绍
[0002]随着超大规模集成电路和图形技术的不断发展,GPU成为人们研究的焦点之一。由于GPU具有高度并行的架构,适应于单浮点运算、高度并行的数据密集型计算,已经成为芯片设计中不可或缺的模块。在GPU性能提升的同时出现的“功耗墙”问题对设计人员提出了更大的挑战。随着芯片集成度越来越高,芯片表面温度也变得越来越高并呈指数增长,功耗在GPU设计中已经成为与性能和面积同等重要的设计指标。研究表明GPU的效能是CPU的5倍左右,但GPU的总体功耗是CPU的2~3倍。高功耗不仅意味着大量的能源消耗,而且热堆积和不断增加的功耗密度将造成GPU稳定性问题。研究表明工作温度每增加10度,芯片的失效率将增加一倍。另外,为了缓解热堆积,不得不使用散热能力更加强大的封装材料、额外的散热装置和发热保护电路,这无疑增加了GPU的制造成本。过高的功耗限制了GPU性能的提升,如果要进一步提高内核频率或增大片上缓存容 ...
【技术保护点】
【技术特征摘要】
1.GPU模块低功耗时钟树处理方法,其特征在于,根据GPU模块的架构,对GPU的时钟插入时钟门控单元,对插入的时钟门控单元进行聚类分组,对分组后时钟门控单元驱动的触发器再次进行分组,基于触发器组建立低功耗时钟树,并结合CCD技术完成数据路径的优化。2.根据权利要求1所述的GPU模块低功耗时钟树处理方法,其特征在于,具体按照以下步骤实施:步骤1、根据GPU模块的架构,对GPU的时钟插入时钟门控单元,对插入的时钟门控单元进行分组,这些时钟门控单元是处于同一层级下的;步骤2、计算同一层级下的时钟门控单元的中心点坐标;步骤3、计算时钟门控单元之间的曼哈顿距离,并且根据设计的最大扇出值确定时钟门控单元之间的阈值距离;步骤4、利用最小生成树算法,以时钟树互连线趋于最小值为标准,根据曼哈顿距离不超过阈值距离为条件,对时钟门控单元进行分组;步骤5、对初始分组的时钟门控单元利用阈值电容重新迭代分组,得到最终的时钟门控单元组;对初始分组的时钟门控单元,判断新加入时钟门控单元后,时钟门控单元组的总电容值的大小有没有超过阈值电容,如果超过,则该时钟门控单元寻找下一个距离最近的时钟门控单元组,若没有超过阈值电容,则该时钟门控单元加入时钟门控单元组;步骤6、对时钟门控单元完成分组后,整理每个组的每个时钟门控单元驱动的触发器的层级,并根据层级对触发器进行分组,重复步骤2
‑
5对时钟门控单元驱动的触发器进行分组并分配缓冲器;步骤7、基于时钟门控单元组和触发器组建立低功耗时钟树,同时设置CCD技术参数优化数据路径。3.根据权利要求2所述的GPU模块低功耗时钟树处理方法,其特征在于,所述步骤2具体为,根据下式计算时钟门控单元组的阈值距离M:C
buff
=F*C
r
+F*M*C
w
(1)式(1)中,C
buff
为缓冲器的最大负载电容,C
r
表示时钟门控单元的电容,C
w
是单位互连线的电容,F是最大扇出值;根据层级对时钟门控单元进行初始的分组,得到一个初始时钟门控单元集合N
reg
,计算该组时钟门控单元的中心点坐标,然后计算各个时钟门控单元之间的距离,根据两个时钟门控单元之间的距离有没有超过阈值距离来判断两个时钟门控单元能不能分为一组。4.根据权利要求2所述的GPU模块低功耗时钟树处理方法,其特征在于,所述步骤3具体为:根据中心点坐标计算该组时钟门控单元两两之间的曼哈顿距离式(2)中,x
ri
表示时钟门控单元的左下角横坐标,x
rj
表示时钟门控单元的右下角横坐标,y
ri
表示时钟门控单元的左上角纵坐标,y
rj
分别表示时钟门控单元的右上角纵坐标。5.根据权利要求3所述的G...
【专利技术属性】
技术研发人员:杨媛,杜文静,侯陈睿,李耀华,杨成煜,
申请(专利权)人:西安理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。