一种基于子图解耦的粗粒度可重构阵列调度方法技术

技术编号:28214117 阅读:34 留言:0更新日期:2021-04-24 14:54
本发明专利技术提供了一种基于子图解耦的粗粒度可重构阵列调度方法,涉及计算机协处理器加速器领域,包括子图解耦模块、动态配置切换模块、子图调度器,其中,所述子图解耦模块是针对程序中的非一致性控制流,将数据流图解耦成子图依次执行;所述动态配置切换模块是设计了一种多米诺骨牌式的配置切换机制,降低动态配置切换的开销;所述子图调度器是通过监测片上缓存中子缓存(bank)的空满状态,对子图的执行顺序进行动态调度。利用本发明专利技术提供的算法,可以提高阵列计算单元(PE)利用率,降低子图切换的开销。销。销。

【技术实现步骤摘要】
一种基于子图解耦的粗粒度可重构阵列调度方法


[0001]本专利技术属于计算机协处理器加速器,涉及粗粒度可重构阵列的结构以及阵列计算单元利用率提升的方法。

技术介绍

[0002]粗粒度可重构阵列CGRA由大量可配置的计算单元PE组成,每个PE以数据流驱动的模式执行操作。通过空间映射的方式,一旦输入数据有效,大量PE便可以同时并行执行。这极大地提高了阵列的计算吞吐率。
[0003]然而随着可重构阵列的应用范围扩大,程序中存在的非完美循环,分支,循环依赖会将整个程序分割成不同的控制流区域。这些非一致性控制流区域无法同时流水执行,因此会显著降低阵列中PE的利用率,进而降低阵列执行性能。以下将以非完美循环,分支和循环依赖为例,进行阐述。
[0004]图2(a)中以通用矩阵乘这个应用为例,对非完美循环进行阐述。如图2(a)左侧代码所示,内层循环体(实线框所示)每执行block_size次,外层循环体(虚线框所示)才执行一次;因此由于非完美循环中内外层循环触发频率不同,导致执行外层循环的PE(右图斜线阴影所示)大部分时间处于空闲状态,因此降低本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于子图解耦的粗粒度可重构阵列调度方法,其特征在于,包括子图解耦模块、动态配置切换模块、子图调度器,其中,所述子图解耦模块是针对程序中的非一致性控制流,将数据流图解耦成子图依次执行;所述动态配置切换模块是设计了一种多米诺骨牌式的配置切换机制,降低动态配置切换的开销;所述子图调度器是通过监测片上缓存中子缓存(bank)的空满状态,对子图的执行顺序进行动态调度。2.如权利要求1所述的一种基于子图解耦的粗粒度可重构阵列调度方法,其特征在于,所述调度方法包括以下步骤:步骤S1:将数据流图(DFG)中处于所述非一致性控制流的区域分割成若干个相互独立的所述子图;步骤S2:同一时间内,每个所述子图在阵列上独立执行并进行充分的循环展开以提高阵列PE利用率;步骤S3:当某一个所述子图执行完毕后,利用所述多米诺骨牌式的配置切换机制进行子图切换;步骤S4:通过交替执行所有的所述子图,最终完成整个程序的执行。3.如权利要求2所述的一种基于子图解耦的粗粒度可重构阵列调度方法,其特征在于,所述非一致性控制流包括非完美循环中外层循环子图和内层循环子图执行次数不同、分支中不同路径的所述子图不会同时执行、循环依赖中含有数据依赖的所述子图无法并行执行。4.如权利要求2所述的一种基于子图解耦的粗粒度可重构阵列调度方法,其特征在于,所述步骤S2是通过片上缓存暂存中间数据实现所述子图解耦。5.根据权利要求2所述的多米诺骨牌式配置切换机制,其特征是,将配置切换信号(子图I...

【专利技术属性】
技术研发人员:景乃锋尹琛王琴蒋剑飞贺光辉毛志刚
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1