一种分析模型与周期精确模型结合的GPU性能建模方法技术

技术编号:36425519 阅读:23 留言:0更新日期:2023-01-20 22:35
本发明专利技术公开了一种分析模型与周期精确模型结合的GPU性能建模方法,收集GPU应用程序运行时trace;提取GPU架构信息,构建基于周期精确模型建模的访存模块模型;解析GPU应用程序运行时trace,并生成指令序列;将每个线程块的指令映射到目标GPU架构上,构建指令的执行时间序列,直至所有线程块中指令完成建模,获取GPU应用程序执行周期数cycle

【技术实现步骤摘要】
一种分析模型与周期精确模型结合的GPU性能建模方法


[0001]本专利技术属于GPU性能建模
,具体涉及一种分析模型与周期精确模型结合的GPU性能建模方法。

技术介绍

[0002]GPU架构的快速创新对GPU的建模提出了新的挑战。为了研究并开发新的处理器架构,并且快速对新的设计进行性能与功耗的评估,体系结构的研究者需要对CPU或者GPU建立精确的性能模型,并开发相应的模拟器,加速设计周期。当前,GPU架构设计广泛采用虚拟指令集(vISA)和机器指令集(mISA),这样使得硬件开发商在改变机器指令集mISA上具有极大的灵活性,同时不改变vISA从而保持应用的兼容性。然而NVIDIA公司的mISA通常并不公开,而AMD公司的mISA由于通常改动较大而使其较难实现到开源模拟器中。因此,如何对不断创新的GPU架构实现精确的性能建模成为当前GPU设计面临的重要挑战。
[0003]当前的GPU性能建模主要分为以下几种形式:
[0004](1)周期精确模型。当前对GPU进行周期精确建模的开源仿真框架包括MacSim、Multi2sim、本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种分析模型与周期精确模型结合的GPU性能建模方法,其特征在于,包括:步骤1、收集GPU应用程序运行时trace;步骤2、提取GPU架构信息,构建基于周期精确模型建模的访存模块模型;步骤3、解析GPU应用程序运行时trace,并生成指令序列;步骤4、将每个线程块的指令映射到目标GPU架构上,采用分析模型建模的方式构建指令的执行时间序列,直至所有线程块中指令完成建模,获取GPU应用程序执行周期数cycle
max
;步骤5、获取GPU应用程序执行指令总数N
instruction
,结合cycle
max
计算GPU性能指标IPC。2.根据权利要求1所述的一种分析模型与周期精确模型结合的GPU性能建模方法,其特征在于,所述步骤1通过trace收集工具,收集记录GPU应用程序指令状态的日志文件,包含的信息有指令运行的线程块编号、warp编号、指令的操作码、指令源寄存器数目及编号、指令的目标寄存器数目及编号、访存种类以及访存地址。3.根据权利要求1所述的一种分析模型与周期精确模型结合的GPU性能建模方法,其特征在于,所述步骤2包括以下步骤:步骤2.1、提取GPU架构信息,包括GPU流多处理器数目,GPU缓存配置,GPU内存配置,GPU时钟频率,GPU warp调度策略,GPU指令延迟信息;步骤2.2、构建基于周期精确模型建模的访存模块模型,得到GPU访存模块周期精确模拟器:依据GPU架构信息,构建包含L1缓存,L2缓存,片上网络和GPU内存的周期精确模拟器;模拟器参数包括:L1缓存和L2缓存数目,缓存映射方式,缓存替换策略,未命中寄存...

【专利技术属性】
技术研发人员:王良徐向荣肖利民刘浩郭为
申请(专利权)人:北京天数微芯半导体科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1