The invention discloses a low power oriented heterogeneous multi-core shared cache partitioning method, first level cache sharing static partitioning L2 level Cache, CPU used to cache space allocation constant ratio of 50%, the remaining space for GPU application. On the basis of equal proportion division, the optimal static proportion is divided, and the unequal proportion is applied to CPU and GPU. Finally, the dynamic adaptive partition mechanism, using the dynamic partitioning algorithm for low power consumption, according to the IPC classification index change dynamically at run-time CPU application and GPU application level cache share proportion, so as to reduce the power consumption of the system, improve the system performance.
【技术实现步骤摘要】
一种面向低功耗的异构多核共享cache划分方法
本专利技术属于计算机体系缓存系统结构领域,具体涉及一种面向低功耗的异构多核共享cache划分方法。
技术介绍
随着多核处理器的不断发展,传统的多核架构难以满足大规模计算的需求,工业界通过整合不同类型的处理器于同一个芯片上,形成了异构多核处理器架构。异构多核处理器(HMP-HeterogeneousMulti-coreProcessor)将具有不同计算能力的处理器融合到一起,被广泛应用于航空航天、工业控制、仪器仪表等行业,以满足系统性能需求,降低功耗和成本。HMP由于集成了不同特点和性能的处理器核,可将不同类型的计算任务分配到不同类型的处理器核上并行处理,比如,快速复杂的核能执行串行代码部分,而较简单的核则能并行处理数字,从而为不同需求的应用提供更加灵活、高效的处理机制,满足多种应用环境对系统实时性、功耗、可靠性和成本的要求,成为当今研究的热点。图形处理器(GraphicsProcessingUnit,GPU)具有相对简单的控制逻辑,集成有大量并行处理核心,具有较高的峰值效能(单位功耗的计算性能)。GPU自诞生伊始便在浮点计算性能上超越了CPU,GPU并行执行与CPU顺序执行性能之间巨大的鸿沟使得大量的程序开发人员将计算密集型的部分交给GPU进行计算,计算机体系结构也从传统的多核CPU时代驾驶跨越到多核CPU-GPU异构时代。异构多核处理器架构如AMDFusion、IntelSandyBridge和NvidiaDenver的出现表明了异构多核架构正在成为当今时代的主流。异构多核处理器上CPU和GPU集成在一个芯 ...
【技术保护点】
一种面向低功耗的异构多核共享cache划分方法,其特征在于,包括以下步骤:步骤1,实现CPU请求与GPU请求区分,跟踪访存请求,使用标志位TagID来区分不同核心的访存请求;步骤2,根据不同核心访存请求的标志位TagID决定访存请求映射到的L2Cache地址;步骤3,实现静态划分,包括以下步骤:步骤3.1,等量均分在L2Cache的请求缓冲队列L1RequestToL2Cache中,判断TagID消息标志位,如果该请求是来自GPU核心的L1级Cache,将该访存请求映射到奇地址,如果该请求是来自CPU核心的L1级Cache,将该访存请求映射到偶地址;步骤3.2,最优划分,在均分的基础上,逐步改变分配给CPU和GPU应用的缓存地址比例,统计共享缓存CPU和GPU程序各自的单位周期内执行的指令数量(Instructions Per Cycle简称IPC),找到性能最优功耗最低的划分比例;步骤4,实现动态自适应划分步骤2,3中的CPU与GPU末级缓存占比是在应用程序运行之前划分好的,在运行中不会根据应用程序的特征进行动态调整。动态划分在运行时收集CPU核和GPU核访存请求的特征,实现自适应动 ...
【技术特征摘要】
1.一种面向低功耗的异构多核共享cache划分方法,其特征在于,包括以下步骤:步骤1,实现CPU请求与GPU请求区分,跟踪访存请求,使用标志位TagID来区分不同核心的访存请求;步骤2,根据不同核心访存请求的标志位TagID决定访存请求映射到的L2Cache地址;步骤3,实现静态划分,包括以下步骤:步骤3.1,等量均分在L2Cache的请求缓冲队列L1RequestToL2Cache中,判断TagID消息标志位,如果该请求是来自GPU核心的L1级Cache,将该访存请求映射到奇地址,如果该请求是来自CPU核心的L1级Cache,将该访存请求映射到偶地址;步骤3.2,最优划分,在均分的基础上,逐步改变分配给CPU和GPU应用的缓存地址比例,统计共享缓存CPU和GPU程序各自的单位周期内执行的指令数量(InstructionsPerCycle简称IPC),找到性能最优功耗最低的划分比例;步骤4,实现动态自适应划分步骤2,3中的CPU与GPU末级缓存占比是在应用程序运行之前划分好的,在运行中不会根据应用程序的特征进行动态调整。动态划分在运行时收集CPU核和GPU核访存请求的特征,实现自适应动态划分。2.如权利要求1所述的面向低功耗的异构多核共享cache划分方法,其特征在于,步骤4具体包...
【专利技术属性】
技术研发人员:方娟,刘士建,程妍瑾,常泽清,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。