基于区块CTA调度的GPGPU内存数据预取方法、装置及存储介质制造方法及图纸

技术编号:43353386 阅读:20 留言:0更新日期:2024-11-19 17:40
一种基于区块CTA调度的GPGPU内存数据预取方法、装置及存储介质,涉及GPGPU技术领域,将区块CTA调度方法于数据预取相结合,利用BCS策略将具有空间局部性的线程块分配到同一处理核心中,增加了预取数据被实际访问的可能性,预取的数据更有可能被实际使用,减少了缓存中无效数据的比例,从而提高了预取命中率、降低了数据被污染的可能;同时,BCS策略的应用可以使得预取算法和操作简单化,减少不必要的预取操作和数据访问模式的优化,在预测较稳定的同时有效降低了系统的能耗;再次,空间局部性的增强意味着内存访问延迟的降低,大大提高了系统访存的效率。

【技术实现步骤摘要】

本专利技术涉及gpgpu,具体涉及一种基于区块cta调度的gpgpu内存数据预取方法、装置及存储介质。


技术介绍

1、在现代并行计算中,gpgpu作为一种强大的计算资源,广泛应用于科学计算和深度学习等领域。然而,现有数据预取技术在gpgpu中的应用存在显著局限性。传统的数据预取方法往往基于简单的预测模型,未能充分考虑gpgpu中线程执行的动态特性和数据访问的空间局部性。这导致在执行过程中,缓存命中率不高,内存访问延迟成为制约性能提升的关键因素。尤其是在处理大规模并行任务时,线程块之间的资源竞争和缓存未命中问题尤为突出。此外,现有预取技术缺乏对线程块调度策略的考虑,未能有效利用gpgpu的硬件资源,从而未能实现最优的数据访问模式。


技术实现思路

1、本专利技术为了克服以上技术的不足,提供了一种降低系统的能耗、提高系统访存效率的基于区块cta调度的gpgpu内存数据预取方法、装置及存储介质。适用于需要处理大量并行任务和数据密集型操作的高性能计算环境。

2、本专利技术克服其技术问题所采用的技术方案是:<本文档来自技高网...

【技术保护点】

1.一种基于区块CTA调度的GPGPU内存数据预取方法,其特征在于,包括:

2.根据权利要求1所述的基于区块CTA调度的GPGPU内存数据预取方法,其特征在于:步骤S1中所需的硬件资源包括核心、缓存、内存控制器。

3.根据权利要求1所述的基于区块CTA调度的GPGPU内存数据预取方法,其特征在于:步骤S2中将分解的线程组织成线程束,将线程束组成二维网格化分布的线程块。

4.根据权利要求1所述的基于区块CTA调度的GPGPU内存数据预取方法,其特征在于,步骤S3中对每个线程块进行数据追踪与分析包括:追踪并记录每个线程块的启动时间、执行时间、完成时间;分析...

【技术特征摘要】

1.一种基于区块cta调度的gpgpu内存数据预取方法,其特征在于,包括:

2.根据权利要求1所述的基于区块cta调度的gpgpu内存数据预取方法,其特征在于:步骤s1中所需的硬件资源包括核心、缓存、内存控制器。

3.根据权利要求1所述的基于区块cta调度的gpgpu内存数据预取方法,其特征在于:步骤s2中将分解的线程组织成线程束,将线程束组成二维网格化分布的线程块。

4.根据权利要求1所述的基于区块cta调度的gpgpu内存数据预取方法,其特征在于,步骤s3中对每个线程块进行数据追踪与分析包括:追踪并记录每个线程块的启动时间、执行时间、完成时间;分析每个线程块对内存的访问模式。

5.根据权利要求4...

【专利技术属性】
技术研发人员:颜佳宁王帅赵鑫鑫姜凯
申请(专利权)人:山东浪潮科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1