【技术实现步骤摘要】
本专利技术涉及gpgpu,具体涉及一种基于区块cta调度的gpgpu内存数据预取方法、装置及存储介质。
技术介绍
1、在现代并行计算中,gpgpu作为一种强大的计算资源,广泛应用于科学计算和深度学习等领域。然而,现有数据预取技术在gpgpu中的应用存在显著局限性。传统的数据预取方法往往基于简单的预测模型,未能充分考虑gpgpu中线程执行的动态特性和数据访问的空间局部性。这导致在执行过程中,缓存命中率不高,内存访问延迟成为制约性能提升的关键因素。尤其是在处理大规模并行任务时,线程块之间的资源竞争和缓存未命中问题尤为突出。此外,现有预取技术缺乏对线程块调度策略的考虑,未能有效利用gpgpu的硬件资源,从而未能实现最优的数据访问模式。
技术实现思路
1、本专利技术为了克服以上技术的不足,提供了一种降低系统的能耗、提高系统访存效率的基于区块cta调度的gpgpu内存数据预取方法、装置及存储介质。适用于需要处理大量并行任务和数据密集型操作的高性能计算环境。
2、本专利技术克服其技术问题所
...【技术保护点】
1.一种基于区块CTA调度的GPGPU内存数据预取方法,其特征在于,包括:
2.根据权利要求1所述的基于区块CTA调度的GPGPU内存数据预取方法,其特征在于:步骤S1中所需的硬件资源包括核心、缓存、内存控制器。
3.根据权利要求1所述的基于区块CTA调度的GPGPU内存数据预取方法,其特征在于:步骤S2中将分解的线程组织成线程束,将线程束组成二维网格化分布的线程块。
4.根据权利要求1所述的基于区块CTA调度的GPGPU内存数据预取方法,其特征在于,步骤S3中对每个线程块进行数据追踪与分析包括:追踪并记录每个线程块的启动时间、执行
...【技术特征摘要】
1.一种基于区块cta调度的gpgpu内存数据预取方法,其特征在于,包括:
2.根据权利要求1所述的基于区块cta调度的gpgpu内存数据预取方法,其特征在于:步骤s1中所需的硬件资源包括核心、缓存、内存控制器。
3.根据权利要求1所述的基于区块cta调度的gpgpu内存数据预取方法,其特征在于:步骤s2中将分解的线程组织成线程束,将线程束组成二维网格化分布的线程块。
4.根据权利要求1所述的基于区块cta调度的gpgpu内存数据预取方法,其特征在于,步骤s3中对每个线程块进行数据追踪与分析包括:追踪并记录每个线程块的启动时间、执行时间、完成时间;分析每个线程块对内存的访问模式。
5.根据权利要求4...
【专利技术属性】
技术研发人员:颜佳宁,王帅,赵鑫鑫,姜凯,
申请(专利权)人:山东浪潮科学研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。