面向CPU-FPGA异构架构的精度感知的SpMV任务划分与调度方法及系统技术方案

技术编号:45572364 阅读:9 留言:0更新日期:2025-06-20 21:55
本发明专利技术公开了面向CPU‑FPGA异构架构的精度感知的SpMV任务划分与调度方法及系统,方法包括以下步骤:通过无损划分策略对初始稀疏矩阵进行多精度无损划分,得到若干子矩阵;根据若干所述子矩阵的精度和非零元数量,将SpMV任务划分为若干子任务;通过静态任务调度将若干所述子任务根据子矩阵的精度和CPU、FPGA的计算能力进行平均分配;基于任务执行进度对剩余所述子任务进行动态任务调度,完成SpMV任务划分与调度。本发明专利技术降低了CPU和FPGA之间的数据传输开销,以及FPGA端SpMV计算时的访存开销,提升了SpMV在CPU+FPGA异构系统上的整体计算效率。

【技术实现步骤摘要】

本专利技术属于嵌入式,具体涉及面向cpu-fpga异构架构的精度感知的spmv任务划分与调度方法及系统。


技术介绍

1、在科学计算与工程应用领域,计算电磁学、计算流体力学以及空气动力学等工程问题的求解可以转化为大规模稀疏线性方程组的求解问题。稀疏矩阵向量乘(spmv)是稀疏线性方程组求解过程中的关键计算内核之一,也是其主要的性能瓶颈,因此spmv在通用多核处理器(cpu)和通用图形处理器(gpgpu)上的性能优化受到了研究人员的广泛关注。已有工作从新型稀疏矩阵存储格式设计,spmv计算访存优化、任务划分与负载均衡等多方面提升了spmv在cpu和gpu上的计算效率。考虑到物理空间大小和系统功耗预算等多种约束,实际工程设计和实现中存在大量基于fpga的spmv计算需求。与cpu和gpu相比,fpga可定制、易于集成,拥有丰富的计算和存储资源,且fpga的可编程性赋予它极高的灵活性,可以为特定的应用或算法定制硬件设计以优化其性能,因此针对fpga的spmv加速优化逐渐吸引了研究人员的目光。

2、由于spmv是访存密集型计算,因此现有基于fpga的sp本文档来自技高网...

【技术保护点】

1.面向CPU-FPGA异构架构的精度感知的SpMV任务划分与调度方法,其特征在于,包括以下步骤:

2.根据权利要求1所述面向CPU-FPGA异构架构的精度感知的SpMV任务划分与调度方法,其特征在于,进行多精度无损划分的方法包括:根据所述初始稀疏矩阵的矩阵非零元的值将矩阵划分成若干所述子矩阵,所述子矩阵包括:半精度子矩阵、单精度子矩阵和双精度子矩阵。

3.根据权利要求1所述面向CPU-FPGA异构架构的精度感知的SpMV任务划分与调度方法,其特征在于,所述子任务包括:半精度子任务、单精度子任务和双精度子任务;

4.根据权利要求3所述面向CPU-FPG...

【技术特征摘要】

1.面向cpu-fpga异构架构的精度感知的spmv任务划分与调度方法,其特征在于,包括以下步骤:

2.根据权利要求1所述面向cpu-fpga异构架构的精度感知的spmv任务划分与调度方法,其特征在于,进行多精度无损划分的方法包括:根据所述初始稀疏矩阵的矩阵非零元的值将矩阵划分成若干所述子矩阵,所述子矩阵包括:半精度子矩阵、单精度子矩阵和双精度子矩阵。

3.根据权利要求1所述面向cpu-fpga异构架构的精度感知的spmv任务划分与调度方法,其特征在于,所述子任务包括:半精度子任务、单精度子任务和双精度子任务;

【专利技术属性】
技术研发人员:计卫星高建花周智黄兴泽石剑君
申请(专利权)人:北京师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1