【技术实现步骤摘要】
本专利技术属于嵌入式,具体涉及面向cpu-fpga异构架构的精度感知的spmv任务划分与调度方法及系统。
技术介绍
1、在科学计算与工程应用领域,计算电磁学、计算流体力学以及空气动力学等工程问题的求解可以转化为大规模稀疏线性方程组的求解问题。稀疏矩阵向量乘(spmv)是稀疏线性方程组求解过程中的关键计算内核之一,也是其主要的性能瓶颈,因此spmv在通用多核处理器(cpu)和通用图形处理器(gpgpu)上的性能优化受到了研究人员的广泛关注。已有工作从新型稀疏矩阵存储格式设计,spmv计算访存优化、任务划分与负载均衡等多方面提升了spmv在cpu和gpu上的计算效率。考虑到物理空间大小和系统功耗预算等多种约束,实际工程设计和实现中存在大量基于fpga的spmv计算需求。与cpu和gpu相比,fpga可定制、易于集成,拥有丰富的计算和存储资源,且fpga的可编程性赋予它极高的灵活性,可以为特定的应用或算法定制硬件设计以优化其性能,因此针对fpga的spmv加速优化逐渐吸引了研究人员的目光。
2、由于spmv是访存密集型计算,因此现
...【技术保护点】
1.面向CPU-FPGA异构架构的精度感知的SpMV任务划分与调度方法,其特征在于,包括以下步骤:
2.根据权利要求1所述面向CPU-FPGA异构架构的精度感知的SpMV任务划分与调度方法,其特征在于,进行多精度无损划分的方法包括:根据所述初始稀疏矩阵的矩阵非零元的值将矩阵划分成若干所述子矩阵,所述子矩阵包括:半精度子矩阵、单精度子矩阵和双精度子矩阵。
3.根据权利要求1所述面向CPU-FPGA异构架构的精度感知的SpMV任务划分与调度方法,其特征在于,所述子任务包括:半精度子任务、单精度子任务和双精度子任务;
4.根据权利要求3所
...【技术特征摘要】
1.面向cpu-fpga异构架构的精度感知的spmv任务划分与调度方法,其特征在于,包括以下步骤:
2.根据权利要求1所述面向cpu-fpga异构架构的精度感知的spmv任务划分与调度方法,其特征在于,进行多精度无损划分的方法包括:根据所述初始稀疏矩阵的矩阵非零元的值将矩阵划分成若干所述子矩阵,所述子矩阵包括:半精度子矩阵、单精度子矩阵和双精度子矩阵。
3.根据权利要求1所述面向cpu-fpga异构架构的精度感知的spmv任务划分与调度方法,其特征在于,所述子任务包括:半精度子任务、单精度子任务和双精度子任务;
【专利技术属性】
技术研发人员:计卫星,高建花,周智,黄兴泽,石剑君,
申请(专利权)人:北京师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。