一种稀疏矩阵向量乘法的异构并行计算方法技术

技术编号：12344200 阅读：132 留言：0更新日期：2015-11-18 17:24

本发明专利技术公开了一种稀疏矩阵向量乘法的异构并行计算方法，包括以下步骤：CPU读取存储于硬盘上的稀疏矩阵，确定稀疏矩阵可调参数K，并根据稀疏矩阵的可调参数K申请内存存储空间，包括ELL存储结构和CSR存储结构需要的存储空间；同时也申请ELL存储结构需要的GPU存储空间；将矩阵数据填充在CPU所申请的内存存储空间中生成混合存储结构；把内存中ELL存储结构中存储的数据复制到GPU存储空间中进行存储；最后，使用处理完成的存储结构进行稀疏矩阵向量乘法。本发明专利技术的计算方法可以使计算机在进行稀疏矩阵向量乘法计算任务时，同时利用CPU和GPU的计算能力，使CPU和GPU可以各自发挥最优的计算特性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种数据存储方法，特别涉及一种稀疏矩阵向量乘法的异构并行计算方法。技术背景疏矩阵向量乘法（Sparse Matrix-Vector Multiplication，简称 SpMV)是科学计算和工程应用中最常用的计算之一。在很多数据挖掘应用中，经常会遇到数据极度稀疏的情况，这种类型的数据通常表示为稀疏矩阵。在数据规模非常大的时候，利用目前流行的 CPU-GPU异构计算平台来实现SpMV异构并行计算是非常必要的。 -般而言，在异构平台上进行SpMV计算，有以下两种计算模式：第一种模式是CPU/GPU协同计算，CPU把数据处理好，让后把数据发送给GPU计算， GHJ计算完成之后把数据传输回CPU。整个过程虽然说是并行，实际上CPU和GPU的工作却是串行的，在GPU进行计算时，CPU空置，把CPU的计算能力浪费掉了。第二种模式是CPU/GPU共同计算，CPU把数据处理好后，进行任务划分，把一部分数据传输到GPU上，之后与GPU共同完成所有的计算任务。这种模式相比前一种模式，在 GHJ计算的同时利用到了 CPU的计算能力。即便如此，这种模式仍然有所不足，它把CPU和 GPU作为对等的计算节点，分配相似的计算任务，这忽视了 CPU和GPU体系结构上的差异，将导致CPU和GPU都不能达到最高性能。在稀疏矩阵向量乘法中，稀疏矩阵存储是一个关键问题，直接影响计算性能。目前来看，主流的稀疏矩阵存储形式有：坐标格式（Coordinate Format，简称C00)，稀疏行压缩格式（Compressed Sparse Row Fo...

【技术保护点】
一种稀疏矩阵向量乘法的异构并行计算方法，其特征在于，包括以下步骤：S1、确定稀疏矩阵的可调参数K的取值；S2、CPU读取存储于硬盘上的稀疏矩阵数据，并根据稀疏矩阵的可调参数K申请内存存储空间，所述内存存储空间包括ELL存储结构和CSR存储结构需要的存储空间；同时也申请ELL存储结构需要的GPU存储空间；S3、将稀疏矩阵数据进行压缩后存储在CPU所申请的内存存储空间中生成混合存储结构；S4、把ELL存储结构中存储的数据复制到GPU存储空间中进行存储；S5、使用处理完成的存储结构进行稀疏矩阵向量乘法，CPU计算CSR存储结构对应运算，GPU计算ELL存储结构对应运算，CPU和GPU处理结果相加得到最终结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：董守斌，张铃启，陈泽邦，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人