【技术实现步骤摘要】
本专利技术涉及计算机信息,尤其涉及一种gpu稀疏矩阵向量乘的快速求解方法及装置。
技术介绍
1、spmv(稀疏矩阵向量乘法)在当今的科学计算和大数据分析领域中有着重要的作用,稀疏线性方程组的迭代法求解过程中会使用到大量的spmv计算,这一部分的计算开销在全部求解过程中占据较大的比重,因此对于spmv的计算优化一直是科学计算领域中研究的重点。
2、近年来,gpu平台的发展让更多的研究者致力于将一些简单计算任务使用gpgpu(通用图形处理器)进行解决。许多gpu的spmv计算方法已经被提出来,主要的优化方法从两个方面来设计。第一类优化方法是基于原始的csr存储格式,通过改变计算方法来做到负载均衡;第二类优化方法是改变数据的存储格式,将csr格式的压缩数据格式重新设计。
3、第一类优化方法的固定任务切分策略使其不能在不同硬件架构的gpu上发挥出最佳的计算性能,第二类的优化方法由于独特的存储结构设计会产生预处理与存储格式转换的额外开销,降低计算效率。
技术实现思路
1、本专
...【技术保护点】
1.一种GPU稀疏矩阵向量乘的快速求解方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述预先构建的自动调优模型的构建过程包括:
3.根据权利要求1所述的方法,其特征在于,所述基于所述最佳分块数量列向均匀切分CSR格式下的所述稀疏矩阵数据,得到对应的数据块,包括:
4.根据权利要求1所述的方法,其特征在于,所述利用数据重排方法基于所述最佳分块数量对所述数据块进行重排,包括:
5.根据权利要求1至4任一项所述的方法,其特征在于,所述基于所述GPU平台对重排后的所述数据块进行并行计算,并存储计算结果,包括
6....
【技术特征摘要】
1.一种gpu稀疏矩阵向量乘的快速求解方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述预先构建的自动调优模型的构建过程包括:
3.根据权利要求1所述的方法,其特征在于,所述基于所述最佳分块数量列向均匀切分csr格式下的所述稀疏矩阵数据,得到对应的数据块,包括:
4.根据权利要求1所述的方法,其特征在于,所述利用数据重排方法基于所述最佳分块数量对所述数据块进行重排,包括:
5.根据权利要求1至4任一项所述的方法,其特征在于,所述基于所述gpu平台对重排后的所述数据块进行并行计算,并存储计算结果,包括:
6.根据权利要求5所述的方法,其特征在于,所述预设辅助数组包括开始行数组、结束行数组...
【专利技术属性】
技术研发人员:黄建强,姜佳凡,张国晶,边浩东,曹腾飞,贾金芳,吴利,
申请(专利权)人:青海大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。