当前位置: 首页 > 专利查询>青海大学专利>正文

GPU稀疏矩阵向量乘的快速求解方法及装置制造方法及图纸

技术编号:41946129 阅读:32 留言:0更新日期:2024-07-10 16:35
本发明专利技术涉及计算机信息技术领域,尤其涉及一种GPU稀疏矩阵向量乘的快速求解方法及装置。方法包括:提取待求解的稀疏矩阵数据的数据特征,并获取对应的GPU平台的硬件参数特征;根据数据特征和硬件参数特征基于预先构建的自动调优模型确定稀疏矩阵数据的最佳分块数量;基于最佳分块数量列向均匀切分CSR格式下的稀疏矩阵数据,得到对应的数据块;利用数据重排方法基于最佳分块数量对数据块进行重排;基于GPU平台对重排后的数据块进行并行计算,并存储计算结果。本发明专利技术可以充分的保证各个计算资源的任务量一致,使其能在不同硬件架构的GPU上发挥出最佳的计算性能;并且极大的减少了GPU线程访问数据的开销。

【技术实现步骤摘要】

本专利技术涉及计算机信息,尤其涉及一种gpu稀疏矩阵向量乘的快速求解方法及装置。


技术介绍

1、spmv(稀疏矩阵向量乘法)在当今的科学计算和大数据分析领域中有着重要的作用,稀疏线性方程组的迭代法求解过程中会使用到大量的spmv计算,这一部分的计算开销在全部求解过程中占据较大的比重,因此对于spmv的计算优化一直是科学计算领域中研究的重点。

2、近年来,gpu平台的发展让更多的研究者致力于将一些简单计算任务使用gpgpu(通用图形处理器)进行解决。许多gpu的spmv计算方法已经被提出来,主要的优化方法从两个方面来设计。第一类优化方法是基于原始的csr存储格式,通过改变计算方法来做到负载均衡;第二类优化方法是改变数据的存储格式,将csr格式的压缩数据格式重新设计。

3、第一类优化方法的固定任务切分策略使其不能在不同硬件架构的gpu上发挥出最佳的计算性能,第二类的优化方法由于独特的存储结构设计会产生预处理与存储格式转换的额外开销,降低计算效率。


技术实现思路

1、本专利技术所要解决的技术本文档来自技高网...

【技术保护点】

1.一种GPU稀疏矩阵向量乘的快速求解方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述预先构建的自动调优模型的构建过程包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述最佳分块数量列向均匀切分CSR格式下的所述稀疏矩阵数据,得到对应的数据块,包括:

4.根据权利要求1所述的方法,其特征在于,所述利用数据重排方法基于所述最佳分块数量对所述数据块进行重排,包括:

5.根据权利要求1至4任一项所述的方法,其特征在于,所述基于所述GPU平台对重排后的所述数据块进行并行计算,并存储计算结果,包括

6....

【技术特征摘要】

1.一种gpu稀疏矩阵向量乘的快速求解方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述预先构建的自动调优模型的构建过程包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述最佳分块数量列向均匀切分csr格式下的所述稀疏矩阵数据,得到对应的数据块,包括:

4.根据权利要求1所述的方法,其特征在于,所述利用数据重排方法基于所述最佳分块数量对所述数据块进行重排,包括:

5.根据权利要求1至4任一项所述的方法,其特征在于,所述基于所述gpu平台对重排后的所述数据块进行并行计算,并存储计算结果,包括:

6.根据权利要求5所述的方法,其特征在于,所述预设辅助数组包括开始行数组、结束行数组...

【专利技术属性】
技术研发人员:黄建强姜佳凡张国晶边浩东曹腾飞贾金芳吴利
申请(专利权)人:青海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1