基于神威架构的PIPE-BiCGStab求解器加速优化方法及系统技术方案

技术编号:41705442 阅读:18 留言:0更新日期:2024-06-19 12:37
本公开提供了基于神威架构的PIPE‑BiCGStab求解器加速优化方法及系统,涉及求解器加速优化技术领域,包括:定位搜索PETSc库热点函数,构建众核加速模型;利用所述众核加速模型对PETSc库热点函数实现PIPE‑BiCGStab求解器加速并行计算;其中,主核初始化,读入PETSc库热点函数,对PETSc库热点函数增加线程级并行计算,利用余数法,将其作为计算任务平均分配给每个核组内的从核;对从核内存访问方式进行优化,以及对数据传输方式进行优化,并使用向量化操作对矩阵和向量计算进行加速,完成并行加速计算过程。

【技术实现步骤摘要】

本公开涉及求解器加速优化,具体涉及基于神威架构的pipe-bicgstab求解器加速优化方法及系统。


技术介绍

1、本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,不必然构成在先技术。

2、流水线双共轭梯度法(pipe-bicgstab)是解决大规模稀疏线性方程组的一种高效方法。该算法结合了双共轭梯度法(bicgstab)和流水线化技术,在高性能计算环境下显著提高了求解效率。传统的迭代求解方法在处理低频误差时收敛速度较慢,而pipe-bicgstab算法通过流水线化的方式,实现了计算和通信操作的重叠执行,从而最大限度地降低了通信开销,并提高了整体计算效率。

3、作为替代传统krylov子空间方法的高性能计算方法,对于大型稀疏线性系统,流水线krylov子空间方法在强可扩展性方面比标准krylov子空间方法具有更好的可扩展性。该算法通过将耗时的全局通信阶段与局部计算重叠来缓解典型的同步瓶颈。

4、原生的petsc使用底层的mpi库实现其进程级并行,缺少对于神威架构的线程级并行,新一代神威超级计算机基于申威新一代高性能异本文档来自技高网...

【技术保护点】

1.基于神威架构PETSc库的PIPE-BiCGStab求解器加速优化方法,其特征在于,包括:

2.如权利要求1所述的基于神威架构PETSc库的PIPE-BiCGStab求解器加速优化方法,其特征在于,定位搜索PETSc库热点函数包括:对PETSc数学库源代码进行剖分,通过对PETSc库的测试找到其底层最耗时且频繁使用的函数,这些函数作为PETSc库热点函数。

3.如权利要求1所述的基于神威架构PETSc库的PIPE-BiCGStab求解器加速优化方法,其特征在于,PIPE-BiCGStab求解器中,将在PIPE-BiCGStab求解器中计算的数据划分为进程级和线...

【技术特征摘要】

1.基于神威架构petsc库的pipe-bicgstab求解器加速优化方法,其特征在于,包括:

2.如权利要求1所述的基于神威架构petsc库的pipe-bicgstab求解器加速优化方法,其特征在于,定位搜索petsc库热点函数包括:对petsc数学库源代码进行剖分,通过对petsc库的测试找到其底层最耗时且频繁使用的函数,这些函数作为petsc库热点函数。

3.如权利要求1所述的基于神威架构petsc库的pipe-bicgstab求解器加速优化方法,其特征在于,pipe-bicgstab求解器中,将在pipe-bicgstab求解器中计算的数据划分为进程级和线程级,所述进程级为原生的petsc库使用底层的mpi库实现其进程级并行,使用petsc库中distributed matrix和distributed vector数据结构将向量和矩阵划分到各个进程,这些数据结构将矩阵和向量分割成多个块,每个块存储在不同的进程上。

4.如权利要求3所述的基于神威架构petsc库的pipe-bicgstab求解器加速优化方法,其特征在于,对petsc库热点函数增加线程级并行计算,使用余数法将计算任务平均分配给从核,若余数等于从核id,则此处的计算任务给予该从核进行,每个从核的计算任务独立不存在数据依赖,从而进行整体的并行计算步骤。

5.如权利要求1所述的基于神威架构petsc库的pipe-bicgstab求解器加速优化方法,其特征在于,每个从核都配备高速本地数据存储空间块ldm,使用从核静态数组预分配方式,根据函数中变量的数量,在从核ldm...

【专利技术属性】
技术研发人员:潘景山王新华田敏杜伟肖磊徐朝帅
申请(专利权)人:山东省计算中心国家超级计算济南中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1