【技术实现步骤摘要】
一种直接求解结构化三角稀疏线性方程组的并行计算方法
[0001]本专利技术涉及异构多核平台通信优化及高性能数值计算领域,特别是指一种直接求解结构化三角稀疏线性方程组的并行计算方法。
技术介绍
[0002]近年来,结构化网格问题已广泛应用于许多科学领域,包括全球预报系统、海洋模拟、大气模拟、辐射传播、电磁学,以及重要的高性能几何多重网格(HPGMG)基准中。这类问题通常被表述为在代表表面或空间的结构化网格上的偏微分方程组的离散化。求解这些实际应用的方程组最核心的步骤包括求解其生成的稀疏矩阵线性方程组。
[0003]主要有直接法和迭代法两种方法求解稀疏矩阵线性方程组;其中,稀疏三角求解(Sparse Triangular Solver)在每种方法中都起着重要的作用。因此,对于结构化网格问题,设计并实现一种高效的并行结构化稀疏三角求解(Structured Sparse Triangular Solver)方法是非常迫切的。比如在迭代法中,在结构化不完全LU分解(Incomplete LU Factorization)后要 ...
【技术保护点】
【技术特征摘要】
1.一种直接求解结构化三角稀疏线性方程组的并行计算方法,其特征在于,包括:输入结构化线性方程组的求解问题规模大小和网格计算模板,接收求解矩阵和右端向量,自动匹配上三角或者下三角求解程序,自适应选择求解映射方案,开启多核并行处理;按照选择的求解映射方案,将求解矩阵和右端向量分为多个批次映射到从核阵列;其中,每个从核的计算任务也分批次计算,每批次内计算所依赖的求解矩阵和右端向量分多次以粗粒度直接内存访问方式预取,将对应的求解向量分多次通过直接粗粒度内存访问方式写回实现计算访存重叠;基于每个从核的计算任务,即求解向量X[0:Q
‑
1]的计算,在本从核的局部存储空间中开辟空间来存储该求解向量计算所依赖的数据,即:左邻居和上邻居从核计算完成的求解向量X,其中,获取依赖数据的方式为粗粒度直接内存访问或者细粒度快速通信,Q表示每个从核计算的任务数量;基于所述分批次计算,按批次将求解矩阵和右端向量映射到从核阵列进行计算,每一批次的从核阵列求解向量的每个求解数据按照流水线的方式获取依赖数据逐个进行计算并在计算完成后发送计算结果完成通信步骤,直至整个结构化线性方程组问题被完全正确的求解。2.根据权利要求1所述的直接求解结构化三角稀疏线性方程组的并行计算方法,其特征在于,开启多核并行处理后,核组内所有从核全部启动,每个从核拥有自己的从核资源,互不干扰,从第一批次的首号从核开始计算和发送数据,到最后一批次的某从核接收数据并完成计算实现整个结构化线性方程组的求解。3.根据权利要求1所述的直接求解结构化三角稀疏线性方程组的并行计算方法,其特征在于,所述自适应选择求解映射方案包括:根据网格计算模板确定的依赖关系自适应选择求解性能最强的映射方案进行通信和计算,其中,当选择交叉映射方案时,从核阵列和网格位置是一一对应的关系,全部从核资源均有通信和计算要求;当选择平行四边形映射方案时,从核阵列映射到的网格位置逐个向上偏移,为了保证收发数据正常,有从核接收到不满足求解规模尺寸内的数据,并转发给邻居从核,无需计算。4.根据权利要求1所述的直接求解结构化三角稀疏线性方程组的并行计算方法,其特征在于,所述计算访存重叠是由每个从核每批次内计算所依赖的求解矩阵LA和右端向量XB分多次通过直接粗粒度内存访问方式预取,将对应的求解向量计算完成后分多次通过直接粗粒度内存访问方式写回,每次求解的数据量为LB,由于求解向量的每个求解数据依赖的非零元个数为n,需要获取LA的数量为LB*n,求解向量X写回的数量为LB,即在第一次计算前读入第一次计算所需的求解矩阵数据LA[0:LB
‑
1][0:n
‑
1]和右端向量XB[0:LB
‑
1],然后进行第一次计算,同时读入第二次计算所需的求解矩阵数据LA[LB:2*LB
‑
1][0:n
‑
1]和右端向量XB[LB:2*LB
‑
1],然后进行第二次计算,同时写回第一次计算结果X[0:LB
‑
1]并且读入第三次计算所需的求解矩阵数据,实现计算访存重叠;从第一批次开始计算,前无依赖,无需通过通信或者内存访问获取依赖数据,只须将依赖位置数据设置为零,从第二批次计算开始,在阵列边界位置的从核需要利用前面批次的
计算结果作为当前批次的依赖数据,需要通过粗粒度直接内存访问方式获取依赖数据进行计算,并将计算结果以细粒度通信方式继续传递给相邻从核,并将每一批次的从核的计算结果写回内存;在上一批次末行计算的过程中向下一批次首行进行细粒度快速通信传输数据,提早在下一批次计算前开启数据传输。5.根据权利要求1所述的直接求解结构化三角稀疏线性方程组的并行计算方法,其特征在于,根据本从核所处从核阵列的位置,采取粗粒度直接内存访问或者细粒度快速通信获取依赖数据;其中,若本从核在从核阵列的非边界位置计算,通过细粒度快速通信方式获取左邻居和上邻居从核计算完成的求解向量X;若本从核在从核阵列的边界位置计算,通过粗...
【专利技术属性】
技术研发人员:李建江,梁佳碧,薛巍,胡正丁,李琳,石金梁,
申请(专利权)人:清华大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。