The invention discloses a KNL cluster to accelerate the solving device, including: read a symmetric positive definite linear equations coefficient matrix and constant, and set the requirements of the initial solution and the solution precision; using MPI control of the KNL kernel is the main body of the program calculation, construct approximate solution; among them, the main body of the program for computing code integrated in the KNL kernel the sparse matrix vector multiplication and vector addition and vector inner product, scalar and vector product; determine the approximate solution meets the precision requirements; if the output of the approximate solution; the method of the conjugate gradient algorithm is transplanted to the KNL cluster platform to improve the utilization of hardware resources, shorten the solving large-scale symmetrical linear equations of the time, but also reduces the energy consumption, reduce room management, operation and maintenance costs, and the acceleration method is simple and easy to implement, The invention discloses a KNL cluster acceleration solving device, which has the beneficial effect.
【技术实现步骤摘要】
本专利技术涉及计算机
,特别涉及一种KNL集群加速求解方法及装置。
技术介绍
数学物理模型的求解是众多工程生产与科研领域必不可少的工作之一。随着计算机的发展,有限差分、有限元、边界元、无网格方法等一系列的数值计算方法相继诞生。这些数值计算方法具有一个相同之处:将实际问题导出的数学物理模型通过特定的方式离散成一个线性代数方程组。运用有限元方法离散得到的线性方程组往往是对称正定的或经过简单的处理可变成对称正定问题。然而,随着问题规模的增大,线性方程组的求解成为工程生产和科研中的一大瓶颈。因此,如何提高缩短了求解大规模对称正定线性方程组的时间,而且降低了能耗,减少了机房管理、运维的成本,是本领域技术人员需要解决的技术问题。
技术实现思路
本专利技术的目的是提供一种KNL集群加速求解方法及装置,将共轭梯度算法移植到了KNL集群平台上,提高硬件资源的利用率,从而缩短了求解大规模对称正定线性方程组的时间,降低了能耗,降低开发成本。为解决上述技术问题,本专利技术提供一种KNL集群加速求解方法,包括:读取对称正定线性方程组的系数矩阵及常数项,并设定初始解及求解精度要求;利用MPI控制各KNL内核进行程序主体计算,构造近似解;其中,程序主体为集成在KNL内核中的大规模稀疏矩阵向量相乘、向量加法、向量内积、标量与向量乘积的运算代码段;判断所述近似解是否满足所述求解精度要求;若是,则输出满足所述求解精度要求的近似解。可选的,利用MPI控制各KNL内核进行程序主体计算,构造近似解,包括:将所述对称正定线性方程组的求解任务进行划分;根据求解任务的划分个数启动对应数量的进程,并为 ...
【技术保护点】
一种KNL集群加速求解方法,其特征在于,包括:读取对称正定线性方程组的系数矩阵及常数项,并设定初始解及求解精度要求;利用MPI控制各KNL内核进行程序主体计算,构造近似解;其中,程序主体为集成在KNL内核中的大规模稀疏矩阵向量相乘、向量加法、向量内积、标量与向量乘积的运算代码段;判断所述近似解是否满足所述求解精度要求;若是,则输出满足所述求解精度要求的近似解。
【技术特征摘要】
1.一种KNL集群加速求解方法,其特征在于,包括:读取对称正定线性方程组的系数矩阵及常数项,并设定初始解及求解精度要求;利用MPI控制各KNL内核进行程序主体计算,构造近似解;其中,程序主体为集成在KNL内核中的大规模稀疏矩阵向量相乘、向量加法、向量内积、标量与向量乘积的运算代码段;判断所述近似解是否满足所述求解精度要求;若是,则输出满足所述求解精度要求的近似解。2.根据权利要求1所述的KNL集群加速求解方法,其特征在于,利用MPI控制各KNL内核进行程序主体计算,构造近似解,包括:将所述对称正定线性方程组的求解任务进行划分;根据求解任务的划分个数启动对应数量的进程,并为每个进程设置私有存储空间;MPI主进程读取预定数据,并将所述预定数据发送给全部进程;其中,所述预定数据包括所述系数矩阵、所述常数项及所述初始解;所述MPI主进程接收全部进程根据所述预定数据进行计算后的结果,并对全部结果进行处理,得到近似解。3.根据权利要求2所述的KNL集群加速求解方法,其特征在于,将所述对称正定线性方程组的求解任务进行划分,包括:采用静态划分方式,按行划分将对称正定线性方程组的系数矩阵按行划分成N_p块;其中,N_p=Nnode*Ngrp;其中,Nnode为KNL集群中计算节点个数,Ngrp为每个计算节点内将处理核心划分成Ngrp个组。4.根据权利要求3所述的KNL集群加速求解方法,其特征在于,KNL内核进行程序主体计算,包括:所述KNL内核组开启4*Nknlcore个OpenMP线程进行程序主体计算。5.根据权利要求4所述的KNL集群加速求解方法,其特征在于,KNL内核进行程序主体计算,包括:将所述程序主体中内存读写受限的数据或数组开辟到MCDRAM高带宽内存。6.一种KNL集群加速求解装置,其特征在于,包括:读取模块,...
【专利技术属性】
技术研发人员:王明清,张清,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。