多处理器系统的三角线性方程组求解的方法和装置制造方法及图纸

技术编号：4317531 阅读：291 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供了一种多处理器系统的三角线性方程组求解的方法和装置。其中该多处理器系统包括至少一个核心处理器以及多个加速器。该方法包括：按照预定的子矩阵大小，将要进行三角线性方程组求解的矩阵划分为多个子矩阵；迭代地对该多个子矩阵进行计算更新；其中，在每一次迭代中包括：从该多个子矩阵中还未进行计算更新的子矩阵开始，按照行方向并且按照为上述多个加速器预先确定的先后顺序，向该多个加速器各分配一个子矩阵；使该多个加速器并行地对各自的子矩阵进行计算更新。本发明专利技术通过逐个子矩阵地分配要进行求解的矩阵，能够使多个加速器的负载达到平衡，从而充分利用这多个加速器的计算能力来达到计算更新的峰值性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据处理领域，具体地，涉及多处理器系统的三角线性方程组求解的方法和装置。LAPACK (Linear Algebra PACKage，线性代数包)是Oak Ridge国家实验室、加州大学Davis分校和Illinois大学等联合开发的非常有效、强大且广泛使用的线性代数函数库，用于在不同高性能计算环境上高效求解数值线性代数问题，其已经有效地为HPC( High Performance Computing, 高性能计算)和计算科学组织工作了 20多年的时间。关于LAPACK的详细内容，可参见http:〃netlib.amss.ac.cn/lapack/index.html0作为专业的线性代数库，LAPACK提供了各种线性代数的子程序，其中包括按照下述矩阵方程(l)、 (2)、 (3)或(4)进行三角线性方程组求解的例程(LAPACK代数库中，该三角线性方程组求解的函数名为TRSM):其中，alpha是标量；X和B是mXn矩阵；A是单位或非单位的上三角或下三角矩阵。图l是以A是下三角矩阵、alpha=l,即上述矩阵方程(l)成为A*X=B 的情况为例对TRSM函数的三角线性方程组求解的含义的图示说明。从图1可以看出，按照上述矩阵方程(1)或(2)使用TRSM函数进行三皆景技术A*X=alpha*B X* A=alpha*B AT*X=alpha*B X* AT=alpha*B(1)(2)(3)(4)角线性方程组求解的例程，对于给定的m x n矩阵B,在给定的标量alpha 以及单位或非单位的上三角或下三角矩阵A下，求解出mxn...

【技术保护点】
一种多处理器系统的三角线性方程组求解的方法，其中该多处理器系统包括至少一个核心处理器以及多个加速器（ａｃｃｅｌｅｒａｔｏｒ），该方法包括：　　　　按照预定的子矩阵大小，将要进行三角线性方程组求解的矩阵划分为多个子矩阵；以及　　　　迭代地对上述多个子矩阵进行计算更新；　　　　其中，在每一次迭代中包括：　　　　从上述多个子矩阵中还未进行计算更新的子矩阵开始，按照行方向并且按照为上述多个加速器预先确定的先后顺序，向该多个加速器各分配一个子矩阵；以及　　　　使上述多个加速器并行地对各自的子矩阵进行计算更新。

【技术特征摘要】

【专利技术属性】
技术研发人员：魏琼，彭红波，刘航，王佰玲，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人