一种面向IGA的多GPU/CPU并行求解方法及设备技术

技术编号：40547564 阅读：19 留言：0更新日期：2024-03-05 19:05

本发明专利技术属于等几何分析相关技术领域，其公开了一种面向IGA的多GPU/CPU并行求解方法及设备，该方法包括以下步骤：(1)根据待求解的IGA刚度矩阵的规模与本地GPU/CPU的数量及计算能力构建多设备并行框架；(2)将IGA刚度矩阵转化为CSR格式或BSR格式，并将刚度矩阵分配给多个计算设备；(3)采用L1范数方法计算每个计算设备的预处理矩阵；(4)确定每次迭代的共轭搜索方向与迭代步长；在SPMV求解前进行不同设备间的数据通信，最终更新本次迭代的解向量，计算每个计算设备上的残差值并在主线程实现多设备结果的合并，重复这个过程直到满足收敛条件，继而完成求解。本发明专利技术极大程度上提升了等几何分析的求解效率与最大可求解规模。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于等几何分析相关，更具体地，涉及一种面向iga的多gpu/cpu并行求解方法及设备。

技术介绍

1、目前常用的工业软件中，结构拓扑优化是依靠有限元分析来实现的。然而，由于有限元分析网格只是对几何模型的近似表示，导致在cae(computer aided engineering，cae)和cad(computer aided design，cad)模型之间存在耗时且繁琐的转换过程，无法实现建模、分析和拓扑优化的闭环。同时，在有限元分析(finite element analysis，fea)中，相邻单元之间的连续性较低，严重限制了结构响应分析的精度。为了提高分析精度，不断细分网格又会带来计算成本的增加。为了解决上述问题并实现cad/cae模型的一体化，等几何分析(isogeometric analysis，iga)近年来受到广泛关注和快速发展，通过使用nurbs样条曲线将几何信息直接用于数值分析，完美地解决了上述有限元分析的缺点。凭借其高精度和高效率的优势，等几何分析在拓扑优化中得到了广泛应用。

2、尽管iga方法...

【技术保护点】

1.一种面向IGA的多GPU/CPU并行求解方法，其特征在于，该方法包括以下步骤：

2.如权利要求1所述的面向IGA的多GPU/CPU并行求解方法，其特征在于：首先得到待求解的IGA刚度矩阵数据规模，然后得到本地的GPU/CPU设备数量以及对应的设备性能参数，之后选择最佳计算设备数量来构建多设备并行架构。

3.如权利要求2所述的面向IGA的多GPU/CPU并行求解方法，其特征在于：所设计的并行架构利用OpenMP并行规范实现外部任务级并行方案，利用CUDA通用并行编程模型实现各GPU的内部数据级别并行。

4.如权利要求2所述的面向IGA的多GPU/CP...

【技术特征摘要】

1.一种面向iga的多gpu/cpu并行求解方法，其特征在于，该方法包括以下步骤：

2.如权利要求1所述的面向iga的多gpu/cpu并行求解方法，其特征在于：首先得到待求解的iga刚度矩阵数据规模，然后得到本地的gpu/cpu设备数量以及对应的设备性能参数，之后选择最佳计算设备数量来构建多设备并行架构。

3.如权利要求2所述的面向iga的多gpu/cpu并行求解方法，其特征在于：所设计的并行架构利用openmp并行规范实现外部任务级并行方案，利用cuda通用并行编程模型实现各gpu的内部数据级别并行。

4.如权利要求2所述的面向iga的多gpu/cpu并行求解方法，其特征在于：用吞吐量gflop来近似表示第i个计算设备的计算能力，按照各设备的gflop大小分配计算负载；构建并行架构所需的性能参数有：cpu吞吐量、内存容量、拥有的内核数量、逻辑处理器数量、pcie总线带宽、gpu型号、吞吐量和显存容量。

5.如权利要求1所述的面向iga的多gpu/cpu并行求解方法，其特征在于：构建多设备并行架构的流程为：

6.如权利要求1所述的面向iga的多gpu/...

【专利技术属性】
技术研发人员：夏兆辉，韩锦鹏，刘健力，范洪硕，聂涛，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人