【技术实现步骤摘要】
本专利技术属于等几何分析相关,更具体地,涉及一种面向iga的多gpu/cpu并行求解方法及设备。
技术介绍
1、目前常用的工业软件中,结构拓扑优化是依靠有限元分析来实现的。然而,由于有限元分析网格只是对几何模型的近似表示,导致在cae(computer aided engineering,cae)和cad(computer aided design,cad)模型之间存在耗时且繁琐的转换过程,无法实现建模、分析和拓扑优化的闭环。同时,在有限元分析(finite element analysis,fea)中,相邻单元之间的连续性较低,严重限制了结构响应分析的精度。为了提高分析精度,不断细分网格又会带来计算成本的增加。为了解决上述问题并实现cad/cae模型的一体化,等几何分析(isogeometric analysis,iga)近年来受到广泛关注和快速发展,通过使用nurbs样条曲线将几何信息直接用于数值分析,完美地解决了上述有限元分析的缺点。凭借其高精度和高效率的优势,等几何分析在拓扑优化中得到了广泛应用。
2、尽管iga方法
...【技术保护点】
1.一种面向IGA的多GPU/CPU并行求解方法,其特征在于,该方法包括以下步骤:
2.如权利要求1所述的面向IGA的多GPU/CPU并行求解方法,其特征在于:首先得到待求解的IGA刚度矩阵数据规模,然后得到本地的GPU/CPU设备数量以及对应的设备性能参数,之后选择最佳计算设备数量来构建多设备并行架构。
3.如权利要求2所述的面向IGA的多GPU/CPU并行求解方法,其特征在于:所设计的并行架构利用OpenMP并行规范实现外部任务级并行方案,利用CUDA通用并行编程模型实现各GPU的内部数据级别并行。
4.如权利要求2所述的面向I
...【技术特征摘要】
1.一种面向iga的多gpu/cpu并行求解方法,其特征在于,该方法包括以下步骤:
2.如权利要求1所述的面向iga的多gpu/cpu并行求解方法,其特征在于:首先得到待求解的iga刚度矩阵数据规模,然后得到本地的gpu/cpu设备数量以及对应的设备性能参数,之后选择最佳计算设备数量来构建多设备并行架构。
3.如权利要求2所述的面向iga的多gpu/cpu并行求解方法,其特征在于:所设计的并行架构利用openmp并行规范实现外部任务级并行方案,利用cuda通用并行编程模型实现各gpu的内部数据级别并行。
4.如权利要求2所述的面向iga的多gpu/cpu并行求解方法,其特征在于:用吞吐量gflop来近似表示第i个计算设备的计算能力,按照各设备的gflop大小分配计算负载;构建并行架构所需的性能参数有:cpu吞吐量、内存容量、拥有的内核数量、逻辑处理器数量、pcie总线带宽、gpu型号、吞吐量和显存容量。
5.如权利要求1所述的面向iga的多gpu/cpu并行求解方法,其特征在于:构建多设备并行架构的流程为:
6.如权利要求1所述的面向iga的多gpu/...
【专利技术属性】
技术研发人员:夏兆辉,韩锦鹏,刘健力,范洪硕,聂涛,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。