CPU与GPU异构并行的自动多重子结构数据处理方法技术

技术编号:40004225 阅读:32 留言:0更新日期:2024-01-09 04:33
本发明专利技术公开一种CPU与GPU异构并行的自动多重子结构数据处理方法,包括分界线划分与CPU子树并行,基于CPU+GPU的节点混合并行计算,基于GPU的降维特征值问题并行计算,回代转换的并行策略。本发明专利技术根据稀疏矩阵重排序算法形成的子结构消去树节点分布特征和CPU线程数量确定消去树的分解线,界限之上的节点采用多节点CPU与GPU混合并行的计算模式,尽可能保证计算资源的有效利用;界限之下使用CPU多核并行计算独立的子树任务,并为此设计一种减少数据同步的并行策略。

【技术实现步骤摘要】

本专利技术涉及工程中的高性能数值计算,具体涉及一种cpu与gpu异构并行的自动多重子结构数据处理方法。


技术介绍

1、自动多重子结构方法在诸如结构动力学分析、结构优化设计、振动控制、电磁学、流固耦合问题等工程领域中具有广泛的应用,能够提供高效、准确的动力学分析与优化设计的解决方案。以结构仿真分析为例,随着工业水平的发展,有限元仿真计算规模逐步增大,自动多重子结构方法已经成为计算模型本征模态的首要选择,通常占据模态求解时间的一半以上,直接决定了整个仿真分析的计算效率。随着计算机技术的不断发展,利用gpu( graphics processing unit,图形处理器)大规模并行计算能力提高计算速度已成为高性能数值计算的一种高效选择。目前,自动多重子结构方法主要在共享内存环境下利用cpu多核并行计算来提高计算效率,这在一定程度上闲置了gpu的计算资源。

2、现在与本专利技术较为接近的slepc稀疏特征方程求解器,包含了多种类型方程的求解算法,但是对线性广义特征方程求解并没有提供自动多重子结构求解算法。使用slepc默认的krylov子空间算法求解有本文档来自技高网...

【技术保护点】

1.一种CPU与GPU异构并行的自动多重子结构数据处理方法,其特征在于,包括:

2.根据权利要求1所述的CPU与GPU异构并行的自动多重子结构数据处理方法,其特征在于,步骤一中,通过下式确定子树并行与节点并行的分界层级;

3.根据权利要求1所述的CPU与GPU异构并行的自动多重子结构数据处理方法,其特征在于,步骤一中,在子结构矩阵转换过程中,所有约束矩阵的求解以及当前节点与祖先节点的连接矩阵的乘法运算均只计算拥有非零元的行列,并将对所有祖先节点的矩阵更新数据都暂存在当前孩子节点对象中,消除不同线程同时对同一节点的数据更新的竞争问题;对于叶子节点的刚度矩阵与质量矩阵...

【技术特征摘要】

1.一种cpu与gpu异构并行的自动多重子结构数据处理方法,其特征在于,包括:

2.根据权利要求1所述的cpu与gpu异构并行的自动多重子结构数据处理方法,其特征在于,步骤一中,通过下式确定子树并行与节点并行的分界层级;

3.根据权利要求1所述的cpu与gpu异构并行的自动多重子结构数据处理方法,其特征在于,步骤一中,在子结构矩阵转换过程中,所有约束矩阵的求解以及当前节点与祖先节点的连接矩阵的乘法运算均只计算拥有非零元的行列,并将对所有祖先节点的矩阵更新数据都暂存在当前孩子节点对象中,消除不同线程同时对同一节点的数据更新的竞争问题;对于叶子节点的刚度矩阵与质量矩阵计算,采取csr稀疏矩阵格式存储与计算。

4.根据权利要...

【专利技术属性】
技术研发人员:王桂冬
申请(专利权)人:湖南迈曦软件有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1