【技术实现步骤摘要】
一种基于国产加速器的CFD核心算法并行优化方法
[0001]本专利技术属于非结构网格CFD
,具体涉及一种基于国产加速器的CFD核心算法并行优化方法。
技术介绍
[0002]计算流体动力学(Computational Fluid Dynamics,CFD)利用计算机强大算力的同时结合数学中的离散方法,达到求解流体力学中复杂微分方程的目的,在当前的科研和工程领域都发挥了很大的作用。但是当下的CFD软件,不管是商业软件还是开源CFD软件等,多数是基于CPU开发的。随着人们计算的规模和求解的速度不断的扩大,有关CPU的计算、访存和通信的性能已经不能满足需要,因此寻找出新的方法来对大规模的数据进行并行处理已经成为国产CFD软件发展的必然趋势。
[0003]人们为解决复杂的大规模计算找到了一种新的CPU架构即CPU+加速器异构架构,它充分集合了CPU和加速器各自的优势,将能够并行运算的计算密集部分放到加速器上进行计算加速,从而提高了程序的运行速度,这也成为了目前高性能计算的主流方法。需要针对程序中的算法特点设计具有高并行 ...
【技术保护点】
【技术特征摘要】
1.一种基于国产加速器的CFD核心算法并行优化方法,其特征在于包括以下步骤:步骤A,基于自研软件,根据程序特点,找出软件的核心算法;步骤B,对自研软件的核心算法进行GPU上的并行优化,再通过国产加速器自带的转码工具将该算法程序移植到国产加速器上,得到移植后的基础版本计算模块;步骤C,对移植后的基础版本计算模块进行性能测试;步骤D,对基础版本计算模块进行基于国产加速器的核函数合并性能优化;步骤E,对基础版本计算模块进行基于国产加速器的访存合并性能优化;步骤F,对基础版本计算模块进行基于国产加速器的共享内存性能优化;步骤G,对基础版本计算模块进行基于国产加速器的调整线程块大小性能优化;步骤H,对优化后的基础版本计算模块进行性能测试。2.根据权利要求1所述的一种基于国产加速器的CFD核心算法并行优化方法,其特征在于:在步骤B中,模版计算函数,每个网格数据点的计算都是独立进行的,将相应网格点的数据映射到GPU上的单个线程,实现高效的三维并行。3.根据权利要求1所述的一种基于国产加速器的CFD核心算法并行优化方法,其特征在于:在步骤D中,当内核函数大小较小,中间...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。