气体动理论统一算法中的CPU+GPU异构并行优化方法技术

技术编号:26170317 阅读:31 留言:0更新日期:2020-10-31 13:37
本发明专利技术公开了一种气体动理论统一算法中的CPU+GPU异构并行优化方法,包括CPU+GPU异构并行的实现以及优化;优化方法包括:S1、基于Boltzmann方程统一算法的并行运行流程和热点代码,对CPU消耗时间进行统计;S2、基于Boltzmann模型方程统一算法的数据结构和变量使用情况,对各存储器的使用情况进行统计;S3、基于Boltzmann模型方程统一算法并行计算得到对应的变量依赖关系;S4、基于Boltzmann模型方程统一算法并行计算的CPU消耗时间、存储器配置、变量依赖关系,通过系统、算法、语句三种级别对CPU+GPU异构并行的Boltzmann模型方程统一算法进行并行优化。本发明专利技术提供一种气体动理论统一算法中的CPU+GPU异构并行优化方法,凭借系统、算法、语句三个层次的优化手段,实现并行效率的提升。

【技术实现步骤摘要】
气体动理论统一算法中的CPU+GPU异构并行优化方法
本专利技术属于飞行器空气动力
,特别是涉及一种针对求解高稀薄自由分子流到连续流各流域复杂多尺度非平衡流动问题气体动理论统一算法的GPU并行优化方法。
技术介绍
随着科学技术的迅猛发展,高性能计算已成为科学技术发展和重大工程设计中具有战略意义的研究手段,它与传统的理论研究和风洞实验室实验一起构成了现代科学技术尤其是航天飞行器空气动力学设计中互相补充、互为关联的研究方法,成为21世纪科学研究的三大支柱。特别是大内存、高速度超级并行计算机的研制使用,高性能并行计算已成为复杂科学计算领域的主宰,基于巨型计算机与互联网技术所发展起来的国家高性能计算环境对解决航天飞行器从外层空间再入大气层复杂空气动力学问题具有极其重要的机遇与挑战。根据国际上关于玻尔兹曼(Boltzmann)方程研究现状与发展趋势,结合从事DSMC方法与计算流体力学有限差分方法研究基础,为了探索跨流域气体流动问题一体化模拟方法,本专利第一专利技术人从开展Boltzmann方程碰撞积分物理分析与可计算建模出发,研究提出描述各本文档来自技高网...

【技术保护点】
1.一种气体动理论统一算法中的CPU+GPU异构并行优化方法,其特征在于,包括CPU+GPU异构并行的实现以及优化;/n其中,所述CPU+GPU异构并行的实现是在原有MPI并行程序的基础上,将六层嵌套循环分别以速度矢量信息和空间位置坐标为线索分配给CPU和GPU设备,从而将原有MPI并行程序三个维度的并行,扩展为六个维度的并行;/n所述CPU+GPU异构并行的优化方法包括:/nS1、基于Boltzmann方程统一算法的并行运行流程和热点代码,对CPU消耗时间进行统计;/nS2、基于Boltzmann模型方程统一算法的数据结构和变量使用情况,对各存储器的使用情况进行统计;/nS3、基于Boltz...

【技术特征摘要】
1.一种气体动理论统一算法中的CPU+GPU异构并行优化方法,其特征在于,包括CPU+GPU异构并行的实现以及优化;
其中,所述CPU+GPU异构并行的实现是在原有MPI并行程序的基础上,将六层嵌套循环分别以速度矢量信息和空间位置坐标为线索分配给CPU和GPU设备,从而将原有MPI并行程序三个维度的并行,扩展为六个维度的并行;
所述CPU+GPU异构并行的优化方法包括:
S1、基于Boltzmann方程统一算法的并行运行流程和热点代码,对CPU消耗时间进行统计;
S2、基于Boltzmann模型方程统一算法的数据结构和变量使用情况,对各存储器的使用情况进行统计;
S3、基于Boltzmann模型方程统一算法并行计算得到对应的变量依赖关系;
S4、基于Boltzmann模型方程统一算法并行计算的CPU消耗时间、存储器配置、变量依赖关系,通过系统、算法、语句三种级别对CPU+GPU异构并行的Boltzmann模型方程统一算法进行并行优化。


2.如权利要求1所述的气体动理论统一算法中的CPU+GPU异构并行优化方法,其特征在于,在S1中,通过对三维程序计算流程和需求分析进行梳理,得到三维CUDA程序总体设计思路与子程序之间的调用关系,进而通过子程序的运行流程和热点代码,得出软件内部各子程序的CPU消耗时间。


3.如权利要求1所述的气体动理论统一算法中的CPU+GPU异构并行优化方法,其特征在于,在S2中,存储器的使用进行配置方法被配置为包括:
S21、将统一算法中子程序用于数据传输的全局变量按照功能进行分组;
S22、对热点代码中的每组变量被各子程序调用的次数进行统计。


4.如权利要求1所述的气体动理论统一算法中的CPU+GPU异构并行优化方法,其特征在于,在S3中,变量依赖关系是基于大规模并行的参数作为并行线索,以此设计线程映射方案;
其中,所述映射方案的建立包括:
S31、基于MPI+CUDA软件架构的并行程序,将主程序进行任务拆分,并将拆分后的任务通过MPI分配至多个CPU线程;...

【专利技术属性】
技术研发人员:李志辉张子彬彭傲平白智勇徐金秀吴俊林蒋新宇
申请(专利权)人:中国空气动力研究与发展中心超高速空气动力研究所
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1