一种基于GPU集群的并行流体仿真加速方法技术

技术编号：11061730 阅读：180 留言：0更新日期：2015-02-19 08:48

本发明专利技术是一种基于GPU集群的并行流体仿真加速方法。针对流体仿真计算量大、并行度高的特点，设计了自动化的并行加速方法，进行流体的模拟与算法研究。提出并实现了一种在同一节点内多个GPU之间、多个节点之间的负载均衡算法。在给定空间中使用基于位置的流体仿真算法模拟流体的物理行为，通过减少分支以及缩小临域搜索范围对算法进行加速。对流体所在的空间进行分割，每个节点处理一个子空间，在节点内根据GPU数量进行进一步分割，从而完成流体仿真在GPU集群上的并行化。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于GPU集群的并行流体仿真加速方法
本专利技术属于计算机应用领域，具体地说是一种基于GPU集群的并行流体仿真加速方法，该方法可用于影视、游戏、医学等各个领域中，模拟流体的行为。
技术介绍
随着虚拟现实技术的发展，流体动画在电影特技、娱乐游戏、军事仿真、医学仿真、数字媒体中广泛应用，人们对真实感有了越来越高的需求。为了仿真这些复杂的场景效果，一帧一帧手工渲染动画自然满足不了需求，近年来，计算机硬件性能飞速发展，极大的促进了计算机图形学的深入研究。流体仿真更是多种多样，从早期简单的大面积水体仿真，如平静的水面、静止的烟雾，到现在渲染更为丰富细致的动态流体，如飞溅、泡沫、沸腾、多流体融合、多相流，流体交互仿真等，流体和其物理属性已经紧密的结合在一起。因此，基于物理的流体动画仿真成为计算机图形学和虚拟现实领域中的研究热点之一。近年来被广泛应用的光滑粒子流体动力学（Smoothed Particle Hydrodynamics) 算法是一种基于物理的流体仿真算法。该类方法使用粒子离散化问题域，通过加权求和邻居粒子的贡献值来计算粒子的物理量。该算法能够很好的处理自由表面、变形边界、运动交界面以及大变形等问题。但是SPH算法使用了刚性方程以维持其不可压缩性，这使得力的计算结果较大，只能使用足够小的时间步长。基于位置的流体仿真（Position Based Fluid)算法在基于位置的动力学 (Position Based Dynamics7F1DB)框架中添加了密度的迭代求解。通过一组位置限制公式来维持...
一种基于GPU集群的并行流体仿真加速方法

【技术保护点】
一种基于GPU集群的并行流体仿真加速方法，其特征在于包括以下步骤：(1)在全局空间中按照节点数量和粒子分布情况对其在某一二维平面进行划分，而非三维空间上进行ORB划分，每个节点对应一块子空间；(2)在每个节点的所属子空间中根据GPU数量和该子空间中粒子分布差异最大化的坐标轴方向对该子空间进行一维划分，并沿该方向在对其子空间内粒子进行矩阵变换，将粒子数据发送至所属节点的相应GPU中；(3)各GPU使用基于位置的流体仿真算法(PBF)进行计算，多次迭代修正粒子位置，再计算限制因子项，更新粒子位置之后分别对限制因子项和粒子位置进行两次全局同步，同步后本时间步结束；(4)根据各GPU的计算时间，对各个节点各个GPU进行负载均衡处理，调整全局空间的划分，根据新的划分在GPU之间交换粒子，而后重复步骤(3)，处理下一个时间步。

【技术特征摘要】
1. 一种基于GPU集群的并行流体仿真加速方法，其特征在于包括以下步骤： (1) 在全局空间中按照节点数量和粒子分布情况对其在某一二维平面进行划分，而非三维空间上进行ORB划分，每个节点对应一块子空间； (2) 在每个节点的所属子空间中根据GPU数量和该子空间中粒子分布差异最大化的坐标轴方向对该子空间进行一维划分，并沿该方向在对其子空间内粒子进行矩阵变换，将粒子数据发送至所属节点的相应GPU中； (3) 各GPU使用基于位置的流体仿真算法（PBF)进行计算，多次迭代修正粒子位置，再计算限制因子项，更新粒子位置之后分别对限制因子项和粒子位置进行两次全局同步，同步后本时间步结束； (4) 根据各GPU的计算时间，对各个节点各个GPU进行负载均衡处理，调整全局空间的划分，根据新的划分在GPU之间交换粒子，而后重复步骤（3)，处理下一个时间步。2. 如权利要求1所述的基于GPU集群的并行流体仿真加速方法，其特征在于：在所述步骤（1)中在全局空间中按照节点数量和粒子分布情况对其在某一二维平面进行划分，具体方法是：按照服务器节点数量和粒子的空间分布情况对空间进行二维ORB划分，ORB方式采用多层次的方式切割，选定两个方向进行划分；统计粒子在三个方向上坐标分布的方差，取方差最大的两个方向作为切割方向；首先沿方差最大的方向将场景切割为两个长方体，然后在两个长方体中继续选择其余一个方向切割为更小的两个长方体，循环在两个方向上切割直到子空间的数量和GPU数量相同；此切割方法目的在于减小节点间交界面面积，同时不至于使传输模型过于复杂，最小化各节点传输数据量。3. 如权利要求1所述的基于GPU集群的并行流体仿真加速方法，其特征在于：在所属步骤（2)中对每个节点的全局子空间进行划分，具体方法是：计算粒子坐标集在步骤（2)选取两个方向上的方差，沿方差最大的坐标轴粒子的分布差异相对最大，按照粒子在该方向的数量分布，将整个仿真空间沿该方向切割为多个长方体子空间；此切割方法目的在于在使节点间传输事务次数最小化的前提下，节点内GPU间的传输数据量和传输事务次数最小化。4. 如权利要求1所述的基于GPU集群的并行流体仿真加速方法，其特征在于：在所属步骤（3)中各GPU使用基于位置的流体仿真算法（PBF)进行计算并在计算限制因子项和校正粒子...

【专利技术属性】
技术研发人员：沈旭昆，黄冠喆，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人