一种面向粒子方法的并行计算系统技术方案

技术编号:2848689 阅读:152 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种面向粒子方法的并行计算系统,包括多个计算节点和多个存储节点,所述多个计算节点在逻辑上排列成周期性分布的计算节点阵列,所述多个存储节点在逻辑上排列成周期性分布的存储节点阵列;所述计算节点阵列与所述存储节点阵列交错布置,并共同形成周期性分布的阵列;每一个存储节点都与多个与其邻近的计算节点连接,由该多个邻近的计算节点共享;每一个计算节点都与多个与其邻近的存储节点连接,对该多个邻近的存储节点中的数据进行处理。本发明专利技术的优点在于:面向粒子方法的设计具有广泛的应用领域、可以获得很高的软件执行效率,并同时具有突出的结构特点,极大地降低了大规模并行计算系统的复杂程度。

【技术实现步骤摘要】

本专利技术涉及计算机领域,更具体地说,涉及一种并行计算系统。
技术介绍
目前实现高性能计算的主流方式是大规模并行处理(MPP),由于这样的并行计算系统耗资巨大,如何充分利用并行计算系统中的计算资源和存储资源是设计中需要重点考虑的问题。传统的并行计算系统的设计通常是两种思路。一种是设计通用的并行计算系统,让系统能适应许多不同的算法和应用问题,即依靠通用性来保证业务量的饱满。为此,原则上应实现全局性的快速数据交换,包括处理器与存储器之间以及处理器之间直接或间接的数据交换。对于通用的并行计算系统,当处理器数量增加时,通讯方面的硬件开销必然非线性地增加,而系统的实际速度却无法达到线性的增长,从而造成了提高机器性能的主要瓶颈。系统的规模由于受到元器件的集成度在技术上的严重制约而存在一个极限。目前即使对单处理器的微型计算机来说,处理器和存储器之间的速度差距拉大也使它运行许多计算程序的实际效率只有峰值的10%左右,而对MPP系统常常更降低到只有1~2%。很明显的,通用并行计算系统由于要适应许多不同的算法和应用问题,没有对某一种或者某一类算法进行优化设计,因此其运行中不可避免地会造成一些计算资源和存储资源的浪费。另一种思路是提供专用的并行计算系统,即针对特定算法和问题设计专用系统,在这样的系统中,计算资源和存储资源根据特定的算法承担特定的功能,由于设计的专用性,这样的并行计算系统可以充分利用其计算资源和存储资源。但是专用并行计算系统只能针对特定算法和问题运行,因此其应用面狭窄,业务量小,也确实无法成批生产和充分利用,经济性很差,所以也没有得到重点发展。本专利技术的动机就在于寻找介于通用和专用设计之间的第三条道路。希望找到一种能够涵盖尽可能多的数学物理模型的算法框架,并根据该算法的特性设计并行计算系统。根据这种思路设计出的并行计算系统既根据所选定的算法进行了设计的优化,从而具有专用的特性;而且由于所选定的算法能够涵盖多种数学物理模型,适用于多种具体的算法,从而具有通用的特性。专利技术人发现,所谓“粒子方法”就是适于前述设计思路的一种算法框架。这样,本申请即是为“粒子方法”提供一种并行计算系统。下文则对本申请所涉及“粒子方法”进行描述。“粒子方法”是对这样一类模拟方法特定的统称它们将模拟系统离散为大量相互作用的粒子,通过动力学计算描述每个粒子的行为,从而直接或通过统计与组合复现系统的行为。虽然目前已经出现了多种具体的粒子方法和大量相应的实例模拟,但学术界对这些方法的统称还缺乏共识。为此先对粒子方法的特征和涵盖的范围作更具体的表述。实际上,有几种典型的粒子方法已广为人知,并且是非常直观的。如分子动力学(molecular dynamics,MD)方法通过将原子、原子团或分子简化为通过有势力和刚性约束等方式相互作用的质点来描述分子、分子团以至材料的微观行为,目前已广泛应用于化学制剂的合成,生物大分子和新材料的研究、设计与制备,对生命本质的探索等领域。而在广义上,像中子扩散等对核辐射的模拟也归入分子动力学方法中。而对象沙石、谷物、各种粉末等固体颗粒物,模拟它们的集体运动最直观的方法就是计算其中自然存在的每个离散颗粒间的相互作用力(如相互接触产生的压力和摩擦力,以及非接触时也能存在的静电力等),并进而计算它们各自的轨迹,这被成为离散单元法(distinct element method,DEM)。目前也在工业过程、农业工程和地质、水文等方面广泛应用。而在更大的尺度上,我们也不难发现,从星球、星系,到星系团甚至整个宇宙,世界的离散的特性也是非常明显的,后者都可视为组成前者的粒子。而事实上,天体动力学模拟的一种主流手段就是通过计算这些巨大“粒子”间的万有引力来跟踪它们的轨迹和集体的行为。这种方法为探索宇宙的形成与演化及未来的航天领域提供了有力手段。粒子方法也不局限于直观上能处理为粒子集合的系统。近年来,对于流体的流动和材料的变形等传统上采用连续介质方法模拟的行为,通过构造粗粒化的或者简化的模型粒子也提出了很多粒子方法。如介观的耗散粒子动力学(dissipative particledynamics,DPD)方法和格子波尔兹曼(Lattice Boltzmann,LB)方法,以及宏观的光滑粒子动力学(smoothed particle hydrodynamics,SPH)方法等。从物理背景上说,这些模型粒子大致可以被理解为一大团分子或一个物质微元的拉格朗日(Lagrange)表达。这些采用模型粒子突破了计算量随系统自然含有的粒子数量必然增大的问题(这是采用连续介质方法的重要理由),并且特别适合处理复杂边界、多相介质和大变形等对连续介质方法具有挑战性的问题,目前已在舰船、飞行器和车辆的设计,核武器与反应堆的研究与设计,能源、化工、水利、地质勘探开发,气象和海洋预报等广泛的领域中获得大量应用。值得指出的是,任何连续介质模型除非解析求解,最终也都要按一定的离散格式数值求解的。而很多离散格式,主要是显格式,也可以理解为某种特殊的静止粒子系统,而这些特殊粒子间的作用粒子方法所具有的特性,因此它们也属于本申请的并行计算系统适用的范围。它具体包括了很多所谓无网格方法(Meshless Methods),神经网络(Neural Network)算法,和很多信号与图像处理算法。在Annual Review of Fluid Mechanics Vol.37457,2005等文献中还可以找到对更多粒子方法的介绍。粒子方法虽然种类繁多,应用广泛,但在算法上却有很突出的共性。本申请的并行计算系统考虑了它们如下的共同特性首先,无论是自然存在的粒子还是人为构造的模型粒子,它们之间的作用强度普遍随距离的增长而迅速降低。物理粒子间的作用本质上无非是四种基本力造成的(实为三种或更少),其中引力和电磁力的强度与质点间距离平方成反比,而强和弱相互作用的衰减更快,因此一般可忽略相距足够远的粒子间的作用,或者通过估计大量粒子的合力来代替每对粒子间的受力计算。这就导致了局部性,即尽管整个系统可拥有任意多个粒子,但直接决定任一粒子瞬时运动的粒子却主要是很少量的邻近粒子。同时,一对粒子间的作用函数一般可通过常微分方程描述,而一个粒子同时受到的各对作用是可迭加的。也就是说,我们可以按任意顺序分别独立处理每对粒子间的作用,通过简单的相加之和得到粒子的合力。虽然在对硬球粒子或由多个粒子通过一些约束组成的复合粒子(如链状的高分子)的具体处理上并非那么简单,但在稍大的尺度上,如对复合粒子的整体,其算法总体上依然具有此性质。另外,在相当于或大大于粒子间作用特征时空尺度的范围内,粒子系统常接近均匀状态,而在介于两者之间的时空尺度上系统表现出较强的非均匀性,并且是动态变化的。这是物理世界的结构层次性在模型中的自然表现。
技术实现思路
本专利技术的目的是提供一种适用于粒子方法的并行计算系统;该并行计算系统既是根据粒子方法的特性而专门设计,又由于粒子方法本身能够涵盖很多的数学物理模型而使得该并行计算系统可适用于多种具体的算法和应用问题。为了实现上述目的,本专利技术提供了一种面向粒子方法的并行计算系统,包括多个计算节点和多个存储节点所述多个计算节点在逻辑上排列成周期性分布的计算节点阵列,所述多个存储节点在逻辑本文档来自技高网
...

【技术保护点】
一种面向粒子方法的并行计算系统,包括多个计算节点和多个存储节点,其特征在于:所述多个计算节点在逻辑上排列成周期性分布的计算节点阵列,所述多个存储节点在逻辑上排列成周期性分布的存储节点阵列;所述计算节点阵列与所述存储节点阵列交 错布置,并共同形成周期性分布的阵列;每一个存储节点都与多个与其邻近的计算节点连接,由该多个邻近的计算节点共享;每一个计算节点都与多个与其邻近的存储节点连接,对该多个邻近的存储节点中的数据进行处理。

【技术特征摘要】
1.一种面向粒子方法的并行计算系统,包括多个计算节点和多个存储节点,其特征在于所述多个计算节点在逻辑上排列成周期性分布的计算节点阵列,所述多个存储节点在逻辑上排列成周期性分布的存储节点阵列;所述计算节点阵列与所述存储节点阵列交错布置,并共同形成周期性分布的阵列;每一个存储节点都与多个与其邻近的计算节点连接,由该多个邻近的计算节点共享;每一个计算节点都与多个与其邻近的存储节点连接,对该多个邻近的存储节点中的数据进行处理。2.根据权利要求1所述的面向粒子方法的并行计算系统,其特征在于,所述计算节点为可按多指令多数据方式运行的处理器或计算机。3.根据权利要求1所述的面向粒子方法的并行计算系统,其特征在于,所述计算节点阵列和所述存储节点阵列在逻辑上为D维周期性分布阵列,每一个存储节点与2D个与其邻近的计算节点连接,每一个计算节点与2D个与其邻近的存储节点连接,所述D表示1、2、3或更高值。4.根据权利要求1所述的面向粒子方法的并行计算系统,其特征在于,所述计算节点阵列在逻辑上排列成二维六边形周期性分布的阵列,每六个计算节点位于六边形周期单元的六个顶角;存储节点和计算节点交错布置,使得每一个存储节点均位于计算节点阵列的六边形周期单元的中心;每一个存储节点与六个与其邻近的计算节点连接,每一个计算节点与三个与其邻近的存储节点连接。5.根据权利要求1所述的面向粒子方法的并行计算系统,其特征在于,所述存储节点阵列在逻辑上排列成二维六边形周期性分布的阵列,每六个存储节点位于六边形周期单元的六个顶角...

【专利技术属性】
技术研发人员:葛蔚李静海
申请(专利权)人:中国科学院过程工程研究所
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利