【技术实现步骤摘要】
专利
本专利技术属于图形处理器上的实现大规模分子模拟领域,特别是涉及在图形处理器上实现超过一千万粒子大规模耗散粒子动力学模拟的方法。
技术介绍
当前,图形处理器(GPU)已经发展成为可以用于大规模计算的强大并行处理器。例如,NVIDIA Tesla C2050GPU的单精度浮点计算峰值能力为1.03Tflops,而Interl’s Q9500CPU只有45.28Gflops。在科学计算中,由于GPU强大的数据并行计算能力,其计算速度有可能比中央处理器(CPU)计算快几十倍。这为我们突破CPU计算能力的瓶颈提供了新的可能。同时一系列的软件工具的出现,如:CUDA,Brook,Cg等,为我们将GPU应用于科学计算提供了便利。近几年,由于GPU计算相比于基于CPU的超级计算机或集群具有更好的性价比,发展基于GPU的科学计算软件已成为一个引人瞩目的课题。在这些工作中,针对GPU加速分子动力学(MD)这一问题,已经有深入的研究,并得到了许多令人鼓舞的成果。例如,Stone等人报道了长程静电相互作用和非键接力的GPU实现,并得到了相对于优化的CPU实 ...
【技术保护点】
一种在图形处理器上实现大规模耗散粒子动力学模拟的方法,其特征包括如下步骤:第一步,设定模拟初始状态;第二步,完成邻居列表的初始化;第三步,建立粒子编号从(i‑1)*k‑1到i*k的k个粒子的邻居列表,其中i为循环计数器,k为每次计算的粒子数;第四步,计算粒子编号从(i‑1)*k‑1到i*k的k个粒子的对应的非键相互作用;第五步,重复步骤三到四,直至i*k>=N;第六步,不断迭代模拟步,模拟结束后分析数据。
【技术特征摘要】
1.一种在图形处理器上实现大规模耗散粒子动力学模拟的方法,其特征
包括如下步骤:第一步,设定模拟初始状态;第二步,完成邻居列表的初
始化;第三步,建立粒子编号从(i-1)*k-1到i*k的k个粒子的邻居列表,
其中i为循环计数器,k为每次计算的粒子数;第四步,计算粒子编号从(i-1)
*k-1到i*k的k个粒子的对应的非键相互作用;...
【专利技术属性】
技术研发人员:杨科大,郭洪霞,
申请(专利权)人:中国科学院化学研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。