一种GROMACS云计算流程控制方法技术

技术编号:19177959 阅读:28 留言:0更新日期:2018-10-17 00:29
本发明专利技术提供一种GROMACS云计算流程控制方法,包括以下几个步骤:步骤(1):从ArangoDB数据库,获取聚类排位得到的能量靠前的几个晶体结构的.res或.cif文件,然后得到GROMACS的结构文件;步骤(2):从ArangoDB数据库,获取力场开发研究得到的最佳力场参数.prm和.rtf,然后调用yoda库函数自动转换成GROMACS的力场参数文件;步骤(3):根据不同阶段对应的模拟类型,调用yoda库函数自动生成对应的GROMACS的模拟参数文件;步骤(4):调用mixc库函数,将GROMACS计算和分析任务提交到Majorana任务调度平台;步骤(5)给每个结构对应的同批次任务添加相应的监控任务,实时获取任务的执行状态;步骤(6)待所有的任务都执行完成后,从ArangoDB数据库获取相应的分析结果,调用matplotlib绘图库,直接在jupyter中作出相应的曲线。

A GROMACS cloud computing process control method

The invention provides a method for controlling GROMACS cloud computing process, which comprises the following steps: (1) obtaining several crystal structure. res or. CIF files with high energy obtained by clustering arrangement from ArangoDB database, and then obtaining the structure file of GROMACS; and (2) obtaining the force field opening from ArangoDB database. Produce the best force field parameters. PRM and. rtf, then call the Yoda library function to automatically convert the GROMACS force field parameters file; Step (3): According to the corresponding simulation type of different stages, call the Yoda library function to automatically generate the corresponding GROMACS simulation parameters file; Step (4): Call the Mixc library function to GROMACS simulation parameters file; Step (4): Call the Mixc library function, the GROMACS simulation parameters file; Computing and analyzing tasks are submitted to Majorana task scheduling platform; step (5) adding corresponding monitoring tasks to the same batch of tasks corresponding to each structure to obtain the execution status of tasks in real time; step (6) after all tasks are executed, the corresponding analysis results are obtained from ArangoDB database, and the corresponding analysis results are drawn by calling Matplotlib Graphics library, directly in the jupyter to make corresponding curves.

【技术实现步骤摘要】
一种GROMACS云计算流程控制方法
本专利技术属于高通量的GROMACS科学计算领域,涉及一种GROMACS云计算流程控制方法。
技术介绍
分子动力学(MD)计算已广泛地应用于材料科学的各个领域,GROMACS作为一个开源、高效的MD计算软件,已成为模拟计算的首选。当前,几乎所有的超算中心和云平台都安装了各类版本的GROMACS软件,并有相应的作业管理系统来完成任务的提交、修改和删除等功能。当前的GROMACS云计算流程主要存在以下缺陷:1.不能跨平台调度:当前几乎所有的GROMACS云计算平台,都需要先手动登录、编写任务脚本,再提交到各自的平台上计算。2.不能连续计算:一般GROMACS的后续任务都需要使用到上一个任务的最终结构,因此连续的任务都需要等前一个任务计算完成才能提交。3.存储形式单一:所有的GROMACS计算和分析结果都储存在平台上,不利于实时查看和监控模拟状态。4.缺乏用户界面:当前所有的GROMACS云计算和分析流程都是基于脚本的形式,用户体验差,不利于任务状态监控、结果的图形化显示等。
技术实现思路
为了解决以上技术问题,本专利技术提供一种GROMACS云计算流程控制方法,包括以下几个步骤:步骤(1):从ArangoDB数据库,获取聚类排位得到的能量靠前的几个晶体结构的.res或.cif文件,然后调用yoda库函数进行对称性操作、格式转化和晶胞扩展,得到GROMACS的结构文件;步骤(2):从ArangoDB数据库,获取力场开发研究得到的最佳力场参数.prm和.rtf,然后调用yoda库函数自动转换成GROMACS的力场参数文件;步骤(3):根据不同阶段对应的模拟类型,调用yoda库函数自动生成对应的GROMACS的模拟参数文件;步骤(4):调用mixc库函数,将GROMACS计算和分析任务提交到Majorana任务调度平台;步骤(5)给每个结构对应的同批次任务添加相应的监控任务,实时获取任务的执行状态;(6)待所有的任务都执行完成后,从ArangoDB数据库获取相应的分析结果,调用matplotlib绘图库,直接在jupyter中作出相应的曲线。现有技术中,GROMACS模拟所必须的3类文件包括:结构(.gro)、力场参数(.top和.itp)和模拟参数(.mdp)。本专利技术是用于晶型预测流程中的晶体的温度稳定性计算(自由能计算)。其中,结构来源于晶型预测流程中的聚类排位结果(.res和.cif),力场参数来源于力场开发计算结果,而模拟参数则是参考已有的文献报道、以及相关的测试和优化结果(基于不同的模拟类型,自动生成相应的参数文件)。因此本专利技术无缝衔接了晶型预测流程中的力场开发、聚类排位和自由能计算。本专利技术采用以上技术方案,可以解决平台登录、任务脚本编写、分析脚本编写、任务监控、分析数据绘图等跨平台和软件的繁琐步骤,将所有的用户操作都集成到Jupyter中,从而大大提高了计算和分析的效率。优选的,所述任务参数采用任务类型、镜像名、内存和核数中的至少一种。优选的,所述任务类型采用MD或REMD。优选的,所述步骤(5)中,所述运行状态包括:正常结束、失败、准备中、排队中和内存不足中的至少一种。相应的,本专利技术还提供一种基于所述GROMACS云计算的副本交换分子动力学流程方法,包括如下几个步骤:步骤①:从聚类排位计算结果中选取N个能量较低的晶体结构,变换格式和扩展超胞后得到对应的GROMACS结构;其中,N个能量较低的晶体结构是指能量排位靠前的5至10个结构步骤②:选取最优的力场参数,对上述每个结构进行1ns的等温等压弛豫;所述最优的力场参数是指本领域技术人员所知道的能够最好地描述分子的构效关系,并具有良好的晶体学表现。步骤:获取弛豫后的结构,在给定的一系列温度下进行NPT系综下的常规分子动力学模拟的温度扫描;步骤:将每组温度扫描的最终结构进行NPT系综下的REMD模拟;通过提取常用的理化性质随时间的变化,直接在Jupyter中绘制所有温度下某个性质随时间演化的全景图;步骤⑤根据REMD模拟的结果,计算出体积、内能和自由能随温度变化的曲线;在使用MBAR计算自由能时,同时计算相邻温度之间的相关时间和重叠矩阵;这些数据都可以直接在Jupyter中绘制成图,以便实时查看和收敛性检查。优选的,所述步骤⑤中,模拟的计算过程可以通过温度、压力、体积、各种能量、RMSD、质心偏移等随时间的变化图来监控是否收敛。所述各种能量是指包括势能、动能、位置限制作用能、静电作用能、范德华作用能和总能量中的至少一种。REMD模拟主要用于增强体系在构型空间上的采样,从而在最大程度上遍历势能面上所有点,以获取准确的自由能数据。但由于其需要的计算资源很大,在任务执行和资源调度上很复杂。为此,我们为REMD设计了套完整的计算流程,方便快速提交REMD任务,并对结果进行自动化分析。本专利技术进一步采用以上技术方案,其优点在于,在指定初始结构、力场参数和各步的模拟参数(包括模拟步长、时长、温度范围等)后,上述计算过程只需进行一次提交,就可以自动完成后续的所有计算和数据分析任务。用户可以在Jupyter中随时查看和修改任务的执行状态,也能以图形的方式实时查看已有的计算和分析结果。本专利技术带来了如下效果:1.实现了高通量、高并行GROMACS任务的跨平台调度、GROMACS任务的自动续算、连续计算和结果的自动化分析。2.实现了GROMACS结构文件、力场参数文件和模拟参数文件的自动化创建,以及常用理化性质的自动化分析和整合。3.无缝衔接了晶型预测流程中的力场开发、聚类排位计算和自由能计算;设计将平衡结构、分析结果与GROMACS轨迹分开存储,便于快速获取计算结果;大大提升了结果展示和收敛性分析的速度。4.将所有的GROMACS任务创建、提交和管理,理化性质监控,结果分析和绘图等步骤集成到Jupyter中,实现了GROMACS云计算流程的可视化操作。附图说明图1是本专利技术完整的GROMACS云计算流程图。图2是本专利技术基于GROMACS云计算的副本交换分子动力学流程图。图3是本专利技术MD模拟的计算过程中通过温度、压力、体积、各种能量、RMSD、质心偏移等随时间的变化图来监控是否收敛;涉及步骤②③④。图4是本专利技术不同温度下,体积、内能和温度等随时间的变化图,图中的曲线从上到下代表温度逐步降低(即从上到下的温度为从350K到10K),涉及的过程④。图5是本专利技术体积、内能和自由能等随温度的变化,涉及的过程:⑤。图6是本专利技术自由能计算的收敛性分析,相邻副本的相关时间随扫描温度数的变化(相关时间都在10以内,表明收敛性较好),涉及的过程:⑤。图7是本专利技术自由能计算的收敛性分析,不同扫描温度数对应的能量重叠矩阵(对角线的上一格和下一格与整体背景有较大颜色差,表明相邻副本之间重叠足够充分),涉及的过程:⑤。具体实施方式下面结合附图,对本专利技术的较优的实施例作进一步的详细说明:实施例1完整的GROMACS云计算流程,如图1所示,包括以下几个步骤:步骤(1):从ArangoDB数据库,获取聚类排位得到的能量靠前的几个晶体结构的.res或.cif文件,然后调用yoda库函数进行对称性操作、格式转化和晶胞扩展,得到GROMACS的结构文件;步骤(2):从Arang本文档来自技高网...

【技术保护点】
1.一种GROMACS云计算流程控制方法,其特征在于,包括以下几个步骤:步骤(1):从ArangoDB数据库,获取聚类排位得到的能量靠前的几个晶体结构的.res或.cif文件,然后调用yoda库函数进行对称性操作、格式转化和晶胞扩展,得到GROMACS的结构文件;步骤(2): 从ArangoDB数据库,获取力场开发研究得到的最佳力场参数.prm和.rtf,然后调用yoda库函数自动转换成GROMACS的力场参数文件;步骤(3):根据不同阶段对应的模拟类型,调用yoda库函数自动生成对应的GROMACS的模拟参数文件;步骤(4):调用mixc库函数,将GROMACS计算和分析任务提交到Majorana任务调度平台;步骤(5):给每个结构对应的同批次任务添加相应的监控任务,实时获取任务的执行状态;步骤(6):待所有的任务都执行完成后,从ArangoDB数据库获取相应的分析结果,调用matplotlib绘图库,直接在jupyter中作出相应的曲线。

【技术特征摘要】
1.一种GROMACS云计算流程控制方法,其特征在于,包括以下几个步骤:步骤(1):从ArangoDB数据库,获取聚类排位得到的能量靠前的几个晶体结构的.res或.cif文件,然后调用yoda库函数进行对称性操作、格式转化和晶胞扩展,得到GROMACS的结构文件;步骤(2):从ArangoDB数据库,获取力场开发研究得到的最佳力场参数.prm和.rtf,然后调用yoda库函数自动转换成GROMACS的力场参数文件;步骤(3):根据不同阶段对应的模拟类型,调用yoda库函数自动生成对应的GROMACS的模拟参数文件;步骤(4):调用mixc库函数,将GROMACS计算和分析任务提交到Majorana任务调度平台;步骤(5):给每个结构对应的同批次任务添加相应的监控任务,实时获取任务的执行状态;步骤(6):待所有的任务都执行完成后,从ArangoDB数据库获取相应的分析结果,调用matplotlib绘图库,直接在jupyter中作出相应的曲线。2.如权利要求1所述的方法,其特征在于,所述任务参数采用任务类型、镜像名、内存和核数中的至少一种。3.如权利要求2所述的方法,其特征在于,所述任务类型采用MD或REMD。4.如...

【专利技术属性】
技术研发人员:孙广旭彭春望杨明俊肖辉刘阳马健赖力鹏温书豪
申请(专利权)人:深圳晶泰科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1