【技术实现步骤摘要】
基于超算互联网的RNA结构预测方法及系统
[0001]本专利技术涉及RNA结构预测
,特别是涉及基于超算互联网的RNA结构预测方法及系统。
技术介绍
[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
,并不必然构成现有技术。
[0003]核糖核酸(缩写为RNA,即Ribonucleic Acid)是生物系统内最为重要的分子之一,它在生物信息传递过程中发挥着至关重要的作用。RNA由四种核苷酸按特定顺序排列组合成为一定长度,形成特定空间结构以后才能发挥生物学功能和参加生理活动。现存RNA结构预测工具需要在本地下载和安装,大多数是需要使用shell脚本调用或在终端以命令行的方式运行,操作不便甚至相当困难,并且因为硬件资源的不足,工具运行时间长导致工作效率低。
技术实现思路
[0004]为了解决现有技术的不足,本专利技术提供了基于超算互联网的RNA结构预测方法及系统;利用超算互联网的统筹能力充分发挥各个超算中心的优势,以解决在RNA结构预测过程中工具分散不便使用,工具运行时间长效率低下等问题。
[0005]第一方面,本专利技术提供了基于超算互联网的RNA结构预测方法;
[0006]基于超算互联网的RNA结构预测方法,包括:
[0007]获取待预测的RNA序列;对待预测的RNA序列进行编辑;
[0008]对编辑后的RNA序列,进行RNA二级结构预测,得到RNA二级结构预测结果;从RNA二级结构预测结果中进行文件提取,得到文件提取结果;
[0009 ...
【技术保护点】
【技术特征摘要】
1.基于超算互联网的RNA结构预测方法,其特征是,包括:获取待预测的RNA序列;对待预测的RNA序列进行编辑;对编辑后的RNA序列,进行RNA二级结构预测,得到RNA二级结构预测结果;从RNA二级结构预测结果中进行文件提取,得到文件提取结果;基于RNA二级结构文件提取结果和待预测的RNA序列,进行RNA三级结构预测,得到RNA三级结构预测结果;比较RNA三级结构预测结果与参考结构之间的差异,通过多个指标对差异进行衡量,选择最优的预测结构作为最终结构;其中,对待预测的RNA序列进行编辑、进行RNA二级结构预测和进行RNA三级结构预测;均调度多个超算算力资源进行实现。2.如权利要求1所述的基于超算互联网的RNA结构预测方法,其特征是,对待预测的RNA序列进行编辑;具体包括:采用RNA序列编辑工具Edit Sequence,提取待编辑RNA序列中的某条链或者选中指定序列片段进行编辑,对选中部分片段进行重命名,交换和删除操作来实现;所述RNA序列编辑工具,被集成于Galaxy平台;或者,RNA序列编辑工具,接收用户提交的序列信息和工具操作需求,根据序列数据量大小、工具的运行命令和工具自身配置,分析用户所需资源需求如CPU数量和内存大小,并将资源需求申请和工具运行命令发送给超算互联网调度系统。3.如权利要求1所述的基于超算互联网的RNA结构预测方法,其特征是,对编辑后的RNA序列,进行RNA二级结构预测,得到RNA二级结构预测结果;具体包括:采用RNA二级结构预测工具,对编辑后的RNA序列,进行RNA二级结构预测,得到RNA二级结构预测结果;所述RNA二级结构预测工具,被集成于Galaxy平台;或者,所述RNA二级结构预测工具,被集成于Galaxy平台;具体集成过程包括:创建新的RNA二级结构预测工具的xml文件,并在文件中指定工具ID、名称<tool>、工具描述<description>、输入参数<inputs>、输出参数<outputs>,运行命令<command>、测试用例<tests>以及工具依赖<requirements>;修改工具模块配置文件tool_conf.xml,设置加载工具配置文件的本地路径,使集成的二级结构预测工具加载到web工具栏面板。4.如权利要求1所述的基于超算互联网的RNA结构预测方法,其特征是,基于RNA二级结构文件提取结果和待预测的RNA序列,进行RNA三级结构预测,得到RNA三级结构预测结果;具体包括:基于RNA二级结构文件提取结果和待预测的RNA序列,采用RNA三级结构预测工具,进行RNA三级结构预测,得到RNA三级结构预测结果;所述RNA三级结构预测工具,被集成于Galaxy平台;或者,所述RNA三级结构预测工具,被集成于Galaxy平台;具体集成过程包括:创建新的RNA三级结构预测工具的xml文件,并在文件中指定工具ID、名称<tool>、工具
描述<description>、输入参数<inputs>、输出参数<outputs>,运行命令<command>、测试用例<tests>以及工具依赖<requirements>;修改工具模块配置文件tool_conf.xml,设置加载工具配置文件的本地路径,使集成的三级结构预测工具加载到web工具栏面板。5.如权利要求1所述的基于超算互联网的RNA结构预测方法,其特征是,进行RNA三级结构预测,具体...
【专利技术属性】
技术研发人员:郭浩宇,杨超超,王嘉祥,王继彬,潘景山,郭猛,
申请(专利权)人:山东省计算中心国家超级计算济南中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。