基于超算互联网的RNA结构预测方法及系统技术方案

技术编号:33890066 阅读:14 留言:0更新日期:2022-06-22 17:24
本发明专利技术公开了基于超算互联网的RNA结构预测方法及系统,包括:获取待预测的RNA序列;对待预测的RNA序列进行编辑;对编辑后的RNA序列,进行RNA二级结构预测,得到RNA二级结构预测结果;从RNA二级结构预测结果中进行文件提取,得到文件提取结果;基于RNA二级结构文件提取结果和待预测的RNA序列,进行RNA三级结构预测,得到RNA三级结构预测结果;比较RNA三级结构预测结果与参考结构之间的差异,通过多个指标对差异进行衡量,选择最优的预测结构作为最终结构;其中,对待预测的RNA序列进行编辑、进行RNA二级结构预测和进行RNA三级结构预测;均调度多个超算算力资源进行实现。调度多个超算算力资源进行实现。调度多个超算算力资源进行实现。

【技术实现步骤摘要】
基于超算互联网的RNA结构预测方法及系统


[0001]本专利技术涉及RNA结构预测
,特别是涉及基于超算互联网的RNA结构预测方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
,并不必然构成现有技术。
[0003]核糖核酸(缩写为RNA,即Ribonucleic Acid)是生物系统内最为重要的分子之一,它在生物信息传递过程中发挥着至关重要的作用。RNA由四种核苷酸按特定顺序排列组合成为一定长度,形成特定空间结构以后才能发挥生物学功能和参加生理活动。现存RNA结构预测工具需要在本地下载和安装,大多数是需要使用shell脚本调用或在终端以命令行的方式运行,操作不便甚至相当困难,并且因为硬件资源的不足,工具运行时间长导致工作效率低。

技术实现思路

[0004]为了解决现有技术的不足,本专利技术提供了基于超算互联网的RNA结构预测方法及系统;利用超算互联网的统筹能力充分发挥各个超算中心的优势,以解决在RNA结构预测过程中工具分散不便使用,工具运行时间长效率低下等问题。
[0005]第一方面,本专利技术提供了基于超算互联网的RNA结构预测方法;
[0006]基于超算互联网的RNA结构预测方法,包括:
[0007]获取待预测的RNA序列;对待预测的RNA序列进行编辑;
[0008]对编辑后的RNA序列,进行RNA二级结构预测,得到RNA二级结构预测结果;从RNA二级结构预测结果中进行文件提取,得到文件提取结果;
[0009]基于RNA二级结构文件提取结果和待预测的RNA序列,进行RNA三级结构预测,得到RNA三级结构预测结果;
[0010]比较RNA三级结构预测结果与参考结构之间的差异,通过多个指标对差异进行衡量,选择最优的预测结构作为最终结构;
[0011]其中,对待预测的RNA序列进行编辑、进行RNA二级结构预测和进行RNA三级结构预测;均调度多个超算算力资源进行实现。
[0012]第二方面,本专利技术提供了基于超算互联网的RNA结构预测系统;
[0013]基于超算互联网的RNA结构预测系统,包括:RNA结构预测平台;
[0014]所述RNA结构预测平台,包括:依次连接的RNA序列编辑模块、RNA二级结构预测模块、RNA三级结构预测模块和RNA结构比较模块;
[0015]所述RNA序列编辑模块还与RNA三级结构预测模块连接;
[0016]所述RNA二级结构预测模块还通过文件结果提取模块与RNA三级结构预测模块连接;
[0017]所述RNA序列编辑模块、RNA二级结构预测模块和RNA三级结构预测模块;均通过超
算互联网调度系统与多个超算算力资源连接。
[0018]与现有技术相比,本专利技术的有益效果是:
[0019]本专利技术所述的RNA结构预测方法及系统集成了RNA序列编辑工具,RNA二级结构预测工具,RNA三级结构预测工具,RNA结构比较工具,用户可以通过工具面板直观的使用工具,操作更简捷,并且利用超算互联网的强大算力,能够加快结构预测计算,提高工作效率。
附图说明
[0020]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0021]图1为实施例一的系统功能模块图。
具体实施方式
[0022]应该指出,以下详细说明都是示例性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。
[0023]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0024]在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。
[0025]本实施例所有数据的获取都在符合法律法规和用户同意的基础上,对数据的合法应用。
[0026]超算互联网作为近年来新概念被提出,是指通过广域互联技术将各超算中心连接起来共享计算资源,从而解决一些超大规模的应用问题,能够有效提升超算中心的计算资源利用率。
[0027]实施例一
[0028]本实施例提供了基于超算互联网的RNA结构预测方法;
[0029]基于超算互联网的RNA结构预测方法,包括:
[0030]S101:获取待预测的RNA序列;对待预测的RNA序列进行编辑;
[0031]S102:对编辑后的RNA序列,进行RNA二级结构预测,得到RNA二级结构预测结果;从RNA二级结构预测结果中进行文件提取,得到文件提取结果;
[0032]S103:基于RNA二级结构文件提取结果和待预测的RNA序列,进行RNA三级结构预测,得到RNA三级结构预测结果;
[0033]S104:比较RNA三级结构预测结果与参考结构之间的差异,通过多个指标对差异进行衡量,选择最优的预测结构作为最终结构;
[0034]其中,对待预测的RNA序列进行编辑、进行RNA二级结构预测和进行RNA三级结构预测;均调度多个超算算力资源进行实现。
[0035]进一步地,所述S101:对待预测的RNA序列进行编辑;具体包括:
[0036]采用RNA序列编辑工具Edit Sequence,提取待编辑RNA序列中的某条链或者选中指定序列片段进行编辑,对选中部分片段进行重命名,交换和删除等操作来实现;所述RNA序列编辑工具,被集成于Galaxy平台。
[0037]进一步地,RNA序列编辑工具,接收用户提交的序列信息和工具操作需求,根据序列数据量大小、工具的运行命令和工具自身配置,分析用户所需资源需求如CPU数量和内存大小,并将资源需求申请和工具运行命令发送给超算互联网调度系统。
[0038]示例性地,对待预测的RNA序列进行编辑;具体包括:接收用户输入fasta格式的RNA序列,使用blast工具在对应数据库中进行序列相似性搜索操作,将用户输入的RNA序列,数据库名称,CPU个数等转换成调用blast工具命令的对应参数:
[0039]输入的RNA序列为blast工具命令的

query参数,作为待查询RNA序列;
[0040]数据库名称为blast工具命令的

db参数,

db用于参数指定blast搜索时用的数据库;
[0041]CPU个数为blast工具命令的

num

threads参数,<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于超算互联网的RNA结构预测方法,其特征是,包括:获取待预测的RNA序列;对待预测的RNA序列进行编辑;对编辑后的RNA序列,进行RNA二级结构预测,得到RNA二级结构预测结果;从RNA二级结构预测结果中进行文件提取,得到文件提取结果;基于RNA二级结构文件提取结果和待预测的RNA序列,进行RNA三级结构预测,得到RNA三级结构预测结果;比较RNA三级结构预测结果与参考结构之间的差异,通过多个指标对差异进行衡量,选择最优的预测结构作为最终结构;其中,对待预测的RNA序列进行编辑、进行RNA二级结构预测和进行RNA三级结构预测;均调度多个超算算力资源进行实现。2.如权利要求1所述的基于超算互联网的RNA结构预测方法,其特征是,对待预测的RNA序列进行编辑;具体包括:采用RNA序列编辑工具Edit Sequence,提取待编辑RNA序列中的某条链或者选中指定序列片段进行编辑,对选中部分片段进行重命名,交换和删除操作来实现;所述RNA序列编辑工具,被集成于Galaxy平台;或者,RNA序列编辑工具,接收用户提交的序列信息和工具操作需求,根据序列数据量大小、工具的运行命令和工具自身配置,分析用户所需资源需求如CPU数量和内存大小,并将资源需求申请和工具运行命令发送给超算互联网调度系统。3.如权利要求1所述的基于超算互联网的RNA结构预测方法,其特征是,对编辑后的RNA序列,进行RNA二级结构预测,得到RNA二级结构预测结果;具体包括:采用RNA二级结构预测工具,对编辑后的RNA序列,进行RNA二级结构预测,得到RNA二级结构预测结果;所述RNA二级结构预测工具,被集成于Galaxy平台;或者,所述RNA二级结构预测工具,被集成于Galaxy平台;具体集成过程包括:创建新的RNA二级结构预测工具的xml文件,并在文件中指定工具ID、名称&lt;tool&gt;、工具描述&lt;description&gt;、输入参数&lt;inputs&gt;、输出参数&lt;outputs&gt;,运行命令&lt;command&gt;、测试用例&lt;tests&gt;以及工具依赖&lt;requirements&gt;;修改工具模块配置文件tool_conf.xml,设置加载工具配置文件的本地路径,使集成的二级结构预测工具加载到web工具栏面板。4.如权利要求1所述的基于超算互联网的RNA结构预测方法,其特征是,基于RNA二级结构文件提取结果和待预测的RNA序列,进行RNA三级结构预测,得到RNA三级结构预测结果;具体包括:基于RNA二级结构文件提取结果和待预测的RNA序列,采用RNA三级结构预测工具,进行RNA三级结构预测,得到RNA三级结构预测结果;所述RNA三级结构预测工具,被集成于Galaxy平台;或者,所述RNA三级结构预测工具,被集成于Galaxy平台;具体集成过程包括:创建新的RNA三级结构预测工具的xml文件,并在文件中指定工具ID、名称&lt;tool&gt;、工具
描述&lt;description&gt;、输入参数&lt;inputs&gt;、输出参数&lt;outputs&gt;,运行命令&lt;command&gt;、测试用例&lt;tests&gt;以及工具依赖&lt;requirements&gt;;修改工具模块配置文件tool_conf.xml,设置加载工具配置文件的本地路径,使集成的三级结构预测工具加载到web工具栏面板。5.如权利要求1所述的基于超算互联网的RNA结构预测方法,其特征是,进行RNA三级结构预测,具体...

【专利技术属性】
技术研发人员:郭浩宇杨超超王嘉祥王继彬潘景山郭猛
申请(专利权)人:山东省计算中心国家超级计算济南中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1