基于云平台的生物信息分析系统、方法及云计算平台系统技术方案

技术编号:20078122 阅读:47 留言:0更新日期:2019-01-15 01:34
本发明专利技术系统,包括客户端、web服务器和云平台计算系统;客户端和web服务器之间通过网络收发信息,web服务器和云平台计算系统之间通过Nginx网页服务器交换数据;云平台web服务器包括生物信息分析请求接口;云平台计算系统包括生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库、Mongo数据库、和若干计算节点;生物信息分析组件从生物信息分析请求接口接收生物信息分析请求及参数,根据参数判读计算类型而由不同对象进行分析;分析结果存到存储服务器,Mysql数据库存储分析记录等,Mongo数据库存储供云平台客户端展示的图表数据,实现分析系统的自动化分析运作。

Bioinformatics Analysis System, Method and Cloud Computing Platform System Based on Cloud Platform

The system of the invention includes client, web server and cloud platform computing system; receiving and receiving information through network between client and web server, exchanging data between web server and cloud platform computing system through Nginx web server; cloud platform web server includes bioinformatics analysis request interface; cloud platform computing system includes bioinformatics analysis application interface, bioinformatics. Analysis components, storage servers, Mysql databases, Mongo databases, and several computing nodes; Bioinformatics analysis components receive bioinformatics analysis requests and parameters from the bioinformatics analysis request interface, and analyze them by different objects according to the calculation type of parameters; Analysis results are stored in storage servers, Mysql databases store analysis records, etc., and Mongo databases store them. Graphic data displayed by the client of cloud platform can realize the automatic analysis operation of the analysis system.

【技术实现步骤摘要】
基于云平台的生物信息分析系统、方法及云计算平台系统
本专利技术涉及一种基于云平台的生物信息分析系统、方法及云计算平台系统,属于生物信息学分析

技术介绍
随着测序技术的快速发展,基因研究机构、医学科研机构和公司产生了海量的生物学测序数据。但是众所周知,实验测序得到的原始数据并不能直接提供有价值的科学研究信息或疾病治疗药物的关联信息,需要利用生物信息学分析技术对这些数据进行计算挖掘,从而给出清晰且易于导出结论的结果信息。生物信息学是在生命科学的研究中以计算机为主要研究工具对生物学数据进行存储和计算分析,面对高通量测序所产生的海量数据,越来越多的研究人员或公司基于高性能计算机集群通过安装各种生物信息分析软件来进行计算分析。生物信息分析过程也是很多软件和程序相互关联,通过不同的步骤方法处理数据后得到最终的分析结果,由于生物信息软件层出不断、更新迭代,每个分析程序参数、文件格式、运行方式各异,研究人员不断的要去研究新的软件方法并在计算机或集群上安装部署都变得十分复杂。海量数据的存储、计算和传输共享也是研究者们快速访问和分析数据中的难点。所以设计构建一种自动化扩展性好的生物信息云计算系统十分必要。
技术实现思路
本专利技术的目的是解决目前生物信息分析软件品类繁多,分析效率低下,自动扩展性差,大规模数据难于存储共享和多样化软件程序构建部署分析流程复杂的技术问题。为实现上述目的及其他相关目的,一方面,本专利技术提供一种基于云平台的生物信息分析系统,包括云平台客户端、云平台web服务器和云平台计算系统;所述云平台客户端和所述云平台web服务器之间通过网络收发信息,所述云平台web服务器和所述云平台计算系统之间通过Nginx网页服务器交换数据;所述云平台web服务器包括生物信息分析请求接口;所述云平台计算系统包括生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库和Mongo数据库;所述云平台计算系统还包括若干计算节点,用于对生物信息进行分析计算;所述生物信息分析请求接口通过所述Nginx网页服务器连接至所述生物信息分析应用接口,所述生物信息分析应用接口的输出端通过工作流进程管理单元连接至所述生物信息分析组件的输入端,所述生物信息分析组件的输出端分别连接至所述存储服务器、Mysql数据库和Mongo数据库;所述生物信息分析请求接口向所述生物信息分析应用接口发出生物信息分析请求并发送参数;所述存储服务器用于存储分析结果数据,所述Mysql数据库用于存储分析记录、状态和日志信息,所述Mongo数据库用于存储供所述云平台客户端展示的图表数据。于本专利技术的一实施例中,所述生物信息分析组件为即时模式分析组件或提交模式分析组件。于本专利技术的一实施例中,所述提交模式分析组件包括分析模块和文件组件;所述分析模块包括若干分析工具,各所述分析工具通过对应的工具代理与工作流进程管理单元进行通信;所述工作流进程管理单元用于将不同的分析任务调度给不同的所述分析模块;所述文件组件用于使分析结果形成通用的生物信息数据格式。于本专利技术的一实施例中,所述工作流进程管理单元通过slurm系统进行任务调度。于本专利技术的一实施例中,所述工作流进程管理单元,用于启动和管理生物分析工作流运行,监听接收所述生物信息分析应用接口接收到的生物信息分析请求及参数,根据所述参数判读是即时计算类型还是投递计算类型,同时开启一个进程运行工作流api,并将参数传递给对应的生物分析工作流;若为即时计算类型,则直接在专用即时计算服务器上运行生物信息分析工作流;若为投递计算类型,则将参数传递至计算节点上运行生物信息分析工作流。于本专利技术的一实施例中,所述工作流进程管理单元,用于在判断是投递计算类型的情况下,在获取参数后,按照内部预先定义的逻辑关系,将参数传递到生物信息分析组件的各分析模块,触发各分析模块的运行,各分析模块之间通过协程监听互相有依赖关系的分析模块的运行状态,以各分析模块中的各分析工具为最小级别分析组件,将各分析工具通过slurm投递到计算节点开始计算分析,同时不断监听和接收分析的状态。于本专利技术的一实施例中,所述运行当中会按照各生物信息分析组件自身的特性动态配置计算资源。为实现上述目的及其他相关目的,另一方面,本专利技术提供一种基于云平台的生物信息分析方法,包括如下步骤:在客户端输入用于分析的参数并向web服务器发出分析请求消息;通过Nginx网页服务器接收请求消息后转发至生物信息分析应用接口,解析参数;判读所述参数为即时计算类型还是投递计算类型;若为即时计算类型,则直接在专用即时计算服务器上运行生物信息分析工作流;若为投递计算类型,则将参数传递至计算节点服务器上运行生物信息分析工作流;将生成的结果数据上传到云平台的存储服务器和mongo数据库;将生物信息分析工作流的运行状态实时存入Mysql数据库;向web服务器返回分析成功的消息,web服务器从mongo数据库获取结果提供给客户端。于本专利技术的一实施例中,所述投递计算类型的分析工作流如下:工作流进程管理单元获取参数后,按照内部预先定义的逻辑关系,将参数传递到生物信息分析组件的各分析模块,触发各分析模块的运行,各分析模块之间通过协程监听互相有依赖关系的分析模块的运行状态,以各分析模块中的各分析工具为最小级别分析组件,将各分析工具通过slurm投递到计算节点开始计算分析,同时不断监听和接收分析的状态。于本专利技术的一实施例中,所述运行当中会按照各生物信息分析组件自身的特性动态配置计算资源。为实现上述目的及其他相关目的,再一方面,本专利技术提供一种云计算平台系统,连接于云平台web服务器;所述云平台客户端和所述云平台web服务器之间通过网络收发信息,所述云平台web服务器和所述云平台计算系统之间通过Nginx网页服务器交换数据,所述云平台web服务器包括生物信息分析请求接口;所述云计算平台系统包括:生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库和Mongo数据库;所述云平台计算系统还包括若干计算节点,用于对生物信息进行分析计算;所述生物信息分析请求接口通过所述Nginx网页服务器连接至所述生物信息分析应用接口,所述生物信息分析应用接口的输出端通过工作流进程管理单元连接至所述生物信息分析组件的输入端,所述生物信息分析组件的输出端分别连接至所述存储服务器、Mysql数据库和Mongo数据库;所述生物信息分析请求接口向所述生物信息分析应用接口发出生物信息分析请求并发送参数。于本专利技术的一实施例中,所述生物信息分析组件为即时模式分析组件或提交模式分析组件。于本专利技术的一实施例中,所述提交模式分析组件包括分析模块和文件组件;所述分析模块包括若干分析工具,各所述分析工具通过对应的工具代理与工作流进程管理单元进行通信;所述工作流进程管理单元用于将不同的分析任务调度给不同的所述分析模块;所述文件组件用于使分析结果形成通用的生物信息数据格式。于本专利技术的一实施例中,所述工作流进程管理单元通过slurm系统进行任务调度。于本专利技术的一实施例中,所述工作流进程管理单元,用于启动和管理生物分析工作流运行,监听接收所述生物信息分析应用接口接收到的生物信息分析请求及参数,根据所述参数判读是即时计算类型还是投递计算类型,同时开启一个进程运行工本文档来自技高网...

【技术保护点】
1.一种基于云平台的生物信息分析系统,其特征在于,包括云平台客户端、云平台web服务器和云平台计算系统;所述云平台客户端和所述云平台web服务器之间通过网络收发信息,所述云平台web服务器和所述云平台计算系统之间通过Nginx网页服务器交换数据;所述云平台web服务器包括生物信息分析请求接口;所述云平台计算系统包括生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库和Mongo数据库;所述云平台计算系统还包括若干计算节点,用于对生物信息进行分析计算;所述生物信息分析请求接口通过所述Nginx网页服务器连接至所述生物信息分析应用接口,所述生物信息分析应用接口的输出端通过工作流进程管理单元连接至所述生物信息分析组件的输入端,所述生物信息分析组件的输出端分别连接至所述存储服务器、Mysql数据库和Mongo数据库;所述生物信息分析请求接口向所述生物信息分析应用接口发出生物信息分析请求并发送参数;所述存储服务器用于存储分析结果数据,所述Mysql数据库用于存储分析记录、状态和日志信息,所述Mongo数据库用于存储供所述云平台客户端展示的图表数据。

【技术特征摘要】
2017.07.21 CN 20171059833281.一种基于云平台的生物信息分析系统,其特征在于,包括云平台客户端、云平台web服务器和云平台计算系统;所述云平台客户端和所述云平台web服务器之间通过网络收发信息,所述云平台web服务器和所述云平台计算系统之间通过Nginx网页服务器交换数据;所述云平台web服务器包括生物信息分析请求接口;所述云平台计算系统包括生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库和Mongo数据库;所述云平台计算系统还包括若干计算节点,用于对生物信息进行分析计算;所述生物信息分析请求接口通过所述Nginx网页服务器连接至所述生物信息分析应用接口,所述生物信息分析应用接口的输出端通过工作流进程管理单元连接至所述生物信息分析组件的输入端,所述生物信息分析组件的输出端分别连接至所述存储服务器、Mysql数据库和Mongo数据库;所述生物信息分析请求接口向所述生物信息分析应用接口发出生物信息分析请求并发送参数;所述存储服务器用于存储分析结果数据,所述Mysql数据库用于存储分析记录、状态和日志信息,所述Mongo数据库用于存储供所述云平台客户端展示的图表数据。2.如权利要求1所述的基于云平台的生物信息分析系统,其特征在于,所述生物信息分析组件为即时模式分析组件或提交模式分析组件。3.如权利要求2所述的基于云平台的生物信息分析系统,其特征在于,所述提交模式分析组件包括分析模块和文件组件;所述分析模块包括若干分析工具,各所述分析工具通过对应的工具代理与所述工作流进程管理单元进行通信;所述工作流进程管理单元用于将不同的分析任务调度给不同的所述分析模块;所述文件组件用于使分析结果形成通用的生物信息数据格式。4.如权利要求3所述的基于云平台的生物信息分析系统,其特征在于,所述工作流进程管理单元通过slurm系统进行任务调度。5.如权利要求3所述的基于云平台的生物信息分析系统,其特征在于,所述工作流进程管理单元,用于启动和管理生物分析工作流运行,监听接收所述生物信息分析应用接口接收到的生物信息分析请求及参数,根据所述参数判读是即时计算类型还是投递计算类型,同时开启一个进程运行工作流api,并将参数传递给对应的生物分析工作流;若为即时计算类型,则直接在专用即时计算服务器上运行生物信息分析工作流;若为投递计算类型,则将参数传递至计算节点上运行生物信息分析工作流。6.如权利要求5所述的基于云平台的生物信息分析系统,其特征在于,所述工作流进程管理单元,用于在判断是投递计算类型的情况下,在获取参数后,按照内部预先定义的逻辑关系,将参数传递到生物信息分析组件的各分析模块,触发各分析模块的运行,各分析模块之间通过协程监听互相有依赖关系的分析模块的运行状态,以各分析模块中的各分析工具为最小级别分析组件,将各分析工具通过slurm投递到计算节点开始计算分析,同时不断监听和接收分析的状态。7.如权利要求6所述的基于云平台的生物信息分析系统,其特征在于,所述运行当中会按照各生物信息分析组件自身的特性动态配置计算资源。8.一种基于云平台的生物信息分析方法,其特征在于,包括如下步骤:在客户端输入用于分析的参数并向web服务器发出分析请求消息;通过Nginx网页服务器接收请求消息后转发至生物信息分析应用接口,解析参数;判读所述参数为即时计算类型还是投递计算类型;若为即时计算类型,则直接在专用即时计算服务器上运行生物信息分析工作流;若为投递计算类型,则将参数传递至计算节点服务器上运行生物信息分析工作流;将生...

【专利技术属性】
技术研发人员:郭权余果任一张磊周勇张祥林黄华生
申请(专利权)人:上海桑格信息技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利