基于云平台的生物信息分析系统技术方案

技术编号:16365697 阅读:92 留言:0更新日期:2017-10-10 21:47
本发明专利技术公开了一种基于云平台的生物信息分析系统,包括云平台客户端、云平台web服务器和云平台计算系统,云平台客户端和云平台web服务器之间通过网络收发信息,云平台web服务器和云平台计算系统通过Nginx网页服务器交换数据;云平台web服务器包括生物信息分析请求接口,云平台计算系统包括生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库和Mongo数据库;生物信息分析请求接口通过Nginx网页服务器连接至生物信息分析应用接口,生物信息分析应用接口的输出端通过工作流进程管理单元连接至生物信息分析组件。本发明专利技术的分析程序模块化,可组合复用,分析效率大为提高,部署方便。

Bioinformatics analysis system based on cloud platform

The invention discloses a biological information analysis system based on cloud platform, cloud computing system including client platform, cloud platform web server and cloud platform, through the network to send and receive messages between the client and cloud platform cloud platform cloud platform web server, web server and cloud computing platform through the Nginx web server exchange data; cloud platform web the server includes biological information analysis request interface, cloud computing system includes biological information analysis of biological information analysis module, application interface, storage server, Mysql database and Mongo database; bioinformatics analysis request interface application interface connected to the biological information through the Nginx web server and application interface of biological information analysis of the output end through the workflow process management unit connection to analyze the biological information component. The analysis program of the invention is modularized and can be assembled and reused, and the analysis efficiency is improved greatly, and the deployment is convenient.

【技术实现步骤摘要】
基于云平台的生物信息分析系统
本专利技术涉及一种基于云平台的生物信息分析系统,属于生物信息学分析

技术介绍
随着测序技术的快速发展,基因研究机构、医学科研机构和公司产生了海量的生物学测序数据。但是众所周知,实验测序得到的原始数据并不能直接提供有价值的科学研究信息或疾病治疗药物的关联信息,需要利用生物信息学分析技术对这些数据进行计算挖掘,从而给出清晰且易于导出结论的结果信息。生物信息学是在生命科学的研究中以计算机为主要研究工具对生物学数据进行存储和计算分析,面对高通量测序所产生的海量数据,越来越多的研究人员或公司基于高性能计算机集群通过安装各种生物信息分析软件来进行计算分析。生物信息分析过程也是很多软件和程序相互关联,通过不同的步骤方法处理数据后得到最终的分析结果,由于生物信息软件层出不断、更新迭代,每个分析程序参数、文件格式、运行方式各异,研究人员不断的要去研究新的软件方法并在计算机或集群上安装部署都变得十分复杂。海量数据的存储、计算和传输共享也是研究者们快速访问和分析数据中的难点。所以设计构建一种自动化扩展性好的生物信息云计算系统十分必要。
技术实现思路
本专利技术的目的是解决目前生物信息分析软件品类繁多,分析效率低下,自动扩展性差,大规模数据难于存储共享和多样化软件程序构建部署分析流程复杂的技术问题。为实现以上专利技术目的,一方面,本专利技术提供一种基于云平台的生物信息分析系统,包括云平台客户端、云平台web服务器和云平台计算系统;所述云平台客户端和所述云平台web服务器之间通过网络收发信息,所述云平台web服务器和所述云平台计算系统之间通过Nginx网页服务器交换数据;所述云平台web服务器包括生物信息分析请求接口;所述云平台计算系统包括生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库和Mongo数据库;所述云平台计算系统还包括若干计算节点,用于对生物信息进行分析计算;所述生物信息分析请求接口通过所述Nginx网页服务器连接至所述生物信息分析应用接口,所述生物信息分析应用接口的输出端通过工作流进程管理单元连接至所述生物信息分析组件的输入端,所述生物信息分析组件的输出端分别连接至所述存储服务器、Mysql数据库和Mongo数据库;所述生物信息分析请求接口向所述生物信息分析应用接口发出生物信息分析请求并发送参数;所述存储服务器用于存储分析结果数据,所述Mysql数据库用于存储分析记录、状态和日志信息,所述Mongo数据库用于存储供所述云平台客户端展示的图表数据。进一步地,所述生物信息分析组件为即时模式分析组件或提交模式分析组件。进一步地,所述提交模式分析组件包括工作流进程管理单元、分析模块和文件组件;所述分析模块包括若干分析工具,各所述分析工具通过对应的工具代理与所述工作流进程管理单元进行通信;所述工作流进程管理单元用于将不同的分析任务调度给不同的所述分析模块;所述文件组件用于使分析结果形成通用的生物信息数据格式。进一步地,所述工作流进程管理单元通过slurm系统进行任务调度。另一方面,本专利技术提供一种基于云平台的生物信息分析方法,包括如下步骤:在客户端输入用于分析的参数并向web服务器发出分析请求消息;通过Nginx网页服务器接收请求消息后转发至生物信息分析应用接口,解析参数;判读所述参数为即时计算型还是投递计算型;若为即时计算型,则直接在专用即时计算服务器上运行生物信息分析工作流;若为投递计算型,则将参数传递至计算节点服务器上运行生物信息分析工作流;将生成的结果数据上传到云平台的存储服务器和mongo数据库;将生物信息分析工作流的运行状态实时存入Mysql数据库;向web服务器返回分析成功的消息,web服务器从mongo数据库获取结果提供给客户端。进一步地,所述投递计算型的分析工作流如下:工作流进程管理单元获取参数后,按照内部预先定义的逻辑关系,将参数传递到生物信息分析组件的各分析模块,触发各分析模块的运行,各分析模块之间通过协程监听互相有依赖关系的分析模块的运行状态,以各分析模块中的各分析工具为最小级别分析组件,将各分析工具通过slurm投递到计算节点开始计算分析,同时不断监听和接收分析的状态。与现有技术相比,本专利技术的有益效果是:本专利技术的分析程序模块化,可组合复用,具有扩展性好的以自动化工作流运行的系统框架,解决了大规模数据难于存储共享和多样化软件程序构建部署分析流程复杂的技术问题,分析效率大为提高,部署方便。附图说明图1是本专利技术系统的原理框图;图2是生物信息分析组件的一个实施例原理框图;图3是本专利技术方法的流程图。图中,云平台客户端1;云平台web服务器2;生物信息分析请求接口21;云平台计算系统3;生物信息分析应用接口31;生物信息分析组件32;分析模块322;工具代理3221;分析工具3222;文件组件323;存储服务器33;Mysql数据库34;Mongo数据库35;工作流进程管理单元36;计算节点3701、3702…;Nginx网页服务器4。具体实施方式下面结合附图和具体实施例对本专利技术作进一步说明。实施例1如图1所示,本专利技术的基于云平台的生物信息分析系统,包括云平台客户端1、云平台web服务器2和云平台计算系统3;云平台客户端1和所述云平台web服务器2之间通过网络收发信息,云平台web服务器2和所述云平台计算系统3之间通过Nginx网页服务器4交换数据;云平台web服务器2包括生物信息分析请求接口21;云平台计算系统3包括生物信息分析应用接口31、生物信息分析组件32、存储服务器33、Mysql数据库34和Mongo数据库35;云平台计算系统3还包括若干计算节点3701、3702等,用于对生物信息进行分析计算;云平台计算系统3包含有分析各种不同生物信息的大规模计算节点,不同的分析组件被投递到计算节点对生物信息进行分析计算;生物信息分析请求接口21通过Nginx网页服务器4连接至生物信息分析应用接口31,生物信息分析应用接口31的输出端通过工作流进程管理单元(WPM)36连接至生物信息分析组件32的输入端,生物信息分析组件32的输出端分别连接至存储服务器33、Mysql数据库34和Mongo数据库35,Mysql数据库34和Mongo数据库35的输出端分别通过Nginx网页服务器4连接至云平台web服务器2;生物信息分析请求接口21向生物信息分析应用接口31发出生物信息分析请求并发送参数;存储服务器33用于存储分析结果数据,Mysql数据库34用于存储分析记录、状态和日志信息,Mongo数据库35用于存储供云平台客户端1展示的图表数据。优选地,生物信息分析组件32为即时模式分析组件或提交模式分析组件。优选地,如图2所示,提交模式分析组件32包括分析模块322和文件组件323;分析模块322包括若干分析工具3222,各分析工具3222通过对应的工具代理3221与工作流进程管理单元36进行通信;不同的生物信息分析任务由不同功能的分析工具被投递到单个或多个计算节点完成分析计算;工作流进程管理单元36用于将不同的分析任务调度给不同的分析模块222;文件组件323用于使分析结果形成通用的生物信息数据格式并进行格式检查。优选地,工作流进程管理单元36通过slurm系统进行任务本文档来自技高网...
基于云平台的生物信息分析系统

【技术保护点】
基于云平台的生物信息分析系统,其特征在于,包括云平台客户端、云平台web服务器和云平台计算系统;所述云平台客户端和所述云平台web服务器之间通过网络收发信息,所述云平台web服务器和所述云平台计算系统之间通过Nginx网页服务器交换数据;所述云平台web服务器包括生物信息分析请求接口;所述云平台计算系统包括生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库和Mongo数据库;所述云平台计算系统还包括若干计算节点,用于对生物信息进行分析计算;所述生物信息分析请求接口通过所述Nginx网页服务器连接至所述生物信息分析应用接口,所述生物信息分析应用接口的输出端通过工作流进程管理单元连接至所述生物信息分析组件的输入端,所述生物信息分析组件的输出端分别连接至所述存储服务器、Mysql数据库和Mongo数据库;所述生物信息分析请求接口向所述生物信息分析应用接口发出生物信息分析请求并发送参数;所述存储服务器用于存储分析结果数据,所述Mysql数据库用于存储分析记录、状态和日志信息,所述Mongo数据库用于存储供所述云平台客户端展示的图表数据。

【技术特征摘要】
1.基于云平台的生物信息分析系统,其特征在于,包括云平台客户端、云平台web服务器和云平台计算系统;所述云平台客户端和所述云平台web服务器之间通过网络收发信息,所述云平台web服务器和所述云平台计算系统之间通过Nginx网页服务器交换数据;所述云平台web服务器包括生物信息分析请求接口;所述云平台计算系统包括生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库和Mongo数据库;所述云平台计算系统还包括若干计算节点,用于对生物信息进行分析计算;所述生物信息分析请求接口通过所述Nginx网页服务器连接至所述生物信息分析应用接口,所述生物信息分析应用接口的输出端通过工作流进程管理单元连接至所述生物信息分析组件的输入端,所述生物信息分析组件的输出端分别连接至所述存储服务器、Mysql数据库和Mongo数据库;所述生物信息分析请求接口向所述生物信息分析应用接口发出生物信息分析请求并发送参数;所述存储服务器用于存储分析结果数据,所述Mysql数据库用于存储分析记录、状态和日志信息,所述Mongo数据库用于存储供所述云平台客户端展示的图表数据。2.如权利要求1所述的基于云平台的生物信息分析系统,其特征在于,所述生物信息分析组件为即时模式分析组件或提交模式分析组件。3.如权利要求2所述的基于云平台的生物信息分析系统,其特征在于,所述提交模式分析组件包括工作流进程管理单元、分析模块和文件组件;所述分析模块包括若干分析工具,各所述分析工具通过对应的...

【专利技术属性】
技术研发人员:郭权余果任一张磊周勇张祥林黄华生
申请(专利权)人:上海桑格信息技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1