生物信息分析工具的制作方法、装置及可存储介质制造方法及图纸

技术编号:20330331 阅读:24 留言:0更新日期:2019-02-13 06:29
本发明专利技术公开了一种生物信息分析工具的制作方法、装置及可存储介质。其中方法包括解析一生物信息的分析流程,建立至少两个相互独立的分析步骤及任意分析步骤的实施次序;根据分析步骤配置分析模块及分析模块的输入数据流、输出数据流及参数文件;配置分析模块实施分析步骤的执行程序;在实施次序中相邻的两个分析模块之间,配置在先次序的分析模块的输出数据流与在后次序的分析模块的输入数据流具有同一接口标准,根据不同的接口标准建立所有分析模块的交互链接及执行顺序。根据分析模块的执行程序、参数文件,以及任意分析模块的交互链接、执行顺序制作生物信息分析工具。本发明专利技术能够快捷、高效的建立具有良好复用性的模块化生物信息分析工具。

【技术实现步骤摘要】
生物信息分析工具的制作方法、装置及可存储介质
本专利技术涉及生物信息技术分析领域,具体而言,涉及一种生物信息分析工具的制作方法、装置及可存储介质。
技术介绍
随着测序技术的发展,相关测序数据正在以超莫尔定律的速率增长,服务测序数据的生物信息软件被广泛开发。由于需要处理的测序数据较多,造成当前生物信息软件的业务流程及源码的实现质量较差;那么,提供具有良好的可读性、复用性及可移植性的生物信息分析工具十分重要。
技术实现思路
本专利技术实施例至少提供一种生物信息分析工具的制作方法,能够根据不同的生物信息快捷、高效的建立具有良好复用性的分析工具。上述实施例的具体实现,如下所述。所述方法包括:解析一生物信息的分析流程,建立至少两个相互独立的分析步骤及任意所述分析步骤的实施次序;根据所述分析步骤配置分析模块及所述分析模块的输入数据流、输出数据流及参数文件;配置所述分析模块实施所述分析步骤的执行程序;在所述实施次序中相邻的两个所述分析模块之间,配置在先次序的分析模块的输出数据流与在后次序的分析模块的输入数据流具有同一接口标准,根据不同的所述接口标准建立所有分析模块的交互链接及执行顺序。根据所述分析模块的执行程序、参数文件,以及所有所述分析模块的交互链接、执行顺序制作所述生物信息分析工具。在本实施例中较佳方案是,根据所述分析流程分别建立若干独立的所述实施次序。在本实施例中较佳方案是,所述输入数据流至少包括原始数据、样本名称、接头信息及日志文件中的一种或多种;在本实施例中较佳方案是,所述输出数据流至少包括输出路径和/或缓存路径。在本实施例中较佳方案是,所述参数文件为存储在所述分析模块中config接口的建库类型、最小长度及滑动窗口尺寸中的一种或多种。在本实施例中较佳方案是,所述方法包括:解析一生物信息的分析流程,建立至少两个相互独立的分析步骤及任意所述分析步骤的实施次序;根据所述分析步骤配置分析模块及所述分析模块的输入数据流、输出数据流及参数文件;应用nextflow根据任意所述分析模块之间的实施次序建立一工作流程框架;在所述工作流程框架内分别匹配不同分析模块的process;根据所述分析步骤配置实施所述的process的nextflow脚本程序;根据参数文件在所述process的config接口设置实施参数;在所述process根据输入数据流配置input,根据输出数据流配置配置output,在实施次序相邻的两个process之间,配置在先次序的process的output与在后次序的process的input具有相同接口标准;根据接口标准相同的input及output建立任意两个所述process之间的交互链接及执行顺序;根据所述工作流程框架包括的所述process、所述process配置的执行程序及实施参数、任意所述process的交互连接及执行顺序制作所述生物信息分析工具。本专利技术实施例另公开一种可存储介质,用于存储指令,其特征在于,所述指令被处理器执行时实现上述步骤。本专利技术实施例另公开一种生物信息分析工具的制作装置,所述装置包括:解析模块,解析一生物信息的分析流程,建立至少两个相互独立的分析步骤及任意所述分析步骤的实施次序;根据所述分析步骤配置分析模块及所述分析模块的输入数据流、输出数据流及参数文件;制作模块,应用nextflow根据任意所述分析模块之间的实施次序建立一工作流程框架;在所述工作流程框架内分别匹配不同分析模块的process;根据所述分析步骤配置实施所述的process的nextflow脚本程序;根据参数文件在所述process的config接口设置实施参数;在所述process根据输入数据流配置input,根据输出数据流配置配置output,在实施次序相邻的两个process之间,配置在先次序的process的output与在后次序的process的input具有相同接口标准;根据接口标准相同的input及output建立任意两个所述process之间的交互链接及执行顺序;封装模块,根据所述工作流程框架包括的所述process、所述process配置的执行程序及实施参数、任意所述process的交互连接及执行顺序制作所述生物信息分析工具。针对上述方案,本专利技术通过以下参照附图对公开的示例性实施例作详细描述,亦使本专利技术实施例的其它特征及其优点清楚。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为实施例方法的流程图;图2为实施例装置的结构图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本实施例提供一种生物信息分析工具的制作方法。通过本实施例的方法,本实施例将对生物信息的分析流程进行分解,使一个体量较大的执行程序事实上按照对生物信息的分析步骤分割成不同的若干个分析模块;分析模块之间相对独立且功能单一,能够单独运行执行程序,易于管理和使用。不同分析模块之间,仅需要应用如nextflow并结合分析流程对不同分析模块通过定义接口类型进行粘结,实现分析模块的连续。为了实现上述内容,请参考图1。本实施例以对mRNA进行数据分析为例制作模块化的生物信息分析工具,具体包括:Step100、解析对mRNA实施数据分析的分析流程为数质控(QC)、基因组比对(Mapping)、定量(Quantify)、差异分析(Diff)、可变剪切(AS)、变异检测(SNV)及功能富集(GO/KEGG)等独立的分析步骤及分析步骤之间的实施次序。Step210、根据上述分析步骤分别建立匹配QC、Mapping、AS、Quantify、SNV、Diff及GO/KEGG等分析步骤的分析模块。Step220、根据分析步骤对数据的输入、加工及输出,在分析模块配置config接口及抽象的输入数据流、输出数据流及其他参数。例如,QC分析模块的config接口对应的输入数据流至少包括原始数据、样本名称、接头信息及日志文件,输出数据流至少包括输出路径、缓存路径,其他参数至少包括建库类型、最小长度以及滑动窗口尺寸等。Step310、应用生物信息流程定制工具nextflow建立一工作流程框架并在工作流框架内根据每个分析模块建立独立的process。nextflow主要是通过定义输入及输出的接口标准,把不同的实施项目即process连接起来,从而实现对生物信息进行数据分析的分析流程。Step320、配置实现process的nextflow脚本,至少包括执行器、环境变量及流程参数等。本文档来自技高网...

【技术保护点】
1.一种生物信息分析工具的制作方法,其特征在于,所述方法包括:解析一生物信息的分析流程,建立至少两个相互独立的分析步骤及任意所述分析步骤的实施次序;根据所述分析步骤配置分析模块及所述分析模块的输入数据流、输出数据流及参数文件;配置所述分析模块实施所述分析步骤的执行程序;在所述实施次序中相邻的两个所述分析模块之间,配置在先次序的分析模块的输出数据流与在后次序的分析模块的输入数据流具有同一接口标准,根据不同的所述接口标准建立所有分析模块的交互链接及执行顺序。根据所述分析模块的执行程序、参数文件,以及所有所述分析模块的交互链接、执行顺序制作所述生物信息分析工具。

【技术特征摘要】
1.一种生物信息分析工具的制作方法,其特征在于,所述方法包括:解析一生物信息的分析流程,建立至少两个相互独立的分析步骤及任意所述分析步骤的实施次序;根据所述分析步骤配置分析模块及所述分析模块的输入数据流、输出数据流及参数文件;配置所述分析模块实施所述分析步骤的执行程序;在所述实施次序中相邻的两个所述分析模块之间,配置在先次序的分析模块的输出数据流与在后次序的分析模块的输入数据流具有同一接口标准,根据不同的所述接口标准建立所有分析模块的交互链接及执行顺序。根据所述分析模块的执行程序、参数文件,以及所有所述分析模块的交互链接、执行顺序制作所述生物信息分析工具。2.如权利要求1所述的生物信息分析工具的制作方法,其特征在于,根据所述分析流程分别建立若干独立的所述实施次序。3.如权利要求1所述的生物信息分析工具的制作方法,其特征在于,所述输入数据流至少包括原始数据、样本名称、接头信息及日志文件中的一种或多种。4.如权利要求1所述的生物信息分析工具的制作方法,其特征在于,所述输出数据流至少包括输出路径和/或缓存路径。5.如权利要求1所述的生物信息分析工具的制作方法,其特征在于,所述参数文件为存储在所述分析模块中config接口的建库类型、最小长度及滑动窗口尺寸中的一种或多种。6.如权利要求1所述的生物信息分析工具的制作方法,其特征在于,所述方法包括:解析一生物信息的分析流程,建立至少两个相互独立的分析步骤及任意所述分析步骤的实施次序;根据所述分析步骤配置分析模块及所述分析模块的输入数据流、输出数据流及参数文件;应用nextflow根据任意所述分析模块之间的实施次序建立一工作流程框架;在所述工作流程框架内分别匹配不同分析模块的process;根据所述分析步骤配置实施所述的process的nextflow脚本程序;根据参数文件在所述process的config接口设置实施参数;在所...

【专利技术属性】
技术研发人员:袁晓辉付玉华李东野
申请(专利权)人:武汉古奥基因科技有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1