一种基于高通量测序数据的计算流程调度系统技术方案

技术编号:30433756 阅读:27 留言:0更新日期:2021-10-24 17:30
本发明专利技术实施例提供一种基于高通量测序数据的计算流程调度系统,采用微服务架构,整合多种计算资源、Cromwell调度引擎,实现分析任务的有效调度,并在此基础上与App规范以及为App分发复用而定制开发的App Store相结合,实现App的高效开发、测试、复用以及完成多组学数据的分析。通过Pipeline分析过程管理模块,将整个分析过程中涉及的参数和文件等通过版本控制工具,进行有效的管理,为后续项目溯源、Bug排查、数据分析复现等提供可靠的基础;极大简化了生物信息数据分析流程,实现了分析流程的可控,可复用,可溯源,应用场景较为广泛。应用场景较为广泛。应用场景较为广泛。

【技术实现步骤摘要】
一种基于高通量测序数据的计算流程调度系统


[0001]本专利技术实施例涉及计算机
,尤其涉及一种基于高通量测序数据的计算流程调度系统。

技术介绍

[0002]精准医学是将个体疾病的组学信息用于指导其诊断或治疗的医学。随着高通量测序技术的不断发展,在生命科学领域积累了大量组学数据,为精准医学提供了坚实的基础。
[0003]目前如全转录组测序、全外显子组测序、全基因组测序等高通量测序技术都有相应的标准分析流程。通常情况下,默认相同的数据使用相同的分析流程得到相同的计算结果。然而,事实并非如此,计算流程中存在的诸多问题如软件版本号、配置环境等不同均会导致计算结果的不可重复。计算结果的不可重复对精准医学的发展和应用造成严重影响。

技术实现思路

[0004]本专利技术实施例提供一种基于高通量测序数据的计算流程调度系统,将计算流程统一管理,并解决计算结果不可重复这一问题。
[0005]第一方面,本专利技术实施例提供一种基于高通量测序数据的计算流程调度系统,包括计算层、调度层、管理层和应用层;
>[0006]所述计本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于高通量测序数据的计算流程调度系统,其特征在于,包括计算层、调度层、管理层和应用层;所述计算层用于创建、管理目标项目所需的容器引擎、管理工具和存储库;所述调度层用于基于计算流程定义语言WDL的语言解析与任务调度引擎;所述管理层用于管理计算流程管理模块、作业管理模块、数据管理模块、通知管理模块、软件版本控制模块和溯源管理模块;所述应用层用于面向用户使用的操作界面与命令行。2.根据权利要求1所述的基于高通量测序数据的计算流程调度系统,其特征在于,所述计算层包括Docker容器、软件包管理工具以及Docker镜像仓库;所述Docker容器用于将目标项目所需部分打包,并发布为Docker镜像;其中目标项目所需部分包括分析软件、软件依赖、系统设置与系统库;所述软件包管理工具用于追踪计算环境中使用的不同软件包及其版本,自动分析待安装软件的依赖关系,将所有软件依赖的库等安装到独立的目录环境;所述Docker镜像仓库用于存储所述Docker容器发布的Docker镜像。3.根据权利要求2所述的基于高通量测序数据的计算流程调度系统,其特征在于,所述Docker镜像仓库中的Docker镜像可被用户查看,并用于复现镜像制作打包的环境。4.根据权利要求1所述的基于高通量测序数据的计算流程调度系统,其特征在于,所述计算流程定义语言为预先制定的用于生物信息流程分析的定制语言。5.根据权利要求1所述的基于高通量测序数据的计算流程调度系统,其特征在于,所述任务调度引擎连接所述管理层和所述计算层,进行目标项目相关业务流程的推进和过程监控...

【专利技术属性】
技术研发人员:杨竞成宋越强黄业超冉子涵
申请(专利权)人:粤港澳大湾区精准医学研究院广州
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1