测序数据分析工作站系统技术方案

技术编号:10967161 阅读:112 留言:0更新日期:2015-01-28 19:18
一种高整合度的测序数据分析工作站系统,由主机,输入输出单元组成。所述的主机由系统模块、电源管理模块、并行流处理器以及高速存储设备组成。使用全图形操作界面,用户所有操作均可以通过图形界面完成,避免记忆旧式的繁琐命令以及脚本和程序开发方式,具有快速简便的测序分析功能,能够为用户提供本地化、定制化且方便快捷的测序分析功能及报告功能。

【技术实现步骤摘要】
【专利摘要】一种高整合度的测序数据分析工作站系统,由主机,输入输出单元组成。所述的主机由系统模块、电源管理模块、并行流处理器以及高速存储设备组成。使用全图形操作界面,用户所有操作均可以通过图形界面完成,避免记忆旧式的繁琐命令以及脚本和程序开发方式,具有快速简便的测序分析功能,能够为用户提供本地化、定制化且方便快捷的测序分析功能及报告功能。【专利说明】测序数据分析工作站系统
本技术涉及一种用于测序数据分析的工作站系统。
技术介绍
基因是遗传的物质基础。生物体的生老病死等一切生命现象都与基因有关。基因测序是解读生命的一种途径,随着第二代及第三代高通量测序技术的发展,测序结果往往是TB级别甚至更大的的序列数据。合理分析解读这些大规模及高维度的数据成为获取数据后一个更大的难点,是当前生物研究的关键步骤,具有巨大的现实意义。 海量高通量测序数据的存储、处理和分析都极大地挑战着当前的计算机系统和计算模式。现有的系统面临运算量不够,人工干预可靠度较低,云架构对底层硬件控制力较低及用户隐私担忧等问题。 因此,现有的大数据测序信息对数据分析工具的挑战需要存储、管理、传输、调度和计算分析全面协调,需要生物领域、计算机领域、数据统计分析等多方密切配合,长久积累深入,针对高通量测序数据及其分析使用特点,才能开发出更高效实用的系统模式。
技术实现思路
本技术的目的是提供一种高整合度的测序数据分析工作站系统。 所述的测序数据分析工作站系统由主机,输入输出单元组成。 所述主机可以工作在单节点模式下,也可以根据运算需求进行平滑弹性扩容。 所述的主机由系统模块、电源管理模块、并行流处理器以及高速存储设备组成。 所述的系统模块由高性能处理器及大容量内存组成,用于支撑操作系统及基础数据交换,电源管理模块用于优化系统功耗; 所述的并行流处理器采用为科学运算流处理器,单位运算能力功耗比高于18.05TFlops/sKwo匹配使用专门针对流处理器的测序数据优化算法,实现对测序数据的匹配及运算等处理,在相同条件下对测序数据处理能力是传统组装工具的5倍以上。 所述的高速存储设备以ssd作为关键数据缓存,辅以大容量存储设备进行海量存储。 所述的测序数据,直接来源于illumina公司的Hiseq系列的测序仪、ThermoFisher公司的PGM及Proton系列测序仪,数据级别为Mb?Gb大小,基础长度10?lOOObp,数据格式为FastQ或SFF格式。 所述的存储设备内置完整的人类及微生物基因数据库,与系统模块无缝衔接。根据用户需求调整数据库类型,本地化的内置数据库将大大减少用户的数据上传和下载时间,并同时减少用户数据泄密的风险。 所述的输入单元可以是直接输入数据源的外接硬盘,也可以使用千兆以太网卡进行直接数据传输,或是可以直接偶联测序仪的输出单元。 所述的输出单元包括具备单一显示功能的显示单元、或是集成了人机交互功能的显示单元、或是直接输出结果报告的显示单元、或是千兆以太网直接输出三种方式。 工作站系统使用全图形操作界面,用户所有操作均可以通过图形界面完成,避免记忆旧式的繁琐命令以及脚本和程序开发方式。通过可视化图形开发环境创建业务和工作流可以大大简化用户的应用创建成本。主机平台提供整个应用产品生命周期管理,供用户使用。 本技术所述的工作站系统设计结构紧凑,高度整合各个功能模块后,整个测序数据分析的工作站系统具有快速简便的测序分析功能,能够为用户提供本地化、定制化且方便快捷的测序分析功能及报告功能。 【专利附图】【附图说明】 图1、测序数据分析工作站系统主机结构示意图。 【具体实施方式】 实施例1 测序数据分析工作站系统,该系统由主机,显示输出设备,输入设备组成。 附图1所示的主机,由系统模块(1)、电源管理模块(3)、并行流处理器⑵以及高速存储设备(4)组成。针对二代测序的大数据实现复原、分析、及统计等功能。所述的系统模块用于支撑操作系统及基础数据交换,电源管理模块用于优化系统功耗,并行流处理器实现对测序数据的匹配及运算等处理,所述的流处理器单位运算能力功耗比大于18.05TFlops/sKw,优选采用Tesla系列科学运算流处理器,匹配使用专门开发的针对流处理器的测序数据优化算法,在相同条件下对测序数据处理能力是传统组装工具的5倍以上。使用高速ssd作为关键数据缓存,辅以大容量存储设备进行海量存储。 所述的输出单元是单一显示功能的显示单元。 所述的输入单元是通过偶联外部硬盘作为输入数据来源,实现测序数据的输入。 以上实施例仅作为对本技术的一个实例帮助本领域技术人员理解技术的实质,并不用作对保护范围的限定。【权利要求】1.一种高整合度的测序数据分析工作站系统,其特征在于,由主机,输入输出单元组成,所述主机可以工作在单节点模式下,也可以根据运算需求进行平滑弹性扩容。2.根据权利要求1所述的测序数据分析工作站系统,其特征在于,所述的主机由系统模块、电源管理模块、并行流处理器以及高速存储设备组成, 所述的系统模块由高性能处理器及大容量内存组成,用于支撑操作系统及基础数据交换,电源管理模块用于优化系统功耗; 所述的并行流处理器采用科学运算流处理器,单位运算能力功耗比高于18.051^101)8/ 匹配使用专门针对流处理器的测序数据优化算法,实现对测序数据的匹配及运算等处理; 所述的高速存储设备以88(1作为关键数据缓存,辅以大容量存储设备进行海量存储。3.根据权利要求2所述的测序数据分析工作站系统,其特征在于,所述的测序数据,直接来源于1111111111181公司的11186(1系列的测序仪、也一!"公司的及系列测序仪,数据级别为她?(?大小,基础长度10?1000如,数据格式为化8切或3??格式。4.根据权利要求2所述的测序数据分析工作站系统,其特征在于,所述的存储设备内置完整的人类及微生物基因数据库。5.根据权利要求1所述的测序数据分析工作站系统,其特征在于,所述的输入单元是直接输入数据源的外接硬盘,或使用千兆以太网卡进行直接数据传输,或直接偶联测序仪的输出单兀。6.根据权利要求1所述的测序数据分析工作站系统,其特征在于,所述的输出单元为具备单一显示功能的显示单元、或是集成了人机交互功能的显示单元、或是直接输出结果报告的显示单元、或是千兆以太网直接输出三种方式。7.根据权利要求1-6任一所述的工作站系统,其特征在于,所述的系统使用全图形操作界面。【文档编号】G06F19/22GK204129738SQ201420617529【公开日】2015年1月28日 申请日期:2014年10月24日 优先权日:2014年10月24日 【专利技术者】吴翀, 王瑜, 李国强, 项博, 闫威 申请人:北京微旋基因技术有限公司本文档来自技高网...

【技术保护点】
一种高整合度的测序数据分析工作站系统,其特征在于,由主机,输入输出单元组成,所述主机可以工作在单节点模式下,也可以根据运算需求进行平滑弹性扩容。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴翀王瑜李国强项博闫威
申请(专利权)人:北京微旋基因技术有限公司
类型:新型
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1