一种面向基因数据计算的异构平台制造技术

技术编号:16038468 阅读:35 留言:0更新日期:2017-08-19 20:18
本发明专利技术公开了一种面向基因数据计算的异构平台,包括异构处理器单元、互联总线模块、内存、基因计算数据指令输入单元和基因计算结果输出单元,所述异构处理器单元分别通过互联总线模块与内存、基因计算数据指令输入单元、基因计算结果输出单元相连,所述异构处理器单元包括CPU、GPU和FPGA,其中CPU构成控制引擎,CPU、GPU、FPGA三者构成计算引擎。本发明专利技术能够为提高基因数据计算的实时性和准确性提供硬件支持,具有基因数据计算效率高、制造成本低、计算能耗低的优点。

【技术实现步骤摘要】
一种面向基因数据计算的异构平台
本专利技术涉及基因测序技术,具体涉及一种面向基因数据计算的异构平台。
技术介绍
最近几年,随着下一代测序技术(NextGenerationSequence,以下简称NGS)的广泛应用,基因测序的成本迅速下降,基因技术开始进入普及应用。NGS包括基因数据计算和基因数据解读两个步骤,其中基因数据计算是指对原始的基因测序数据进行去伪、去重等预处理,以便基因数据解读时使用,基因数据解读是指对基因数据计算处理后的基因数据在生物学、医学、健康保健等领域的科学含义进行分析、揭示和解释。当前,一个制约基因技术临床应用发展的瓶颈是基因数据的海量性。基于技术的原因,NGS生成的原始基因数据的单样本数据量非常大,比如全基因组(Whole-GenomeSequencing,WGS)的单样本数据达100G以上,因此基因单样本数据的计算就已经是高输入/输出密集和高计算密集型任务;再加上基因技术的快速普及,导致测序生成的原始基因数据的总量成指数增长。所以,对基因数据进行实时的、准确的计算和传送变得非常困难,面临着巨大的挑战。为此,目前典型的方法是在拥有数量更多、性能更强的高性能处理器的计算机集群上,运用基于多线程技术的软件进行处理。但是,这种系统的缺点是:一方面,它在存储、功耗、技术支持和维护上的成本高;另一方面,在保证准确性的前提下,它能获得的并行计算加速性能仍然难以满足上述挑战的需求;更主要的是,测序生成的原始基因数据的增加已经远超摩尔定律,所以,这种方法已经缺乏持续性。目前,计算机系统中常见的处理器类型有中央处理器(CentralProcessingUnit,简称CPU)、现场可编程门阵列(FieldProgrammableGateArray,简称FPGA)和图形处理器(GraphicsProcessingUnit,简称GPU)。目前的高性能CPU通常都包括多个处理器核(ProcessorCore),从硬件上支持多线程,但是其设计目标还是面向通用应用程序,而相对于特殊的计算,通用应用程序的并行性较小,需要较复杂的控制和较低的性能目标。因此,CPU片上的硬件资源主要还是用于实现复杂的控制而不是计算,没有为特殊功能包含专门的硬件,能够支持的计算并行度不高。FPGA是一种半定制电路,优点有:基于FPGA进行系统开发,设计周期短、开发费用低;功耗低;生产后可重新修改配置,设计灵活性高,设计风险小。缺点是:实现同样的功能,FPGA一般来说比专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)的速度要慢,比ASIC电路面积要大。随着技术的发展和演进,FPGA向更高密度、更大容量、更低功耗和集成更多硬核知识产权(IntellectualProperty,IP)的方向发展,FPGA的缺点在缩小,而优点在放大。相比于CPU,FPGA可以用硬件描述语言来定制实现、修改和增加并行计算。GPU最初是一种专门用于图像处理的微处理器,能够从硬件上支持纹理映射和多边形着色等图形计算基本任务。由于图形学计算涉及一些通用数学计算,比如矩阵和向量运算,而GPU拥有高度并行化的架构,因此,随着相关软硬件技术的发展,GPU计算技术日益兴起,即GPU不再局限于图形处理,还被开发用于线性代数、信号处理、数值仿真等并行计算,可以提供数十倍乃至于上百倍于CPU的性能。但是目前的GPU存在2个问题:一是,受限于GPU的硬件结构特性,很多并行算法不能在GPU上有效地执行;二是,GPU运行中会产生大量热量,能耗较高。综上所述,以上三种计算器件各有特点,又各有局限性。但是,针对前述基因技术临床应用发展存在的瓶颈,如何利用上述处理器来构建混合架构平台以实现海量基因数据的计算,则已经成为一项亟待解决的关键技术问题。
技术实现思路
本专利技术要解决的技术问题:针对现有技术的上述问题,提供一种能够为提高基因数据计算的实时性和准确性提供硬件支持,基因数据计算效率高、制造成本低、计算能耗低的面向基因数据计算的异构平台。为了解决上述技术问题,本专利技术采用的技术方案为:一种面向基因数据计算的异构平台,包括异构处理器单元、互联总线模块、内存、基因计算数据指令输入单元和基因计算结果输出单元,所述异构处理器单元分别通过互联总线模块与内存、基因计算数据指令输入单元、基因计算结果输出单元相连,所述异构处理器单元包括CPU、GPU和FPGA,其中CPU构成控制引擎,所述CPU、GPU、FPGA三者构成计算引擎,所述控制引擎在通过基因计算数据指令输入单元接收基因计算数据指令并分割为代码段,当代码段的任务类型为控制任务时,将代码段的指令和数据调度CPU进行处理;当代码段的任务类型为计算任务时,将代码段的指令和数据调度计算引擎进行处理并将计算结果通过基因计算结果输出单元输出。优选地,所述FPGA包括交叉开关、IO控制单元和加速器单元,所述IO控制单元、加速器单元分别和交叉开关相连,所述加速器单元包括用于实现隐马尔可夫模型计算硬件加速的隐马尔可夫模型计算加速器、用于实现哈希计算硬件加速的哈希函数计算加速器两者中的至少一种,所述IO控制单元与互联总线模块相连。优选地,所述IO控制单元包括PCIE接口、DMA控制器、PIU外围接口部件和DDR控制器,所述交叉开关分别与DMA控制器、PIU外围接口部件和DDR控制器相连,所述DMA控制器、PIU外围接口部件之间相互连接,所述PCIE接口与DMA控制器相连,所述PCIE接口、DDR控制器分别与互联总线模块相连。优选地,所述互联总线模块包括HCCLink总线模块和HNCLink总线模块,所述CPU、GPU和FPGA分别通过HCCLink总线模块和内存相连,且所述CPU、GPU和FPGA分别通过HNCLink总线模块和基因计算数据指令输入单元以及基因计算结果输出单元相连。优选地,所述基因计算数据指令输入单元包括输入设备、通用接口模块、网络接口模块、多媒体输入接口模块、外部存储设备、传感器中的至少一种。优选地,所述基因计算结果输出单元包括显示设备、通用接口模块、网络接口模块、多媒体输出接口模块、外部存储设备中的至少一种。优选地,所述将代码段的指令和数据调度计算引擎进行处理的详细步骤包括:A1)分别判断代码段是否能进行指令并行执行,是否能进行流水线执行,是否能进行数据并行执行,如果三者均不能,则跳转执行步骤A7),退出;否则,跳转执行步骤A2);A2)判断代码段是否只能进行数据并行执行,如果只能进行数据并行执行,则跳转执行步骤A3);否则,跳转执行步骤A6);A3)判断代码段分派到FPGA上优化执行(即并行执行,下同)的总开销少于代码段分派到GPU上优化执行的总开销是否成立,所述代码段分派到FPGA上优化执行的总开销包括CPU和FPGA之间交互数据和指令产生的通信开销、FPGA的访存开销以及FPGA的计算开销,所述代码段分派到GPU上优化执行的总开销包括CPU和GPU之间交互数据和指令产生的通信开销、GPU的访存开销以及GPU的计算开销,如果成立则跳转执行步骤A6);否则,跳转执行步骤A4);A4)判断代码段是否是能耗优先,如果是能耗优先,则跳转执行步骤A6);否则,跳转执行步骤A5);A5)判断代码段的本文档来自技高网
...
一种面向基因数据计算的异构平台

【技术保护点】
一种面向基因数据计算的异构平台,其特征在于:包括异构处理器单元(1)、互联总线模块(2)、内存(3)、基因计算数据指令输入单元(4)和基因计算结果输出单元(5),所述异构处理器单元(1)分别通过互联总线模块(2)与内存(3)、基因计算数据指令输入单元(4)、基因计算结果输出单元(5)相连,所述异构处理器单元(1)包括CPU、GPU和FPGA,其中CPU构成控制引擎(11),所述CPU、GPU、FPGA三者构成计算引擎(12),所述控制引擎(11)在通过基因计算数据指令输入单元(4)接收基因计算数据指令并分割为代码段,当代码段的任务类型为控制任务时,将代码段的指令和数据调度CPU进行处理;当代码段的任务类型为计算任务时,将代码段的指令和数据调度计算引擎(12)进行处理并将计算结果通过基因计算结果输出单元(5)输出。

【技术特征摘要】
1.一种面向基因数据计算的异构平台,其特征在于:包括异构处理器单元(1)、互联总线模块(2)、内存(3)、基因计算数据指令输入单元(4)和基因计算结果输出单元(5),所述异构处理器单元(1)分别通过互联总线模块(2)与内存(3)、基因计算数据指令输入单元(4)、基因计算结果输出单元(5)相连,所述异构处理器单元(1)包括CPU、GPU和FPGA,其中CPU构成控制引擎(11),所述CPU、GPU、FPGA三者构成计算引擎(12),所述控制引擎(11)在通过基因计算数据指令输入单元(4)接收基因计算数据指令并分割为代码段,当代码段的任务类型为控制任务时,将代码段的指令和数据调度CPU进行处理;当代码段的任务类型为计算任务时,将代码段的指令和数据调度计算引擎(12)进行处理并将计算结果通过基因计算结果输出单元(5)输出。2.根据权利要求1所述的面向基因数据计算的异构平台,其特征在于:所述FPGA包括交叉开关、IO控制单元和加速器单元,所述IO控制单元、加速器单元分别和交叉开关相连,所述加速器单元包括用于实现隐马尔可夫模型计算硬件加速的隐马尔可夫模型计算加速器、用于实现哈希计算硬件加速的哈希函数计算加速器两者中的至少一种,所述IO控制单元与互联总线模块(2)相连。3.根据权利要求2所述的面向基因数据计算的异构平台,其特征在于:所述IO控制单元包括PCIE接口、DMA控制器、PIU外围接口部件和DDR控制器,所述交叉开关分别与DMA控制器、PIU外围接口部件和DDR控制器相连,所述DMA控制器、PIU外围接口部件之间相互连接,所述PCIE接口与DMA控制器相连,所述PCIE接口、DDR控制器分别与互联总线模块(2)相连。4.根据权利要求1所述的面向基因数据计算的异构平台,其特征在于:所述互联总线模块(2)包括HCCLink总线模块(21)和HNCLink总线模块(22),所述CPU、GPU和FPGA分别通过HCCLink总线模块(21)和内存(3)相连,且所述CPU、GPU和FPGA分别通过HNCLink总线模块(22)和基因计算数据指令输入单元(4)以及基因计算结果输出单元(5)相连。5.根据权利要求1所述的面向基因数据计算的异构平台,其特征在于:所述基因计算数据指令输入单元(4)包括输入设备、通用接口模块、网络接口模块、多媒体输入接口模块、外部存储设备、传感器中的至少一种。6.根据权利要求1所述的面向基因数据计算的异构平台,其特征在于:所述基因计算结果输出单元(5)包括显示设...

【专利技术属性】
技术研发人员:宋卓刘蓬侠李根
申请(专利权)人:人和未来生物科技长沙有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1