一种面向基因比对算法的加速装置制造方法及图纸

技术编号:21161745 阅读:25 留言:0更新日期:2019-05-22 08:29
本发明专利技术提供了一种面向基因比对算法的加速装置。该加速装置包括主机端和多个加速模块,所述加速模块包括多个存储层、垂直切片管理单元和交换网络,其中:所述主机端用于控制向所述加速模块分发基因测序序列和接收基因比对结果;所述加速模块的存储层用于存储基因参考序列;所述加速模块的垂直切片管理单元用于管理将所述多个存储层进行垂直划分所形成的切片以及执行基因比对算法,获得基因比对结果;所述加速模块的交换网络用于控制该加速模块内部的数据交换以及该加速模块与外部的数据交换。本发明专利技术的加速装置利用定制结构能够提高基因比对算法的处理速度。

An Acceleration Device Oriented to Gene Alignment Algorithms

The invention provides an accelerating device for gene comparison algorithm. The acceleration device comprises a host terminal and a plurality of acceleration modules, the acceleration module comprises a plurality of storage layers, a vertical slice management unit and a switching network, wherein the host terminal is used to control the distribution of gene sequencing sequences to the acceleration module and the reception of gene alignment results; the storage layer of the acceleration module is used to store gene reference sequences; and the vertical slice tube of the acceleration module. The cell is used to manage the slices formed by vertical partitioning of the multiple storage layers and to perform gene alignment algorithms to obtain gene alignment results; the switching network of the acceleration module is used to control the data exchange within the acceleration module and the data exchange between the acceleration module and the outside. The accelerating device of the present invention can improve the processing speed of the gene matching algorithm by using a customized structure.

【技术实现步骤摘要】
一种面向基因比对算法的加速装置
本专利技术涉及生物基因数据处理
,尤其涉及一种面向基因比对算法的加速装置。
技术介绍
目前,生物技术的发展正在引发农业、医药、能源、材料等领域的产业革命,有效缓解了食品、健康、资源等问题,具有广阔的发展空间。作为生物领域学科的生物信息学的重要性也日益凸显,它是当今生命科学和自然科学的重大前沿领域之一,其研究重点是基因组学和蛋白质组学,具体而言是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。在序列(read)分析中,基因比对是最基本和最常用的方法,通过基因比对能够发现基因序列间的相似性和差异性,从而揭示生物的进化、遗传和变异等问题。目前基因比对技术迅猛发展,基因测序的成本大幅度的降低,使得基因分析的大量应用成为可能,该技术已在农作物育种、精准医疗和无创产检等领域获得广泛应用。高通量测序技术的普及使得基因测序生物数据量呈爆炸性的增长,因而快速地、低能耗地处理这些数据面临巨大的挑战。在现有技术中,基因比对算法通常采用通用处理结构(例如普通服务器等),这种基因比对算法主要存在两方面问题:1)、CPU和存储器通常是分离的,通过电路板上的内存接口来访问数据,受到电气特性的限制,访存带宽有限;此外,由于基因比对操作程序的局部性很差,对内存带宽有很大的需求,这种对高带宽的需求与当前带宽不能满足其需求,造成基因比对算法运行性能差、功耗高。2)、通用处理器中通常会配置浮点运算器、定点运算器和分支预测逻辑等若干的功能部件,而基因比对算法具有计算密度低、并行度高的特征,这些部件不仅占用了处理器硅片的面积,而且消耗了大量的电能。因此,需要对现有技术进行改进,以提供处理效率高、运行功耗低的面向基因比对算法的加速装置。
技术实现思路
本专利技术的目的在于克服上述现有技术的缺陷,提供一种面向基因比对算法的加速装置。根据本专利技术的第一方面,提供了一种面向基因比对算法的加速装置。该加速装置包括主机端和多个加速模块,所述加速模块包括多个存储层、垂直切片管理单元和交换网络,其中:所述主机端用于控制向所述加速模块分发基因测序序列和接收基因比对结果;所述加速模块的存储层用于存储基因参考序列;所述加速模块的垂直切片管理单元用于管理将所述多个存储层进行垂直划分所形成的切片以及执行基因比对算法,获得基因比对结果;所述加速模块的交换网络用于控制该加速模块内部的数据交换以及该加速模块与外部的数据交换。在一个实施例中,所述垂直切片管理单元包括垂直切片控制器、存储单元和基因比对算法执行单元,其中:所述存储单元用于存储数据和程序代码;所述垂直切片控制器用于控制该垂直切片管理单元的内部的逻辑控制以及与外部的信息交互;所述基因比对算法执行单元用于执行基因比对算法,获得基因比对结果。在一个实施例中,所述存储单元包括程序代码缓存单元、测序序列缓存单元、基因比对结果缓存单元,其中:所述程序代码缓存单元用于存储执行基因比对算法的程序代码;所述测序序列缓存单元用于存储待进行比对的基因测序序列;所述基因比对结果缓存单元用于存储所述基因比对算法执行单元获得的基因比对结果。在一个实施例中,所述基因比对算法执行单元采用多级流水线结构,各级流水线并行执行基因比对算法,获得各自的基因比对中间结果。在一个实施例中,所述存储单元还包括多个寄存器堆,每个寄存器堆对应所述基因比对算法单元的一级流水线,用于缓存对应流水线的基因比对的中间结果。在一个实施例中,所述多个寄存堆中的每一个还配置一个用于存放基因参考序列中检查点的专用寄存器以及一个用于存储基因参考序列中检查点之后的部分数据的专用寄存器。在一个实施例中,所述基因比对算法执行单元的多级流水线共享一个所述程序代码缓存单元、共享一个所述测序序列缓存单元并共享一个所述基因比对结果缓存单元。在一个实施例中,所述基因比对算法执行单元的每一级流水线包括定点加法器和移位器。在一个实施例中,所述主机端通过内存映射方法将所述多个加速模块映射为内存区域的一部分。根据本专利技术的第二方面,提供了一种面向基因比对算法的加速芯片,该加速芯片包括本专利技术提供的加速装置,其中,所述多个存储层、所述垂直切片管理单元和所述交换网络利用3D堆叠技术进行组合。与现有技术相比,本专利技术的优点在于:基于3D堆叠制造工艺,设计了面向基因比对算法的加速装置,在该装置中,采用加速单元定制技术,去除了处理器中的浮点运算单元并增加了松耦合的定点运算单元,从而能够满足基因比对算法计算密度低的特征;配置了并行的定制处理逻辑,能够满足基因比对算法对并行度的需求;此外,将多层的内存单元与定制加速逻辑单元组成一个芯片,充分利用芯片内部的高速数据访问能力,克服了访存带宽受限的问题,从而显著提高了基因比对算法的运行速度和性能功耗比。附图说明以下附图仅对本专利技术作示意性的说明和解释,并不用于限定本专利技术的范围,其中:图1示出了根据本专利技术一个实施例的面向基因比对算法的加速装置的结构图;图2示出了根据本专利技术一个实施例的加速装置的主机端的主处理器的结构图;图3示出了根据本专利技术一个实施例的加速装置中加速模块的结构图;图4示出了根据本专利技术一个实施例的加速模块的垂直切片的结构图;图5示出了根据本专利技术一个实施例的加速装置的工作流程示意图;图6示出了根据本专利技术一个实施例的加速模块的访存流程图。具体实施方式为了使本专利技术的目的、技术方案、设计方法及优点更加清楚明了,以下结合附图通过具体实施例对本专利技术进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本专利技术,并不用于限定本专利技术。图1示出了根据本专利技术一个实施例的面向基因比对算法的加速装置的结构图,该加速装置100包括主机端110(host)和多个加速模块(Cube)120(示出了4个Cube,即Cube0至Cube3)。主机端110与加速模块120之间具有通信连接,主机端110用于向完成加速模块120的基因测序序列的分发和控制功能,可采用通用处理器(例如X86处理器)实现。主机端110可通过内存映射的方式,将各加速模块120的存储空间映射到主机端110的存储空间中,从而避免了主机端110的处理器和加速模块120之间数据一致性的维护。加速模块120用于实现基因比对算法的存储和计算功能,获得基因比对结果。需要说明的是,图1中主机端110和各加速模块之间的连接仅为示意性描述,在实现时,可由多种连接方式,例如,各加速模块之间通过例如MESH机制进行通信,每一个加速模块可采用高速串行链路作为片外接口与外部互连等。主机端110和各Cube之间以及Cube与Cube之间可以以任意的拓扑互连,整个加速装置100的扩展性不受限制。此外,由于基因比对过程中不需要虚拟内存提供的映射功能,因此加速装置100中可以不必实现虚拟内存的功能,从而避免了地址转换的开销。为了支持主机端110中操作系统的运行,主机端110的主处理器在自己的主存储器中可使用虚拟地址。图2示出了根据本专利技术一个实施例的加速装置的主机端的主处理器的内部结构图,其包括CPU和两级Cache结构,其中,一级Cache分为I-Cache和D-Cache,分别与CPU的端口ichche_port和dcache_port相连,二级Cache(L2cache)通过L2总线(L2bus)与一级Cache相连,本文档来自技高网
...

【技术保护点】
1.一种面向基因比对算法的加速装置,包括主机端和多个加速模块,所述加速模块包括多个存储层、垂直切片管理单元和交换网络,其中:所述主机端用于控制向所述加速模块分发基因测序序列和接收基因比对结果;所述加速模块的存储层用于存储基因参考序列;所述加速模块的垂直切片管理单元用于管理将所述多个存储层进行垂直划分所形成的切片以及执行基因比对算法,获得基因比对结果;所述加速模块的交换网络用于控制该加速模块内部的数据交换以及该加速模块与外部的数据交换。

【技术特征摘要】
1.一种面向基因比对算法的加速装置,包括主机端和多个加速模块,所述加速模块包括多个存储层、垂直切片管理单元和交换网络,其中:所述主机端用于控制向所述加速模块分发基因测序序列和接收基因比对结果;所述加速模块的存储层用于存储基因参考序列;所述加速模块的垂直切片管理单元用于管理将所述多个存储层进行垂直划分所形成的切片以及执行基因比对算法,获得基因比对结果;所述加速模块的交换网络用于控制该加速模块内部的数据交换以及该加速模块与外部的数据交换。2.根据权利要求1所述的加速装置,其特征在于,所述垂直切片管理单元包括垂直切片控制器、存储单元和基因比对算法执行单元,其中:所述存储单元用于存储数据和程序代码;所述垂直切片控制器用于控制该垂直切片管理单元的内部的逻辑控制以及与外部的信息交互;所述基因比对算法执行单元用于执行基因比对算法,获得基因比对结果。3.根据权利要求2所述的加速装置,其特征在于,所述存储单元包括程序代码缓存单元、测序序列缓存单元、基因比对结果缓存单元,其中:所述程序代码缓存单元用于存储执行基因比对算法的程序代码;所述测序序列缓存单元用于存储待进行比对的基因测序序列;所述基因比对结果缓存单元用于存储所述基因比对算法执行单元获得的基因比对结果。4....

【专利技术属性】
技术研发人员:臧大伟王元戎沈华谭光明刘伯然孙凝晖
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1