一种基于近内存计算结构的基因比对加速方法和系统技术方案

技术编号:26175390 阅读:60 留言:0更新日期:2020-10-31 14:08
本发明专利技术提出一种基于近内存计算结构的基因比对加速方法和系统,包括:将多个垂直的立方内存结构分组,得到多个基因比对处理组;获取参考序列数据,将参考序列数据拆分为参考数据段后分别存储至基因比对处理组,并且通过基因比对加速器的片上网络实现立方内存结构之间数据通信;获取待比对基因序列数据,将待比对基因序列数据拆分为待比对数据段后分别输入至基因比对处理组内各立方内存结构的逻辑层,逻辑层判断与当前待比对数据段比对的参考数据段是否位于本地存储层,若是,则从本地存储层获取参考数据段,与当前待比对数据段进行基因比对,得到比对结果,否则采用函数式消息传递和远端处理的方式得到比对结果。

【技术实现步骤摘要】
一种基于近内存计算结构的基因比对加速方法和系统
本专利技术涉及计算机系统结构设计领域和生物基因数据处理领域,特别涉及一种基于近内存计算结构的基因比对加速方法和系统。
技术介绍
近年来,基于生物技术和计算机技术的生物信息学蓬勃发展,其中的一个重要领域就是基因数据分析。基因测序技术是基因数据分析中不可或缺的一环,随着二代测序成本的不断下降,基因测序数据爆炸式增长,现有的处理器性能已经越来越无法满足日益增长的基因测序需求,而基因比对作为基因测序中必不可少且相当耗时的一个步骤,已经成为了一个主要的性能瓶颈,在整个基因测序过程中拥有着十分重要的地位。所以,为了提升基因测序的速度,以应对实际应用中存在的挑战,迫切需要一种新型的处理器结构去加速基因比对过程。为了提升处理效率,人们提出了一些面向基因比对应用的加速系统,其加速效果主要取决于两个方面:1)处理单次迭代并向内存请求后续迭代所需数据的速度;2)内存向处理器提供数据的速度。近期出现的一些面向数据密集型应用的定制加速器着重于第一方面,其定制处理单元能以较高的效率处理每次迭代,并通过大规模并行执行结本文档来自技高网...

【技术保护点】
1.一种基于近内存计算结构的基因比对加速方法,其特征在于,包括:/n步骤1、获取基于近内存计算结构的基因比对加速器,且该基因比对加速器由多个垂直的立方内存结构构成,每个立方内存结构由多层存储层和一层逻辑层堆叠而成;/n步骤2、根据基于BWT的基因比对所需的BWT参考序列占用空间,将该多个垂直的立方内存结构分组,得到多个基因比对处理组;/n步骤3、获取参考序列数据,将该参考序列数据拆分为参考数据段后分别存储至基因比对处理组,并且通过该基因比对加速器的片上网络实现立方内存结构之间数据通信;/n步骤4、获取待比对基因序列数据,将该待比对基因序列数据拆分为待比对数据段后分别输入至基因比对处理组内各立方...

【技术特征摘要】
1.一种基于近内存计算结构的基因比对加速方法,其特征在于,包括:
步骤1、获取基于近内存计算结构的基因比对加速器,且该基因比对加速器由多个垂直的立方内存结构构成,每个立方内存结构由多层存储层和一层逻辑层堆叠而成;
步骤2、根据基于BWT的基因比对所需的BWT参考序列占用空间,将该多个垂直的立方内存结构分组,得到多个基因比对处理组;
步骤3、获取参考序列数据,将该参考序列数据拆分为参考数据段后分别存储至基因比对处理组,并且通过该基因比对加速器的片上网络实现立方内存结构之间数据通信;
步骤4、获取待比对基因序列数据,将该待比对基因序列数据拆分为待比对数据段后分别输入至基因比对处理组内各立方内存结构的逻辑层,逻辑层判断与当前待比对数据段比对的参考数据段是否位于本地存储层,若是,则从本地存储层获取参考数据段,与该当前待比对数据段进行基因比对,得到比对结果,否则采用函数式消息传递和远端处理的方式得到比对结果;
步骤5、循环该步骤3和步骤4,直到该待比对基因序列数据的全部待比对数据段完成基因比对,汇总全部比对结果,得到该待比对基因序列数据的完整基因比对结果。


2.如权利要求1所述的基于近内存计算结构的基因比对加速方法,其特征在于,步骤4中采用函数式消息传递和远端处理的方式具体为:
源立方内存结构将所需参考数据段的数据地址发送给具有该参考数据段的远端立方内存结构,远端立方内存结构在收到请求后,于该立方内存结构本地进行数据访问以及基因比对操作,最后将比对结果返回给该源立方内存结构。


3.如权利要求1所述的基于近内存计算结构的基因比对加速方法,其特征在于,每个立方内存结构的逻辑层中都设有内存控制器,用于控制存储层数据的访问,该内存控制器将底层协议加以封装,使得新型内存结构的内部网络通信可以基于包传输。


4.如权利要求2所述的基于近内存计算结构的基因比对加速方法,其特征在于,该步骤4包括:
步骤41.源立方内存结构向远端立方内存结构发送请求消息,之后源立方内存结构继续其他处理;
步骤42.远端立方内存结构收到处理请求;
步骤43.远端立方内存结构根据该请求消息中的位置指针预取参考数据段数据;
步骤44.远端立方内存结构分配任务至其本地逻辑层进行一次基因比对,得到索引值;
步骤45.远端立方内存结构将该索引值作为应答返回源立方内存结构;
步骤46.源立方内存结构收到本任务的应答,等候后续任务调度。


5.如权利要求1所述的基于近内存计算结构的基因比对加速方法,其特征在于,该基因比对加速器包括访存单元,其作为预取器的一部分被放置在PE阵列之前,通过数据预取为PE阵列连续提供数据,输入队列的调度器将输入队列中“请求”队列的处理请求进行地址转换得到内存地址,将内存地址发送给预取器,预取器根据相应内存地址在立方内存结构的存储层进行数据访问,数据取回后送至PE阵列的数据缓存内,供PE进行后续计算。

【专利技术属性】
技术研发人员:谭光明刘万奇臧大伟孙凝晖陈灿
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1