支持SIMD的序列比对方法及装置制造方法及图纸

技术编号：22264119 阅读：29 留言：0更新日期：2019-10-10 15:54

本发明专利技术提供一种支持SIMD的序列比对方法，包括根据查询序列和参考序列的长度确定得分矩阵的行数和列数；根据指定的宽度值确定得分矩阵在行方向和列方向上的扩展区间；基于查询序列和参考序列的比对，确定得分矩阵在所述扩展区间内相应各元素的得分，同时将处于扩展区间之外的元素全部清零；然后根据所确定的得分矩阵获取查询序列相对于参考序列的局部最大相似片段。该方法能充分利用SIMD来提高序列比对的计算效率。

Sequence alignment method and device supporting SIMD

全部详细技术资料下载

【技术实现步骤摘要】
支持SIMD的序列比对方法及装置
本专利技术涉及基因数据处理，尤其涉及对DNA序列比对进行加速的方法和系统。
技术介绍
随着下一代测序技术(NGS)技术的快速发展，基因测序通量不断提升。在DNA测序中，DNA分子首先会被随机打断成很多个片段，然后将这些无序片段克隆，再经由测序仪进行测序，产生数百万很短的DNAreads(下文中也可称为测序片段)。之后将这些产生的DNAreads与参考基因组进行比对，找到这些DNAreads在参考基因组上的位置。BWA-MEM已成为当下最流行的也是最常用的基因序列匹配工具。提高和完善BWA-MEM工具的效率对于基因测序有着重要的意义。
技术实现思路
BWA-MEM采用经典的seed-and-extend范式，其主要耗时的部分包括两个：一是根据BWT(Burrow-WheelerTransform，伯罗斯-惠勒变换)算法计算每个seed的位置，另一个是使用序列比对算法(Smith-Waterman,SW)，基于动态规划对seed进行扩展以找到两序列之间的最优本地比对。其中BWT计算复杂度为O(n)，可优化空间不大；而SW算法计算复杂度为O(n^2)，既复杂又耗时。因此，本专利技术的目的在于提供一种可利用SIMD(SingleInstructionMultipleData，单指令多数据)技术进行加速的SW算法的方法和系统。本专利技术的目的是通过以下技术方案实现的：一方面，本专利技术提供了一种支持SIMD的序列比对方法，包括：s1)根据查询序列和参考序列的长度确定得分矩阵的行数和列数；s2)根据指定的宽度值确定得分矩阵在行方向和列方向...

【技术保护点】
1.一种支持SIMD的序列比对方法包括：s1)根据查询序列和参考序列的长度确定得分矩阵的行数和列数；s2)根据指定的宽度值确定得分矩阵在行方向和列方向上的扩展区间；s3)在查询序列和参考序列的比对过程中，确定得分矩阵在所述扩展区间内相应各元素的得分，同时将处于扩展区间之外的元素全部清零；s4)根据所获得的得分矩阵获取查询序列相对于参考序列的局部最大相似片段。

【技术特征摘要】
1.一种支持SIMD的序列比对方法包括：s1)根据查询序列和参考序列的长度确定得分矩阵的行数和列数；s2)根据指定的宽度值确定得分矩阵在行方向和列方向上的扩展区间；s3)在查询序列和参考序列的比对过程中，确定得分矩阵在所述扩展区间内相应各元素的得分，同时将处于扩展区间之外的元素全部清零；s4)根据所获得的得分矩阵获取查询序列相对于参考序列的局部最大相似片段。2.根据权利要求1所述的方法，还包括根据下述公式判断是否执行步骤s1)-s4)：其中a的值等于或略小于要用于执行所述方法的处理器中向量寄存器包含的元素个数；m为查询序列的长度，w表示所述...

【专利技术属性】
技术研发人员：谭光明，张中海，牛钢，曾平，
申请(专利权)人：北京哲源科技有限责任公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人