多通道软件加速基因组读段映射引擎制造技术

技术编号:42893650 阅读:23 留言:0更新日期:2024-09-30 15:12
用于软件加速基因组数据读段映射的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。在一些具体实施中,软件加速基因组数据读段映射包括:从基因组数据读段获得第一k聚体种子;基于第一k聚体种子生成基因组签名;基于该基因组签名使用散列数据结构确定参考序列位置;确定不匹配的数量;基于确定不匹配的该数量包括一个或多个不匹配,由一个或多个计算机从该基因组数据读段获得k聚体种子的集合;以及基于来自该基因组数据读段的k聚体种子的该集合,由该一个或多个计算机选择针对该基因组数据读段的实际比对。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、在一些情况下,基因组读段映射描述标识基因的基因座和基因之间的距离的方法。计算机可用于分析一组或多组基因组数据并且将分子标志物的集合(诸如一连串核苷酸)与分子标志物在给定参考基因组上的相应定位相关联。以此方式,计算机可用于将分子标志物的集合“映射”到参考基因组上。


技术实现思路

1、在一些具体实施中,用于多通道加速基因组读段映射的系统包括一个或多个处理阶段。该一个或多个处理阶段中的每个处理阶段可包括:从基因组数据读段提取一个或多个k聚体以及处理那些k聚体以确定候选比对位置,该候选比对位置指示在参考基因组上用于比对该基因组数据读段的位置。在一些具体实施中,第一处理阶段包括:生成单个过滤后的k聚体,生成对应于参考基因组数据的候选比对,以及评估该候选比对以确定该比对是否满足比对准则。如果在该第一处理阶段中所生成的候选比对不满足比对准则,则系统可执行第二处理阶段。如果在该第二处理阶段中生成的一个或多个候选比对位置不满足比对准则,则系统可执行第三处理阶段。在一些具体实施中,当满足比对准则的候选比对被评估时本文档来自技高网...

【技术保护点】

1.一种用于软件加速基因组数据读段映射的方法,所述方法包括:

2.根据权利要求1所述的方法,其中从所述基因组数据读段获得所述第一k聚体种子包括:

3.根据权利要求1所述的方法,其中基于来自所述基因组数据读段的k聚体种子的所述第二集合选择针对所述基因组数据读段的所述实际比对包括:

4.根据权利要求3所述的方法,其中基于所述基因组签名选择k聚体种子的所述第二集合的所述子集包括:

5.根据权利要求1所述的方法,所述方法包括:

6.根据权利要求5所述的方法,所述方法包括:

7.根据权利要求6所述的方法,所述方法包括:

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于软件加速基因组数据读段映射的方法,所述方法包括:

2.根据权利要求1所述的方法,其中从所述基因组数据读段获得所述第一k聚体种子包括:

3.根据权利要求1所述的方法,其中基于来自所述基因组数据读段的k聚体种子的所述第二集合选择针对所述基因组数据读段的所述实际比对包括:

4.根据权利要求3所述的方法,其中基于所述基因组签名选择k聚体种子的所述第二集合的所述子集包括:

5.根据权利要求1所述的方法,所述方法包括:

6.根据权利要求5所述的方法,所述方法包括:

7.根据权利要求6所述的方法,所述方法包括:

8.根据权利要求7所述的方法,其中所述第二不匹配阈值包括不匹配核苷酸值的阈值数量。

9.根据权利要求1所述的方法,所述方法包括:

10.根据权利要求9所述的方法,所述方法包括:

11.根据权利要求10所述的方法,所述方法包括:

12.根据权利要求11所述的方法,所述方法包括:

13.一种用于软件加速基因组数据读段映射的方法,所述方法包括:

14.根据权利要求13所述的方法,其中从所述基因组数据读段获得所述第一k聚体种子包括:

15.根据权利要求13所述的方法,所述方法包括:

16.根据权利要求13所述的方法,其中基于来自所述基因组数据读段的k聚体种子的所述集合选择针对所述基因组数据读段的所述实际比对包括:

17.根据权利要求16所述的方法,其中基于所述基因组签名选择k聚体种子的所述集合的所述子集包括:

18.根据权利要求16所述的方法,所述方法包括:

19.根据权利要求18所述的方法,所述方法包括:

<...

【专利技术属性】
技术研发人员:G·A·P·里兹克
申请(专利权)人:因美纳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1