用于进行二级和/或三级处理的生物信息学系统、设备和方法技术方案

技术编号:41323037 阅读:24 留言:0更新日期:2024-05-13 15:01
本文涉及用于进行二级和/或三级处理的生物信息学系统、设备和方法。具体而言,本文提供了一种通过联合评估映射到参考序列的两个以上的同源区域的读长来提高变异检测准确性的方法和系统。通过联合评估映射到参考序列的两个以上的同源区域的读长来提高变异检测准确性的方法包括访问多个序列读长的联合堆积、从所述联合堆积中确定一组候选变异、定义所述候选变异的处理顺序、根据定义的处理顺序对所述一组候选变异中的每个候选变异进行评估以及根据对所述候选变异的评估结果生成识别一个或多个候选变异的变异检测文件。本文还提供了一种计算机可读存储设备,通过联合评估映射到参考序列的两个以上的同源区域的读长来提高变异检测准确性。

【技术实现步骤摘要】

本公开描述的主题涉及生物信息学,尤其涉及一种用于实现生物信息学方案的系统、装置和方法,例如用于对集成电路(例如硬件处理平台)上的基因组数据执行分析的一个或多个函数。


技术介绍

1、如本公开详细描述的,高通量dna测序分析的一些主要计算挑战是可用基因组数据的爆炸式增长、收集数据时日益增长的准确度和灵敏度的需求、以及对来自基因组数据的各种测序数据集进行分析的快速、高效及准确的计算工具的需求。

2、与下一代基因测序仪(next gen sequencers)生成的如此增长的测序通量保持同步通常表现为多线程软件工具,多线程软件工具已经在计算机集群中的更多数量的更快处理器上执行,这些处理器需要大量的功率、显著的it支持成本及昂贵的高可用性存储器。重要的是,未来二级处理方案在通量测序速度的提高转化为加速增加的实际美元成本。

3、本公开提供的设备、系统及其使用方法,至少部分地用以解决这些和其他的这样挑战。


技术实现思路

1、本公开涉及用于对初级处理程序产生的数据(例如基因序列数据)执行一种或多种基因本文档来自技高网...

【技术保护点】

1.一种通过联合评估映射到参考序列的两个以上的同源区域的读长来提高变异检测准确性的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:从一个或多个记忆设备中获取参考序列的多个同源区域。

3.根据权利要求1所述的方法,其特征在于,通过所述联合堆积确定一组候选变异包括:使用De Brujin图从所述联合堆积中提取候选变异。

4.根据权利要求3所述的方法,其特征在于,

5.根据权利要求1所述的方法,其特征在于,由所述一台或多台计算机定义所述候选变异的处理顺序包括:由所述一台或多台计算机定义所述候选变异的处理...

【技术特征摘要】

1.一种通过联合评估映射到参考序列的两个以上的同源区域的读长来提高变异检测准确性的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:从一个或多个记忆设备中获取参考序列的多个同源区域。

3.根据权利要求1所述的方法,其特征在于,通过所述联合堆积确定一组候选变异包括:使用de brujin图从所述联合堆积中提取候选变异。

4.根据权利要求3所述的方法,其特征在于,

5.根据权利要求1所述的方法,其特征在于,由所述一台或多台计算机定义所述候选变异的处理顺序包括:由所述一台或多台计算机定义所述候选变异的处理顺序与读长的长度或插入大小的关系函数。

6.根据权利要求5所述的方法,其特征在于,定义所述候选变异的处理顺序与读长的长度或插入大小的关系函数包括:生成互连矩阵,其定义所述候选变异的处理顺序与读长的长度或插入大小的关系函数。

7.根据权利要求1所述的方法,其特征在于,由所述一台或多台计算机根据定义的处理顺序对所述一组候选变异中的每个候选变异进行评估包括:

8.一种通过联合评估映射到参考序列的两个以上的同源区域的读长来提高变异检测准确性的系统,其特征在于,所述系统包括:

9.根据权利要求8所述的系统,其特征在于,所述操作还包括:从一个或多个记忆设备中获取参考序列的多个同源区域。

10.根据权利要求8所述的系统,其特征在于,通过所述联合堆积确定一组候选变异包括:使用de brujin图从所述联合堆积中提取候选变异。

11.根据权利要求10所述的系统,其特征在于,

12.根据权利要求...

【专利技术属性】
技术研发人员:彼得·范·鲁彦迈克尔·吕勒拉米·梅约盖文·斯通马克·哈姆埃里克·奥加德阿姆农·帕塔希克
申请(专利权)人:伊路米纳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1