用于对生物分子进行测序的方法技术

技术编号:24018491 阅读:41 留言:0更新日期:2020-05-02 04:21
一种用于提供对生物分子的测序的系统和方法,该系统和方法能够用于进行测试样本与正常样本的差异分析。方法能够涉及以下步骤:提供试验测试样本和试验正常样本中的每个的映射的序列文件,其中,每个序列文件具有试验读取数量;由处理器根据所述试验测试样本和所述试验正常样本的所述序列文件来计算第一测试‑正常基因组比较试验视图,其中,所述第一试验视图基于至少一个基因组参数将试验测试样本数据与试验正常样本数据区分开;由所述处理器针对每个序列文件计算具有减少的试验读取数量的下采样的序列文件;由所述处理器根据所述试验测试样本和所述试验正常样本的所述下采样的序列文件来计算第二测试‑正常基因组比较试验视图,其中,所述第二试验视图基于所述至少一个基因组参数将所述试验测试样本数据与所述试验正常样本数据区分开;重复所述下采样的步骤以确定用于计算测试‑正常基因组比较视图所需的最少试验读取数量,所述测试‑正常基因组比较视图基于所述至少一个基因组参数将所述试验测试样本数据与所述试验正常样本数据区分开;使用等于所述最少试验读取数量的读取数量对所述测试样本和所述正常样本的生物分子进行测序;并且由所述处理器基于所述至少一个基因组参数来计算用于显示所述差异分析的测试‑正常基因组比较视图。

Methods for sequencing biological molecules

【技术实现步骤摘要】
【国外来华专利技术】用于对生物分子进行测序的方法
本专利技术涉及用于生物分子的下一代测序(NGS)的方法和系统。该系统能够使用来自用户定义样本的序列比对映射的二元BAM文件作为输入。对映射的BAM文件进行下采样能够用于确定获得关键生物信息所需的减少的读取数量。
技术介绍
在过去的几年中,生物分子的测序成本已经下降到大约百分之一,2016年每个基因组的成本大约为1000美元(参见例如https://www.genome.gov/27541954/dna-sequencing-costs-data/)。然而,由于生物序列信息在医学、药学、诊断学以及许多新的商业应用中的使用数量不断增加,因此近年来对序列数据和分析的需求急剧增加。随着要研究的样本或序列的数量的增加,对有效存储和分析序列数据的需求也已经大大增加。减少数量和成本的一种方法是进行多路复用样本测序。通过多路复用,而不是在测序仪的一个通道中对单个样本进行测序,能够一起加载能够具有独特条形码的多个样本。当对样本进行多路复用时获得的数据总量会减少。不幸的是,在一些研究应用中,减少每个样本的序列数据总量可能会使相本文档来自技高网...

【技术保护点】
1.一种用于对生物分子进行测序以进行测试样本与正常样本的差异分析的方法,所述方法包括:/n提供试验测试样本和试验正常样本中的每个的映射的序列文件,其中,每个序列文件具有试验读取数量;/n由处理器根据所述试验测试样本和所述试验正常样本的所述序列文件来计算第一测试-正常基因组比较试验视图,其中,所述第一试验视图基于至少一个基因组参数将试验测试样本数据与试验正常样本数据区分开;/n由所述处理器针对每个序列文件计算具有减少的试验读取数量的下采样的序列文件;/n由所述处理器根据所述试验测试样本和所述试验正常样本的所述下采样的序列文件来计算第二测试-正常基因组比较试验视图,其中,所述第二试验视图基于所述至...

【技术特征摘要】
【国外来华专利技术】20170818 US 62/547,3371.一种用于对生物分子进行测序以进行测试样本与正常样本的差异分析的方法,所述方法包括:
提供试验测试样本和试验正常样本中的每个的映射的序列文件,其中,每个序列文件具有试验读取数量;
由处理器根据所述试验测试样本和所述试验正常样本的所述序列文件来计算第一测试-正常基因组比较试验视图,其中,所述第一试验视图基于至少一个基因组参数将试验测试样本数据与试验正常样本数据区分开;
由所述处理器针对每个序列文件计算具有减少的试验读取数量的下采样的序列文件;
由所述处理器根据所述试验测试样本和所述试验正常样本的所述下采样的序列文件来计算第二测试-正常基因组比较试验视图,其中,所述第二试验视图基于所述至少一个基因组参数将所述试验测试样本数据与所述试验正常样本数据区分开;
重复所述下采样的步骤以确定用于计算测试-正常基因组比较视图所需的最少试验读取数量,所述测试-正常基因组比较视图基于所述至少一个基因组参数将所述试验测试样本数据与所述试验正常样本数据区分开;
使用等于所述最少试验读取数量的读取数量对所述测试样本和所述正常样本的生物分子进行测序;并且
由所述处理器基于所述至少一个基因组参数来计算用于显示所述差异分析的测试-正常基因组比较视图。


2.根据权利要求1所述的方法,其中,所述映射的序列文件是BAM文件或SAM文件。


3.根据权利要求1所述的方法,其中,所述生物分子是多核苷酸或多肽。


4.根据权利要求1所述的方法,其中,所述生物分子是DNA、RNA或蛋白质。


5.根据权利要求1所述的方法,其中,所述差异分析将疾病测试样本与正常样本区分开。


6.根据权利要求1所述的方法,其中,所述差异分析将肿瘤测试样本与正常样本区分开。


7.根据权利要求1所述的方法,其中,所述试验读取数量被减少到500万。


8.根据权利要求1所述的方法,其中,所述试验读取数量被减少到100万。


9.根据权利要求1所述的方法,其中,等于所述最少试验读取数量的读取数量为500万。


10.根据权利要求1所述的方法,其中,等于所述最少试验读取数量的读取数量为100万。


11.根据权利要求1所述的方法,其中,映射的BAM文件由下一代测序来供应。


12.根据权...

【专利技术属性】
技术研发人员:张贻谦N·迪米特罗娃B·S·桑塔纳姆
申请(专利权)人:皇家飞利浦有限公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1