一种确定核酸序列的方法及系统技术方案

技术编号:13704565 阅读:95 留言:0更新日期:2016-09-12 03:05
本发明专利技术提供一种确定核酸序列的方法,包括,获取待测样本中的核酸,对所述核酸进行测序,获得由多个测序序列构成的测序结果;将所述测序结果进行过滤,所述过滤包括去除不确定碱基比例大于1%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段,获得过滤后的测序结果;将所述过滤后的测序结果与第一数据库进行第一比对,获得第一比对结果;以及将所述第一比对结果与第二数据库进行第二比对,获得第二比对结果;分析所述第二比对结果,确定待测样本的核酸序列。本发明专利技术还提供一种确定核酸序列的系统。本发明专利技术基于生物信息学分析手段与强大的数据库平台来对样本中的微生物种类进行鉴定,具有结果灵敏、特异性强等优点。

【技术实现步骤摘要】

本专利技术涉及生物
,具体的,一种确定核酸序列的方法及系统,以及一种计算核酸序列丰度及相对丰度的方法及系统。
技术介绍
人或动物的脑脊液中寄生有大量的细菌或病毒等微生物,通过对脑脊液中微生物的研究,可以促进对脑脊液中微生物的寄生情况更加了解。目前主要用于研究脑脊液中微生物的方法有抗原-抗体联合检测(酶标法)和荧光定量PCR技术等,这些技术目前在研究领域起了巨大的作用,但仍存在一些缺点。酶标法检测技术局限性很大,绝大多数情况下只能对已知的微生物进行相应的抗原抗体检测;而荧光定量PCR技术本身的优越性是无可厚非的,但对于脑脊液(CFS)样本来说,由于其细胞总RNA含量较低、并且容易降解,使用荧光定量PCR检测CSF中RNA较困难。因此,这些缺点需要应用新的技术去弥补。
技术实现思路
依据本专利技术的一方面,本专利技术提供一种确定核酸序列的方法,包括,(1)获取待测样本中的核酸,对所述核酸进行测序,获得由多个测序序列构成的测序结果;(2)将所述测序结果进行过滤,所述过滤包括去除不确定碱基比例大于1%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段,获得过滤后的测序结果;(3)将所述过滤后的测序结果与第一数据库进行第一比对,获得第一比对结果;以及(4)将所述第一比对结果与第二数据库进行第二比对,获得第二比对结果;(5)分析所述第二比对结果,确定待测样本的核酸序列。本专利技术另一方面提供一种计算核酸序列丰度及相对丰度的方法,包括:利用上述核酸序列的方法获得核酸序列信息;基于所述核酸序列信息,通过公式1计算待测样本中各物种的丰度,所述公式1为:1i为第二数据库中物种;N为比对到第二数据库的全部序列长度;Ni为比对到物种上的序列长度;Li为物种i的基因组长度;bi为丰度;以及,通过公式2计算待测样本中各物种的相对丰度,所述公式2为:2i,j为第二数据库中物种;sbi为相对丰度。本专利技术另一方面还提供一种确定核酸序列的系统,包括:测序结果获得模块,用于获取待测样本中的核酸,对所述核酸进行测序,获得由多个测序序列构成的测序结果;测序结果过滤模块,用于将所述测序结果进行过滤,所述过滤包括去除不确定碱基比例大于1%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段,获得过滤后的测序结果;第一比对模块,用于将所述过滤后的测序结果与第一数据库进行第一比对,获得第一比对结果;以及第二比对模块,用于将所述第一比对结果与第二数据库进行第二比对,获得第二比对结果;核酸序列确定模块,用于分析所述第二比对结果,确定待测样本的核酸序列。本专利技术另一方面还提供一种计算核酸序列丰度及相对丰度的系统,包括:核酸序列获取模块,用于利用前述确定核酸序列的系统获得所述核酸序列信息;计算模块,用于基于所述核酸序列信息,通过公式1计算待测样本中各物种的丰度,所述公式1为:1i为第二数据库中物种;N为比对到第二数据库的全部序列长度;Ni为比对到物种上的序列长度;Li为物种i的基因组长度;bi为丰度;以及,通过公式2计算待测样本中各物种的相对丰度,所述公式2为:2i,j为第二数据库中物种;sbi为相对丰度。本专利技术建立了一种高通量测序技术的用于辅助确定人或动物体内脑脊液中微生物的方法。该方法基于生物信息学分析手段与强大的数据库平台来对样本中的微生物种类进行鉴定,整个分析流程大约需要3-5天的时间。此方法弥补了常规培养检测方法检测周期长,微生物种类比较局限的缺点,可很好的应用于脑脊液中微生物的确定,并且具有结果灵敏、特异性强等优点。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1 显示了根据本专利技术的一个实施例,确定核酸序列的方法的流程图。具体实施方式本专利技术中的数据库为已知基因组数据库,本专利技术中所使用的“第一”、“第二”等仅为方便描述指代,不能理解为指示或暗示相对重要性,也不能理解为有先后顺序关系。本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。术语“丰度”指的是在限定的位置或群落中一种生物体的常见性或稀有性。例如,可以通过一般地测量样品中该生物体的总存在量来确定所述丰度。术语“相对丰度”指的是在限定的位置或群落中一种生物体相对于其它生物体的常见性或稀有性。例如,可以通过一般地测量样品中与生物体的总存在量相比的特定生物体的存在量来确定所述丰度。本专利技术提供一种确定核酸序列的方法,包括,(1)获取待测样本中的核酸,对所述核酸进行测序,获得由多个测序序列构成的测序结果;(2)将所述测序结果进行过滤,所述过滤包括去除不确定碱基比例大于1%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段,获得过滤后的测序结果;(3)将所述过滤后的测序结果与第一数据库进行第一比对,获得第一比对结果;以及(4)将所述第一比对结果与第二数据库进行第二比对,获得第二比对结果;(5)分析所述第二比对结果,确定待测样本的核酸序列。在本专利技术的一个实施例中,本专利技术的步骤(1)还包括:(a)获取待测样本中的核酸,所述核酸由多个DNA片段组成,所述DNA片段来自断裂的基因组DNA和/或游离的DNA片段,并且所述DNA片段具有平末端;(b)加碱基“A”至所述DNA片段的3’端,获得具有粘性末端A的DNA片段;(c)对所述具有粘性末端A的DNA片段添加接头,获得接头连接片段;(d)将接头连接片段进行PCR扩增,获得扩增产物;(e)将扩增产物进行纯化,获得纯化后的PCR产物;(f)对所述纯化后的PCR产物进行测序。进一步的,在获取所述待测样本中的核酸后,还可以将核酸片段进行打断。所述打断的方法可以采用本领域常规的方法进行,例如超声打断,优选采用covaris打断仪进行打断。打断后的片段长度为200-250 bp。进一步的,所述DNA片段具有平末端是通过末端修复的方法制备。根据本专利技术的一个实施例,在将DNA片段进行末端修复前,可以进一步包括纯化DNA片段的步骤,由此,使得后续的末端修复易于进行。根据本专利技术的实施例,将DNA片段进行末端修复可以利用Klenow片段、T4 DNA聚合酶和T4多核苷酸激酶进行,其中,所述Klenow片段具有5’—3’聚合酶活性和3’ —5’聚合酶活性,但缺少5’ —3’外切酶活性。由此,能够方便准确地对DNA片段进行末端修复。根据本专利技术的实施例,还可以进一步包括对经过末端修复的DNA片段进行纯化的步骤,由此能够方便地进行后续处理。进一步的,在经过末端修复的DNA片段的3’末端添加碱基A,以便获得具有粘性末端A的DNA片段。根据本专利技术的一个实施例,可以利用Klenow(3’ —5’exo-),即具有3’ —5’外切酶活性的Klenow,在经过末端修复的DNA片段的3’末端添加碱基A。由此,能够方便准确地将碱基A添加到经过末端修复的DNA片段的3’末端。根据本专利技术的实施例,还可以进一步包括对具有粘性末端A的DNA片段进行纯化的步骤,由此能够方便地进行后续处理。进一步的,对所述具有粘性末端A的DNA片段添加接头。进一步的,可以使用热启动taq DNA聚合酶对经过转换的目的片段进行PCR扩增。根据本专利技术的实施例,热启动taq DNA聚合酶的种类不受特别限制,根据本专利技术的具体示例,热启本文档来自技高网...

【技术保护点】
一种确定核酸序列的方法,其特征在于,包括,(1)获取待测样本中的核酸,对所述核酸进行测序,获得由多个测序序列构成的测序结果;(2)将所述测序结果进行过滤,所述过滤包括去除不确定碱基比例大于1%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段,获得过滤后的测序结果;(3)将所述过滤后的测序结果与第一数据库进行第一比对,获得第一比对结果;以及(4)将所述第一比对结果与第二数据库进行第二比对,获得第二比对结果;(5)分析所述第二比对结果,确定待测样本的核酸序列。

【技术特征摘要】
1.一种确定核酸序列的方法,其特征在于,包括,(1)获取待测样本中的核酸,对所述核酸进行测序,获得由多个测序序列构成的测序结果;(2)将所述测序结果进行过滤,所述过滤包括去除不确定碱基比例大于1%的读段和/或碱基质量值不大于5的碱基数的比例不小于50%的读段,获得过滤后的测序结果;(3)将所述过滤后的测序结果与第一数据库进行第一比对,获得第一比对结果;以及(4)将所述第一比对结果与第二数据库进行第二比对,获得第二比对结果;(5)分析所述第二比对结果,确定待测样本的核酸序列。2.根据权利要求1所述的方法,其特征在于,所述步骤(1)还包括:(a)获取待测样本中的核酸,所述核酸由多个DNA片段组成,所述DNA片段来自断裂的基因组DNA和/或游离的DNA片段,并且所述DNA片段具有平末端;(b)加碱基“A”至所述DNA片段的3’端,获得具有粘性末端A的DNA片段;(c)对所述具有粘性末端A的DNA片段添加接头,获得接头连接片段;(d)将接头连接片段进行PCR扩增,获得扩增产物;(e)将扩增产物进行纯化,获得纯化后的PCR产物;(f)对所述纯化后的PCR产物进行测序。3.根据权利要求1所述的方法,其特征在于,所述步骤(3)还包括:将所述过滤后的测序结果与第一数据库进行第一比对,去除匹配的测序序列,获得非匹配的测序序列。4.根据权利要求1所述的方法,其特征在于,所述步骤(4)还包括:将所述第一比对结果与第二数据库进行第二比对,获得匹配的测序序列,去除非匹配的测序序列。5.根据权利要求1所述的方法,其特征在于,所述第一数据库为宿主基因数据库;所述第二数据库为细菌数据库或病毒数据库至少之一;所述宿主为人或动物。6.一种计算核酸序列丰度及相对丰度的方法,其特征在于,包括:利用权利要求1所述的方法获得核酸序列信息;基于所述核酸序列信息,通过公式1计算待测样本中各物种的丰度,所述公式1为:1i为第二数据库中物种;N为比对到第二数据库的全部序列...

【专利技术属性】
技术研发人员:张印新韩颖鑫王佳伟高晓峘张春生李胜
申请(专利权)人:广州精科生物技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1