一种用于判别和校准高通量测序污染的内标及其应用制造技术

技术编号:20885267 阅读:26 留言:0更新日期:2019-04-17 13:34
本发明专利技术提供了一种用于判别和校准高通量测序污染的内标以及使用该内标判别和校准高通量测序污染的方法。本发明专利技术的内标是长度在几十到几百个碱基或碱基对的DNA或RNA片段,每一个样本对应不同的内标。本发明专利技术的内标不仅能精确而可靠的判别和校准高通量测序中的污染,还可以用作测序时的碱基平衡以及用于跟踪PCR及测序过程中的错误率。

【技术实现步骤摘要】
一种用于判别和校准高通量测序污染的内标及其应用
本专利技术属于高通量测序领域,具体地,属于体外诊断
,涉及一种用于判别和校准高通量测序污染的内标以及使用该内标判别和校准高通量测序污染的方法,以及其他各种用途。
技术介绍
高通量测序(NGS)能一次并行对几十万到几百万条DNA分子进行序列测定,可逆末端终止测序,半导体测序,焦磷酸测序等都属于高通量测序。高通量测序的基础是构建样本的测序文库。根据测序的对象,分为DNA文库和RNA文库,DNA文库包括但不限于全基因组文库、全外显子组文库、靶向DNA文库;RNA的cDNA文库包括但不限于总RNA文库、全转录组文库、小RNA文库、非编码RNA文库、靶向RNA文库。根据文库构建方法,分成扩增法构建文库如PCR文库制备,连接法构建文库如truseq法文库构建,转座子法构建文库如nextera法文库制备,浓缩法构建文库如Enrichment法文库制备等;无论是那种测序对象、哪种文库构建方法,在构建测序文库时都需要用到测序接头(adapter,负责将需要测序的序列连接在测序芯片上。其一端与测序芯片上锚定的序列互补,另一端根据需要设计,如与引物、index互补)、引物(负责扩增样本,构建测序文库);多样本混合测序时则都需要用到样本标签(barcode或index,index专指6-8个碱基的样本身份识别序列,本文统一使用index)。测序接头(adapter)起到桥接作用,其序列的一头通过碱基识别被固定在测序芯片上,另一头则根据需要及实验步骤接上了index、引物和目标序列;引物则根据不同文库的需要设计,如全基因组文库通用引物,全外显子组文库通用引物,RNA转化成cDNA文库后的通用引物,靶向测序引物等等;样本标签的作用是多个样本混合在一个反应池中测序时,区分每个样本。由于高通量测序的单位成本比较高,如果每个样本要测的序列比较少,通常将多个样本混合成一个“测序样本”,大大节约测序成本。这就需要用到样本标签(index)来区分每个样本。每个样本都含有至少1个特异性的样本标签,如果样本太多标签不够,也可以采用样本片段两头各1个标签的组合来决定标签的唯一性。然而,在大量样本混合测序的实际应用的过程中,本专利技术发现,样本和样本之间、标签和标签之间可能形成相互污染,例如:在样本核酸提取过程中造成的样本相互污染,在标签合成、纯化、使用过程中造成的标签相互污染。根据近几年高通量测序业务实际测试情况来看,样本核酸提取过程中的污染率达到0-50%;标签合成和纯化过程中的污染率达到1-2%,使用过程中的污染率达到0-20%。以上高通量测序业务均在条件合格的GMP实验室进行,科研环境中污染可能更甚。问题造成的后果:在把样本混合进行测序时,样本或标签相互污染可能造成样本检测结果的误读。通常污染的量占单个样本的总量比较小,如果用于胚系基因测序,基本没有影响;然而,当将高通量测序技术应用于体细胞突变、罕见低频突变,如肿瘤突变检测、病毒诱导的体细胞突变时,就变得非常棘手:一是在突变早期,突变的细胞只占机体正常细胞的极少数,这时候就无法区分是突变还是样本或标签之间的污染造成的样本误读;二是病理组织本身,特别是肿瘤组织本身就在不断形成新的突变,每种突变占到病理组织细胞总量的极少数,如果样本或标签之间相互污染,也给突变的解读造成了无法排除的干扰。随着医学的发展,采用高通量测序来检测肿瘤的突变,根据突变结果制定治疗方案和用药建议,已经成为主流趋势,目前我国已陆续有多个肿瘤突变高通量测序试剂盒获批。高通量测序的污染问题正亟待控制和规范。
技术实现思路
本专利技术旨在解决高通量测序中的污染问题,为解决该问题,本专利技术在每个样本或标签中引入一个内标(InnerControl)来校正污染。具体地,本专利技术通过如下技术方案克服了高通量测序中的污染问题。在一个方面,本专利技术提供一种用于判别和校准高通量测序污染的内标,其特征在于:该内标为一段DNA或RNA片段,长度在几十到几千个碱基或碱基对;优选地,所述内标长度在几十到几百个碱基或碱基对;同批次每一个样本对应一个或多个不同的内标,优选地,同批次每一个不同的样本对应一个不同的内标;可选地,所述内标为单链,或可选地,所述内标为双链;可选地,所述内标为人工合成,或可选地,所述内标为外源物种序列,或可选地,所述内标为样本本身的一段序列;可选地,所述内标需被引物识别,或可选地,所述内标不需要被引物识别;应该理解,该内标为DNA或RNA,可由实际情况而定,都在本专利技术的保护范围之内;应该理解,内标的长度实际情况而定,本专利技术并不限于特定的长度;应该理解,同批次每一个样本对应不同的多个内标,或同批次每一个不同的样本对应一个不同的内标,可由实际情况而定,都在本专利技术的保护范围之内;应该理解,所述内标为单链或双链,可由实际情况而定,都在本专利技术的保护范围之内;应该理解,所述内标人工合成,或为外源物种序列,或为样本本身的一段序列,可由实际情况而定,都在本专利技术的保护范围之内;应该理解,所述内标是否需被引物识别,可由实际情况而定,都在本专利技术的保护范围之内;应该理解,内标添加量可以为不影响检测和分析的合适范围,可由实际情况而定,并不限定于特定的浓度,优选添加量小于样本的10%,更优选添加量为样本的1%-2%。在一个实施方式中,本专利技术提供一种用于判别和校准高通量测序污染的内标如下:该内标为一段单链DNA片段,长度在几十到几百个碱基;该内标为人工合成或外源物种PCR产物;同批次每一个样本对应不同的内标。在又一个方面,本专利技术提供一种用于判别和校准高通量测序污染的内标引物如下:一对或数对引物,专门针对单个样本中某一段或几段DNA或RNA片段,本文称之为内标引物;针对的片段长度最短不短于引物长度,最长不超过高通量测序仪读长;同批次每一个样本使用不同的内标引物,在文库构建过程中扩增出各样本不同的片段,成为内标,所述内标具有上面内标所有的特征。在又一个方面,本专利技术提供了一种判别和校准高通量测序污染的方法,所述方法包括在高通量测序过程中引入本专利技术所述的内标。在一个实施方式中,本专利技术的判别和校准高通量测序污染的方法包括如下步骤:(1)加入本专利技术的内标或内标引物;(2)在文库构建过程中用样本标签标记样本,在拿到高通量测序原始数据后,进行样本分离时,将具有相同样本标签的数据划分到同一个子集中;(3)识别该子集的内标,有且仅有与某一个样本对应的内标的,被判定为正常,具有与该样本不同的一个或多个其他内标的,被判定为污染。在上述步骤(1)中,将内标或内标引物添加到文库构建开始之前的反应体系中,添加方式选自如下:A.文库构建之前,根据文库构建的步骤需要,如果是先进行一些操作步骤后加样本标签的文库构建方法,则将内标或内标引物加入样本或文库构建引物中;B.如果是先加样本标签后进行文库构建操作步骤的方法,则可以将内标或内标引物加入样本中,或标签中,或文库构建引物中,或上述材料的各种组合混合物中。在步骤(2)中,应该理解,可以按照常规方法测试并获得高通量测序原始数据,本专利技术并不限于具体的测序方法。在又一个实施方式中,本专利技术的判别和校准高通量测序污染的方法包括如下步骤:(1)加入本专利技术的内标或内标引物;(2)在文库构建过程中用样本标签标记样本,本文档来自技高网
...

【技术保护点】
1.一种用于判别和校准高通量测序污染的内标,其特征在于:所述内标为DNA或者RNA片段;所述内标长度在几十到几千个碱基或碱基对;所述内标为单链或者双链;所述内标选自人工合成、外源物种序列、样本本身的一段序列;所述内标需被引物识别,或者所述内标不需要被引物识别;同批次每一个样本对应不同的内标,或者同批次每一个不同的样本对应一个不同的内标。

【技术特征摘要】
1.一种用于判别和校准高通量测序污染的内标,其特征在于:所述内标为DNA或者RNA片段;所述内标长度在几十到几千个碱基或碱基对;所述内标为单链或者双链;所述内标选自人工合成、外源物种序列、样本本身的一段序列;所述内标需被引物识别,或者所述内标不需要被引物识别;同批次每一个样本对应不同的内标,或者同批次每一个不同的样本对应一个不同的内标。2.根据权利要求1所述的用于判别和校准高通量测序污染的内标,其特征在于:所述内标的长度在几十到几百个碱基;所述内标为人工合成或外源物种PCR产物;同批次每一个样本对应不同的内标。3.一种用于判别和校准高通量测序污染的内标引物,其特征在于:所述内标引物专门针对单个样本中某一段或几段DNA或RNA片段;所述内标引物针对的片段长度最短不短于引物长度,最长不超过高通量测序仪读长;同批次每一个样本使用不同的内标引物,在文库构建过程中扩增出各样本不同的片段,成为内标,所述内标如权利要求1所述的内标。4.一种判别和校准高通量测序污染的方法,其特征在于,所述方法包括在每个样本或标签中引入如权利要求1-3中任一项所述的内标或内标引物。5.根据权利要求4所述的判别和校准高通量测序污染的方法,其特征在于,所述方法包括如下步骤:(1)加入如权利要求1-3中任一项所述的内标或内标引物;(2)在文库构建过程中用样本标签标记样本,获得高通量测序原始数据,进行样本分离,将具有相同样本标签的数据划分到同一个子集中;(3)识别该子集的内标,有且仅有与某一个样本对应的内标的,被判定为正常,具有与该样本不同的一个或多个其他内标的,被判定为污染。6.根据权利要求4所述的判别和校准高通量测序污染的方法,其特征在于,所述方法包括如下步骤:(1)加入如权利要求1-3中任一项所述的内标或内标引物;(2)在文库构建过程中用样本标签标记样本,获得高通量测序原始数据,进行样本分离,先抽取一个内标的测序数据,将...

【专利技术属性】
技术研发人员:雷向东邓丽盈
申请(专利权)人:上海境象生物科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1