一种基于高通量测序的建库方法技术

技术编号:24609965 阅读:29 留言:0更新日期:2020-06-23 23:25
本发明专利技术公开了一种基于高通量测序的建库方法。该方法适用于片段化后的基因组DNA/FFPE RNA/cfDNActDNA等核苷酸样本。进一步将核苷酸样本片段进行修饰与变性、接头连接,再通过对目标区进行两次特异性PCR反应富集,可得到测序文库。对上述测序文库进行质控和定量分析,可进行高通量测序。本发明专利技术还提供了一种模拟双链连接接头。该建库方法简单方便,保留了基于扩增子的多重PCR建库方法的优点,同时可以用于检测未知融合,尤其适用于片段化程度较高的核苷酸样本(例如cfDNA/ctDNA样本),对于存在损伤的DNA分子也可以用于建库,本发明专利技术方法能够最大程度保留所有原始核苷酸信息,且使用该方法进行RNA建库时不需要进行二连合成操作。

A library building method based on high throughput sequencing

【技术实现步骤摘要】
一种基于高通量测序的建库方法
本专利技术属于生物
,具体涉及一种基于高通量测序的建库方法。
技术介绍
当今人类全基因组测序取得了巨大进展,但仍存在与该技术相关的解读数据库不够完整和准确、测序成本较高等问题,因此该技术较难分析某些富有挑战性的基因组区域。同时,该技术的高成本性及技术的复杂性限制了其在疾病、转化等特定基因组区域的应用。为此,针对特定基因组区域进行目标区富集的高通量测序建库的多种方法被广泛发展和应用,从而提高了覆盖率,并达到简化流程、降低成本的目的。本专利技术的建库方法即属于此种目标区富集的高通量测序建库方法。与本专利技术相关的现有技术包括如下三种:现有技术一:基于探针捕获法的建库方法。该建库方法的技术方案如图1A所示,包括以下步骤:(1)对片段化的核苷酸样本进行修饰,步骤包括(1)末端修复、补平和加A碱基;(2)使用T4DNA连接酶将接头连接上核苷酸样本,接头尾端的T碱基可以与步骤(1)中加的A碱基配对,形成连接产物;(3)使用包含有标签、测序引物识别区的P5和P7引物对连接产物进行PCR扩增得到全基因组文库;(4)使用标记有生物素的探针捕获目标区,探针是针对目标区设计的,并带有生物素修饰;(5)利用链霉素和生物素的亲和特性,使用标记有链霉素的磁珠纯化出捕获产物,得到目标区富集的文库;(6)将文库进行高通量测序,得到目标区富集的高通量测序数据。该建库方法存在以下缺点:(1)使用专用仪器真空泵将文库干燥脱水,再用杂交缓冲液溶解后,真空处理时容易导致交叉污染;(2)需要使用多种洗脱缓冲液对捕获产物进行清洗,去除非特异性结合,该步骤操作较为复杂,反应体系对温度敏感,实验员操作的熟练程度对目标产物的捕获效率影响较大;(3)如果存在有损伤的双链DNA分子(图1B),则无法被顺利扩增,导致原始DNA信息的丢失;(4)如果核苷酸样本是RNA,需要将该RNA样本先逆转录成cDNA,经过进一步PCR扩增得到双链DNA分子才能进行后续连接建库操作,流程复杂,成本较高。现有技术二:基于扩增子的多重PCR建库方法。该建库方法的技术方案如图2A所示,包括以下步骤:(1)使用多组覆盖目标区的引物对(包括正向和反向引物)同时扩增核苷酸样本;(2)使用尿嘧啶-N-糖基化酶(UNG酶)切除扩增产物上的引物序列,进行末端修复、补平和加A碱基;(3)使用T4DNA连接酶进行接头连接;(4)使用包含有标签、测序引物识别区引物对连接产物进行PCR扩增得到目标区富集的文库;(5)将文库进行高通量测序,得到目标区富集的高通量测序数据。该建库方法存在以下缺点:(1)依赖明确的正向和反向引物对目标区进行的PCR扩增,因此不能用于未知类型融合突变的检测;(2)如果存在有损伤的双链DNA分子(图2B),则无法被顺利扩增,导致原始DNA信息的丢失。现有技术三:基于单端巢式多重PCR的建库方法。该建库方法的技术方案如图3A所示,包括以下步骤:(1)对片段化的核苷酸样本进行修饰,步骤包括末端修复、补平和加A碱基,A碱基标记有生物素修饰;(2)使用T4DNA连接酶将接头连接上核苷酸样本,接头尾端的T碱基可以与步骤(1)中加的A碱基配对,形成连接产物;(3)利用链霉素和生物素的亲和特性,使用标记有链霉素的磁珠纯化连接产物;(4)使用通用引物和基因特异引物1对连接产物进行PCR扩增,通用引物识别的是接头上的区域,基因特异引物识别的是基因上的目标区;(5)使用包含有标签、测序引物识别区的标签扩增引物I5和I7引物,和基因特异引物2对步骤(4)的产物进行PCR扩增,得到目标区富集的文库。基因特异引物1和基因特异引物2针对的是同一个目标区,扩增方向相同,且相较于基因特异引物1,基因特异引物2更靠近目标区;(6)将文库进行高通量测序,得到目标区富集的高通量测序数据。上述建库方法存在以下缺点:(1)使用标记有生物素的磁珠富集连接产物,导致流程复杂,成本较高,反应体系对温度敏感,实验员操作的熟练程度直接影响到目标产物的捕获效率;(2)如果存在有损伤的双链DNA分子(图3B),则无法被顺利扩增,导致原始DNA信息的丢失;(3)如果核苷酸样本是RNA,需要将该RNA样本先逆转录成cDNA,经过进一步PCR扩增得到双链DNA分子才能进行后续连接建库操作,流程复杂,成本较高。
技术实现思路
针对以上情况,本专利技术的主要目的是为克服现有技术中的缺陷,而提供一种基于高通量测序的建库方法。该方法简单方便,保留了基于扩增子的多重PCR建库方法的优点,同时可以用于检测未知融合,尤其适用于片段化程度较高的核苷酸样本(例如cfDNA/ctDNA),对于存在损伤的DNA分子也可以用于建库,本专利技术所提供的方法能够最大程度保留所有原始信息,且使用该方法进行RNA建库时不需要进行二连合成操作。为了实现上述目的,本专利技术提供如下完整的技术方案:一种基于高通量测序的建库方法,其特征在于,包括以下步骤:(1)准备片段化的核苷酸样本;(2)热变性反应:去除上述核苷酸样本的5’端磷酸基团,然后将该核苷酸样本热变性成单链;(3)接头反应:在该单链的末端连接模拟双链连接接头,得到连接产物;(4)第一次目标区特异性PCR反应:使用第一基因特异性引物和通用引物对该连接产物进行第一次目标区特异性PCR反应富集,获得第一产物;(5)第二次目标区特异性PCR反应:使用第二基因特异性引物和标签扩增引物对上述第一产物进行第二次目标区特异性PCR反应富集,获得第二产物,该第二产物为测序文库;(6)高通量测序:对上述测序文库进行质控和定量分析,然后进行高通量测序;上述第一基因特异性引物与上述第二基因特异性引物的扩增方向相同,且第二基因特异性引物相较于第一基因特异性引物更靠近于目标区;上述分子标签序列可区分该连接产物、该第一产物和该第二产物中的目标基因片段的来源,该分子标签序列为3~16个碱基组成的随机简并碱基区域,该简并碱基为A、T、C或G;上述测序引物序列与通用引物序列的碱基互补配对;上述单链DNA识别区可识别目标基因,该单链DNA识别区为随机简并碱基区域,该简并碱基为A、T、C或G,该简并碱基具有硫代修饰;上述模拟双链连接接头由第一链和第二链组成,该第一链包括按照5’到3’方向依次排列的磷酸化末端、第一接头骨架序列、分子标签序列、测序引物序列和双脱氧末端;该第二链包括按照3’到5’方向依次排列的双脱氧末端、单链DNA识别区和第二接头骨架序列;该第一接头骨架序列与该第二接头骨架序列为碱基互补配对的核酸序列。进一步地,该通用引物的序列为5’-ACACTCTTTCCCTACACGAC-3’(SEQIDNO.001)。进一步地,该标签扩增引物包括标签扩增引物I7:5’-AATGATACGGCGACCACCGAGATCTACACCAGTGACTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’(SEQIDNO.002)和标签扩增引物I5:...

【技术保护点】
1.一种基于高通量测序的建库方法,其特征在于,包括以下步骤:/n(1)准备片段化的核苷酸样本;/n(2)热变性反应:去除上述核苷酸样本的5’端磷酸基团,然后将该核苷酸样本热变性成单链;/n(3)接头反应:在该单链的末端连接模拟双链连接接头,得到连接产物;/n(4)第一次目标区特异性PCR反应:使用第一基因特异性引物和通用引物对该连接产物进行第一次目标区特异性PCR反应富集,获得第一产物;/n(5)第二次目标区特异性PCR反应:使用第二基因特异性引物和标签扩增引物对上述第一产物进行第二次目标区特异性PCR反应富集,获得第二产物,所述第二产物为测序文库;/n(6)高通量测序:对上述测序文库进行质控和定量分析,然后进行高通量测序;/n上述第一基因特异性引物与上述第二基因特异性引物的扩增方向相同,且第二基因特异性引物相较于第一基因特异性引物更靠近于目标区;/n上述分子标签序列可区分该连接产物、该第一产物和该第二产物中的目标基因片段的来源,该分子标签序列为3~16个碱基组成的随机简并碱基区域,该简并碱基为A、T、C或G;上述测序引物序列与通用引物序列的碱基互补配对;上述单链DNA识别区可识别目标基因,该单链DNA识别区为随机简并碱基区域,该简并碱基为A、T、C或G,该简并碱基具有硫代修饰;上述模拟双链连接接头由第一链和第二链组成,该第一链包括按照5’到3’方向依次排列的磷酸化末端、第一接头骨架序列、分子标签序列、测序引物序列和双脱氧末端;该第二链包括按照3’到5’方向依次排列的双脱氧末端、单链DNA识别区和第二接头骨架序列;该第一接头骨架序列与该第二接头骨架序列为碱基互补配对的核酸序列。/n...

【技术特征摘要】
1.一种基于高通量测序的建库方法,其特征在于,包括以下步骤:
(1)准备片段化的核苷酸样本;
(2)热变性反应:去除上述核苷酸样本的5’端磷酸基团,然后将该核苷酸样本热变性成单链;
(3)接头反应:在该单链的末端连接模拟双链连接接头,得到连接产物;
(4)第一次目标区特异性PCR反应:使用第一基因特异性引物和通用引物对该连接产物进行第一次目标区特异性PCR反应富集,获得第一产物;
(5)第二次目标区特异性PCR反应:使用第二基因特异性引物和标签扩增引物对上述第一产物进行第二次目标区特异性PCR反应富集,获得第二产物,所述第二产物为测序文库;
(6)高通量测序:对上述测序文库进行质控和定量分析,然后进行高通量测序;
上述第一基因特异性引物与上述第二基因特异性引物的扩增方向相同,且第二基因特异性引物相较于第一基因特异性引物更靠近于目标区;
上述分子标签序列可区分该连接产物、该第一产物和该第二产物中的目标基因片段的来源,该分子标签序列为3~16个碱基组成的随机简并碱基区域,该简并碱基为A、T、C或G;上述测序引物序列与通用引物序列的碱基互补配对;上述单链DNA识别区可识别目标基因,该单链DNA识别区为随机简并碱基区域,该简并碱基为A、T、C或G,该简并碱基具有硫代修饰;上述模拟双链连接接头由第一链和第二链组成,该第一链包括按照5’到3’方向依次排列的磷酸化末端、第一接头骨架序列、分子标签序列、测序引物序列和双脱氧末端;该第二链包括按照3’到5’方向依次排列的双脱氧末端、单链DNA识别区和第二接头骨架序列;该第一接头骨架序列与该第二接头骨架序列为碱基互补配对的核酸序列。


2.根据权利要求1所述的一种基于高通量测序的建库方法,其特征在于,所述通用引物如SEQIDNO.001所示。


3.根据权利要求1所述的一种基于高通量测序的建库方法,其特征在于,所述标签扩增引物包括如SEQIDNO.002所示的标签扩增引物I7和如SEQIDNO.003所示的标签扩增引物I5。


4.根据权利要求1所述的一种基于高通量测序的建库方法,其特征在于,所述第二基因...

【专利技术属性】
技术研发人员:吴渊毕书琳李旭超李健鹏周文刚郑方克郑立谋
申请(专利权)人:上海厦维生物技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1