新型冠状病毒全基因组高通量测序文库的构建方法以及用于文库构建的试剂盒技术

技术编号:24670759 阅读:41 留言:0更新日期:2020-06-27 05:06
本发明专利技术提供新型冠状病毒全基因组高通量测序文库的构建方法以及用于文库构建的试剂盒。所述方法包括:1)病毒RNA反转录;2)利用锚定部分Illumina接头序列的多重扩增引物进行第一轮PCR反应;3)利用标签化Illumina文库扩增引物进行第二轮PCR反应,扩增产物经纯化,得到高通量测序文库。利用本发明专利技术提供的锚定多重扩增引物组合,能够对新型冠状病毒COVID‑19的基因组进行高效靶向富集,克服现有方法靶向性低,实验时效低,且易带入宿主背景污染的影响,有利于在较少的测序数据量、成本下,较短时间内完成COVID‑19的病毒全基因组测序,从而实现COVID‑19病毒的鉴别诊断以及病毒突变鉴定。

Construction of novel coronavirus whole genome high throughput sequencing library and kit for Library Construction

【技术实现步骤摘要】
新型冠状病毒全基因组高通量测序文库的构建方法以及用于文库构建的试剂盒
本专利技术涉及生物
,具体地说,涉及新型冠状病毒全基因组高通量测序文库的构建方法以及用于文库构建的试剂盒。
技术介绍
新型冠状病毒COVID-19(severeacuterespiratorysyndromecoronavirus2,SARS-CoV-2)属乙型冠状病毒属,和其他已发现的冠状病毒基因组类似,COVID-19基因组包含6个主要的开放阅读框(ORF,OpenReadingFrame),分别为orf1ab、ORF3a、ORF6、ORF7a、ORF8和ORF10,以及其他一些附属基因(accessorygenes),分别为S基因、E基因、M基因和N基因。通过对病毒进行全基因组高深度测序是目前灵敏度和特异性最强的获得病毒基因组整体核酸突变、病毒分型、进化关系研究的方法之一;但受制于宿主核酸背景干扰等因素,目前主流的病毒全基因组高通量测序方案均存在测序数据量要求大,实验成本较高、时效性较低等问题。目前由中国国家药品监督管理局(NMPA)审批的针对COVID-19的检测试剂盒,大多基于Taqman探针的荧光实时定量PCR(qRT-PCR)检测方法,IgG/IgM的胶体金抗体检测方法以及基于磁微粒化学发光法的IgM抗体检测方法;其中涉及核酸检测层面,qRT-PCR方法特异性较强,可在2h内完成阳性携病毒样本的相对定量;但由于RNA病毒的变异往往远快于其他类型病毒,一旦病毒基因组上的探针结合位置和特异性引物结合位置出现突变,同时受提取的病毒RNA质量和实验手段以及实验室人员操作等因素影响,灵敏度较低(假阴性较高),易出现Ct值不稳定或Ct值大于40等非置信数值,假阴性提高带来误诊率、漏诊率提高;基于免疫学抗体抗原反应的IgG/IgM的胶体金抗体检测,时效性极快,但假阳性高,仍需要后续的临床诊断支撑;CT检测作为临床确诊的金标准,依赖于大型仪器,普筛实现较难;而基于油包水微滴技术的数字PCR(ddPCR)特异性强,灵敏性较强;但其缺点在于,通量低,成本高,引物结合位置一旦出现突变,检出率会受到影响。而使用高通量测序研究微生物/病毒基因组领域,尤其是RNA病毒的研究中,主要以RNA-seq为主要技术手段对病毒全基因组测序,通过对宿主分离的总RNA进行宿主核糖体RNA(hrRNA,HumanRibosomalRNA)剔除(rRNAdepletion)进行二代测序文库的构建后测序,这种方法的缺点在于分离病毒时带入的宿主基因组和转录组信息会导致下机数据中来自病毒基因组reads只占极少的一部分(0.01-0.1%),因此起始核酸RNA要求量较高;同时,后续生信分析进行序列比对及组装时往往会存在一定比例的gap以及部分病毒基因组区域覆盖度和测序深度不足,整体覆盖度比例不足,下机数据量要求高(根据病毒大小和病毒在宿主中的丰度往往超过10Gdata以上),实验成本较高、时效性较低等缺点。最近一项发表在自然(Nature)期刊的研究成果表明,对一例人体分离的新型冠状病毒进行RNA-seq并通过宏基因组(Metagenomics)分析方法研究,在下机后所有获得的10038758的测序读长中,经过滤来自宿主人类的测序读长,最终只获得1582条测序读长用于后续的COVID-19分析。而通过靶向液相杂交捕获体系的病毒全基因组测序,特异性较强,数据量要求低;缺点在于,对于起始靶cDNA要求量较高,存在捕获不到病毒基因组的风险,同时探针设计费用高,时效性较慢(杂交捕获共计12h以上),临床转化适应度不高;通过文献检索,使用靶向多重PCR测序(TMS,TargetedMultiplexing-PCRSequencing)技术进行RNA病毒全基因组高通量测序的研究鲜有报道。为了弥补该领域技术空白,我们提出了一种基于靶向多重聚合酶链式反应扩增子测序(TargetedMultiplexedAmplicon-seq)的新型冠状病毒(COVID-19)全基因组突变快速鉴别诊断技术和试剂盒应用。该方法不受宿主基因组影响,针对COVID-2019的靶向性强,覆盖度高且均一,样本起始量要求低,实验及测序成本较现行病毒高通量测序方法大幅降低,时效性大幅提高,可实现对咽拭子、肺泡灌洗液等生物样本以及病毒培养样本中COVID-19病毒的高灵敏度,准确性以及全面的鉴别诊断。
技术实现思路
本专利技术的目的是提供一种基于靶向多重聚合酶链式反应扩增子测序技术(TargetedMultiplexedAmplicon-seq)构建新型冠状病毒全基因组高通量测序文库的方法以及用于文库构建的试剂盒。本专利技术的另一目的是提供上述方法在新型冠状病毒变异检测中的应用。为了实现本专利技术目的,第一方面,本专利技术提供一种新型冠状病毒全基因组高通量测序文库的构建方法,包括以下步骤:A、提取病毒样本RNA,反转录成单链cDNA或双链cDNA;B、根据已公布的新型冠状病毒COVID-19基因组序列,进行叠瓦式全覆盖式引物设计,分别设计得到锚定部分Illumina接头序列的多重扩增引物组1和锚定部分Illumina接头序列的多重扩增引物组2(锚定多重扩增引物组1和锚定多重扩增引物组2),以单链cDNA或双链cDNA为模板,分别利用引物组1、引物组2进行第一轮PCR反应,将扩增产物按照等摩尔量混合以覆盖病毒全基因组;C、以步骤B中混合后的扩增产物为模板,利用标签化Illumina文库扩增引物进行第二轮PCR反应,扩增产物经纯化,得到高通量测序文库;其中,步骤B中锚定部分Illumina接头序列的多重扩增引物组1和锚定部分Illumina接头序列的多重扩增引物组2的设计方法包括:B1、根据新型冠状病毒COVID-19基因组序列,设计非锚定多重扩增引物组,分别为多重特异性扩增引物组I和多重特异性扩增引物组II,引物组I包括正向引物F池和反向引物R池,引物组II包括正向引物F′池和反向引物R′池,每对正向引物和反向引物对应于一个扩增子;在引物组I的相邻两个扩增子序列内,分别设计引物组II的正向引物和反向引物,在引物组II的相邻两个扩增子序列内,分别设计引物组I的正向引物和反向引物,周而复始,直到引物组I对应的扩增子和引物组II对应的扩增子以叠瓦式覆盖病毒全基因组;B2、将Illumina部分接头序列①按照5′-3′方向添加到各正向引物的5′端,将Illumina部分接头序列②按照5′-3′方向添加到各反向引物的5′端;将带有Illumina部分接头序列①的正向引物F池和带有Illumina部分接头序列②的反向引物R池作为锚定部分Illumina接头序列的多重扩增引物组1;将带有Illumina部分接头序列①的正向引物F′池和带有Illumina部分接头序列②的反向引物R′池作为锚定部分Illumina接头序列的多重扩增引物组2;其中,Illumina部分接头序列①的序列如下:5′-I7标签化引物3′末端序列-AGATGTGTATAAGAGACAG-3′;本文档来自技高网
...

【技术保护点】
1.新型冠状病毒全基因组高通量测序文库的构建方法,其特征在于,包括以下步骤:/nA、提取病毒样本RNA,反转录成单链cDNA或双链cDNA;/nB、根据已公布的新型冠状病毒COVID-19基因组序列,进行叠瓦式全覆盖式引物设计,分别设计得到锚定部分Illumina接头序列的多重扩增引物组1和锚定部分Illumina接头序列的多重扩增引物组2,以单链cDNA或双链cDNA为模板,分别利用引物组1、引物组2进行第一轮PCR反应,将扩增产物按照等摩尔量混合以覆盖病毒全基因组;/nC、以步骤B中混合后的扩增产物为模板,利用标签化Illumina文库扩增引物进行第二轮PCR反应,扩增产物经纯化,得到高通量测序文库;/n其中,步骤B中锚定部分Illumina接头序列的多重扩增引物组1和锚定部分Illumina接头序列的多重扩增引物组2的设计方法包括:/nB1、根据新型冠状病毒COVID-19基因组序列,分别设计多重特异性扩增引物组I和多重特异性扩增引物组II,引物组I包括正向引物F池和反向引物R池,引物组II包括正向引物F′池和反向引物R′池,每对正向引物和反向引物对应于一个扩增子;在引物组I的相邻两个扩增子序列内,分别设计引物组II的正向引物和反向引物,在引物组II的相邻两个扩增子序列内,分别设计引物组I的正向引物和反向引物,周而复始,直到引物组I对应的扩增子和引物组II对应的扩增子以叠瓦式覆盖病毒全基因组;/nB2、将Illumina部分接头序列①按照5′-3′方向添加到各正向引物的5′端,将Illumina部分接头序列②按照5′-3′方向添加到各反向引物的5′端;将带有Illumina部分接头序列①的正向引物F池和带有Illumina部分接头序列②的反向引物R池作为锚定部分Illumina接头序列的多重扩增引物组1;将带有Illumina部分接头序列①的正向引物F′池和带有Illumina部分接头序列②的反向引物R′池作为锚定部分Illumina接头序列的多重扩增引物组2;/n其中,Illumina部分接头序列①的序列如下:5′-I7标签化引物3′末端序列-AGATGTGTATAAGAGACAG-3′;/nIllumina部分接头序列②的序列如下:5′-I5标签化引物3′末端序列-AGATGTGTATAAGAGACAG-3′;/n且I7标签化引物3′末端序列的大小为9~15bp,I5标签化引物3′末端序列的大小为8~14bp,以保证I7标签化引物和I5标签化引物可以特异性退火至扩增子上的3′末端结合位置。/n...

【技术特征摘要】
1.新型冠状病毒全基因组高通量测序文库的构建方法,其特征在于,包括以下步骤:
A、提取病毒样本RNA,反转录成单链cDNA或双链cDNA;
B、根据已公布的新型冠状病毒COVID-19基因组序列,进行叠瓦式全覆盖式引物设计,分别设计得到锚定部分Illumina接头序列的多重扩增引物组1和锚定部分Illumina接头序列的多重扩增引物组2,以单链cDNA或双链cDNA为模板,分别利用引物组1、引物组2进行第一轮PCR反应,将扩增产物按照等摩尔量混合以覆盖病毒全基因组;
C、以步骤B中混合后的扩增产物为模板,利用标签化Illumina文库扩增引物进行第二轮PCR反应,扩增产物经纯化,得到高通量测序文库;
其中,步骤B中锚定部分Illumina接头序列的多重扩增引物组1和锚定部分Illumina接头序列的多重扩增引物组2的设计方法包括:
B1、根据新型冠状病毒COVID-19基因组序列,分别设计多重特异性扩增引物组I和多重特异性扩增引物组II,引物组I包括正向引物F池和反向引物R池,引物组II包括正向引物F′池和反向引物R′池,每对正向引物和反向引物对应于一个扩增子;在引物组I的相邻两个扩增子序列内,分别设计引物组II的正向引物和反向引物,在引物组II的相邻两个扩增子序列内,分别设计引物组I的正向引物和反向引物,周而复始,直到引物组I对应的扩增子和引物组II对应的扩增子以叠瓦式覆盖病毒全基因组;
B2、将Illumina部分接头序列①按照5′-3′方向添加到各正向引物的5′端,将Illumina部分接头序列②按照5′-3′方向添加到各反向引物的5′端;将带有Illumina部分接头序列①的正向引物F池和带有Illumina部分接头序列②的反向引物R池作为锚定部分Illumina接头序列的多重扩增引物组1;将带有Illumina部分接头序列①的正向引物F′池和带有Illumina部分接头序列②的反向引物R′池作为锚定部分Illumina接头序列的多重扩增引物组2;
其中,Illumina部分接头序列①的序列如下:5′-I7标签化引物3′末端序列-AGATGTGTATAAGAGACAG-3′;
Illumina部分接头序列②的序列如下:5′-I5标签化引物3′末端序列-AGATGTGTATAAGAGACAG-3′;
且I7标签化引物3′末端序列的大小为9~15bp,I5标签化引物3′末端序列的大小为8~14bp,以保证I7标签化引物和I5标签化引物可以特异性退火至扩增子上的3′末端结合位置。


2.根据权利要求1所述的方法,其特征在于,步骤B中各引物对之间的Tm阈值差为±2℃;和/或
扩增子大小为200-300bp;和/或
引物设计时去除可能导致引物间或引物内部形成二聚体和茎环结构的引物对;和/或
在同一多重特异性扩增引物组中,使基因组上游扩增子的反向引物序列5’端位于下游扩增子的正向引物序列5’端的上游。


3.根据权利要求1所述的方法,其特征在于,步骤A中将RNA反转录成单链cDNA的方法选自如下a或b:
a、利用6-10bp随机引物引导单链cDNA合成;
b、利用来自反向引物R池和反向引物R′池中的若干条引物混合成一个特异性反转录引物组引导单链cDNA合成,且这些反向引物沿病毒基因组3′-5′方向均匀分布,引物间相隔800-1000bp;
步骤A中将RNA反转录成双链cDNA的方法包括:
i、利用6-10bp随机引物引导单链cDNA合成;
ii、在dNTPs存在的条件下,利用RNA酶H使RNA-cDNA杂合双链产生缺口;
iii、以缺口处的产生的小片段RNA为引物,利用RNA依赖性的DNA聚合酶合成双链cDNA。


4.根据权利要求1所述的方法,其特征在于,步骤C中标签化Illumina文库扩增引物如下:
I7标签化引物:5′-CAAGCAGAAGACGGCATACGAGAT(i7)GTCTCGTGGGCTCGG-3′,I5标签化引物:5′-AATGATACGGCGACCACCGAGATCTACAC(i5)TCGTCGGCAGCGTC-3′。


5.根据权利要求4所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:王洋李杰王辰高汉林郭超王健伟任丽丽杨明刘静赵晔
申请(专利权)人:福州福瑞医学检验实验室有限公司中国医学科学院
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利