当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于高通量测序的线粒体全基因组测序方法技术

技术编号:19712449 阅读:76 留言:0更新日期:2018-12-08 18:23
本发明专利技术公开了一种基于二代测序的简单、经济、准确的线粒体全基因组barcode扩增测序方法。该发明专利技术设计了两组互相配合的引物,其中第一组引物由61对互相重叠并覆盖线粒体全基因的目标片段引物序列和引物接头序列组成,第二组引物由包含接头序列的,可以两两搭配的的正向和反向标签引物组成,用于标记不同来源的样本。通过两对引物的配合使用,在一次PCR反应中同时加入两对引物进行扩增,得到带标记的、长度合适的、包含线粒体全基因组的扩增子,混合后直接进行建库测序,实现多样本混合测序。测序数据应用生物信息学组装技术,同时识别头尾两端标记序列,将不同来源序列区分开来,得到所有样本的所有线粒体基因组序列信息。通过本方法的使用,简化测序实验步骤,大大降低测序成本,提高低频突变的检出率,为大样本的线粒体全基因组关联研究提供可能性。

【技术实现步骤摘要】
一种基于高通量测序的线粒体全基因组测序方法
本专利技术属于基因工程领域,具体涉及一种线粒体DNA全基因组测序的方法。
技术介绍
线粒体是生物体新陈代谢和能量转化的重要细胞器。人类线粒体DNA(mtDNA),是由16571bp脱氧核糖核酸组成的双链闭合环状分子,其编码的蛋白是呼吸链重要的组成成分。在法医学、人类学和遗传学研究中均有重要的作用。mtDNA在人群水平具有非常高的变异性,而特定的mtDNA变异会影响线粒体的功能。这种改变不仅可能造成氧化磷酸化和能量代谢异常,而且会引起凋亡等相关通路改变,在衰老和许多复杂性疾病的发生和发展过程中起到了重要作用。人们设想相同的mtDNA变异可能会增加几种不同疾病的发病风险。早期的mtDNA与疾病关联研究证据强度低,研究的可重复性较小,而近来越来越多的研究,发现了可重复的,高证据强度的mtDNA与疾病的关联,尤其是在神经退行性疾病,如帕金森病中。GavinHudson等人的研究分析了mtDNA变异与许多复杂性晚发性疾病的关联,证实了之前的设想,这为基于基因组关联研究(Genome-wideassociationstudy,GWAS)的线粒体遗传学分析提供了理论基础。准确的测序方法,是线粒体全基因组关联研究的基础。早期造成mtDNA与疾病关联研究异质性较大的一个重要原因,可能是由于mtDNA单倍体分型和测序方法较为粗略。人类第一个全序列测定mtDNA被称为剑桥标准序列(Cambrigereferencesequence,CRS),其后,有若干修正版本,称为修正剑桥序列(revisedCRS,rCRS)。传统的mtDNA全测序,是基于PCR扩增产物的Sanger测序,无论是线粒体控制区(controlregion)还是全基因组测序,都无法达到很高的敏感性,这是由mtDNA自身特点决定的。线粒体DNA具有很高的突变率,尤其是在高变区,且修复机制并不完善。而且不同组织的细胞中所含的线粒体数量是不同的,对于核基因来说,某一位点只有两个等位基因,某一位置只有未突变、一个拷贝突变或者两个拷贝突变三种情况,而线粒体DNA的突变则更为复杂,其突变频率可以是0.1%到100%的任何一个比例。对于低频突变,传统的Sanger测序无法检测,需要深度测序才能准确发现。同时,过去许多线粒体单倍体分型策略也是基于一代测序。由于测序工作的繁琐、测序费用昂贵以及后期分析的工作量巨大,许多分型策略仅仅针对于控制区,这为分型和研究的准确性造成了困难。也有许多研究试图采取控制区测序与部分编码区测序相结合的方法来进行分型,但是这种改善也相当有限。下一代测序(nextgenerationsequencing,NGS)的发展,使得mtDNA测序和研究得到了很大的进展。测序通量的大幅度提高,使得低频率的mtDNA变异也能被检测出来。尽管在NGS出现早期,线粒体基因组由于片段较小,性价比太低限制了其应用,但是随着测序费用的下降和越来越多新的测序策略的应用,近年来使用NGS来进行线粒体基因组序列的研究数量大幅度增长。研究线粒体DNA多样性是一项挑战,虽然线粒体DNA丰度不及总DNA的1%,但它在细胞中拷贝数变化较大,同时核DNA测序结果经常被线粒体DNA混淆。线粒体深度测序策略,在mtDNA富集、片段化长度、是否有混合样本以及如何混合方面各有不同。mtDNA的富集有分离法、扩增法和目标片段捕获这几种方法。经典的方法之一,就是将mtDNA从细胞中分离出来,比较常用的是氯化铯超速离心法、柱层析法以及碱变性等方法提取mtDNA,再进行测序,这种方法理论上可以绝对消除核基因的影响。然而,由于获得mtDNA需要花费大量的时间,产量较低,而且实际应用当中无法避免包括核DNA杂质的干扰,使得该方法受到很大限制。而基于扩增法富集mtDNA,则有很大优势。目前有长片段、中等片段和短片段扩增等不同的方法,将mtDNA扩增为相互重叠的PCR产物,修剪成大小合适的片段用于高通量测序。这种方法法较简单且准确率高,只是在引物设计,尤其是长片段扩增的引物设计时会比较困难。还有一种方法则是目标序列捕获,利用微阵列技术合成与mtDNA互补的寡核苷酸探针,富集目标mtDNA片段,然后对该片段进行高通量测序。基于PCR扩增法的测序策略,根据扩增片段的长短各有优劣。片段长,工作量小、假基因干扰少,但是突变率高,准确性较低;而片段越短,突变少准确率高,但是相应的工作量较大且易于被假基因干扰。混合样本的测序则可以在单次测序运行内获得大量线粒体基因数据,目前比较常见的是在构建DNA测序文库时对不同来源的样本添加条形码或者标记序列,然后在读取时通过这些标签区分开。这种方法在不同的测序平台已经有一些商业化的试剂盒,但是每个样本构建单独的测序文库,建库花费较大,成本提高。有人专利技术了目标扩增测序(targetedamplicomsequencing,TAS)的标签技术,通过两步PCR将10bp的标签连接到PCR产物上,直接进行高通量测序。然而两步法PCR在实际应用当中,尤其是样本扩增,会增加不少工作量。最近,又有人提出,可以直接将带有barcode的引物序列直接连接在目标序列引物上,减少PCR扩增工作量,然而这种方法如果应用于较多片段的扩增测序,会在引物的花费和barcode序列的消耗上大大增加。
技术实现思路
由于目前方法存在各种各样不同的局限,本专利技术提供一种简单、经济、准确的线粒体全基因组barcode扩增测序方法,为大样本的线粒体全基因组关联研究提供可能性。本专利技术在覆盖线粒体全基因的目标片段引物序列中加入一段通用引物接头(commentail),构成引物1,易于与包含互补接头的barcode引物(引物2)连接,搭配使用,同时引物2的正向和反向引物序列也可两两交叉搭配,通过以上设计大大减少了引物量;采用一次PCR扩增,使用两组引物,直接在扩增目标片段的同时加入引物2序列标记,减少工作量;所有扩增片段长度合适,无需打断,混合后无需特殊识别,直接进行建库测序,以减少建库成本,而所得的二代测序数据深度使得低频突变的检出率大大提高;后期数据应用较高的生物信息学组装技术,同时识别头尾两端引物2序列,将不同来源序列区分开来。本专利技术采用如下技术方案:一种基于高通量测序的线粒体全基因组测序方法,步骤如下:(1)提取全血细胞总基因组DNA;(2)设计两组引物,其中第一组引物包含61对引物1,61对引物1覆盖线粒体全基因组,且均包含粘性接头,引物序列分别如SEQIDNO.1~122所示;其中,SEQIDNO.(2n-1)和SEQIDNO.(2n)组成一对引物,n=1,2……,61;第二组引物,包含多个正向引物和相同数量的反应引物,任一正向引物可与任一方向引物进行配对,组成引物2;所述正向引物和反向引物均包含与第一组引物的粘性接头配对的粘性接头,用于标记不同样本;第二组引物中的正向引物包括SEQIDNO.123~126,反向引物包括SEQIDNO.127~130;(3)将多个不同来源的全血细胞总基因组DNA,利用交叉混合一步法分别进行PCR扩增,扩增子的长度不大于450bp;(4)将步骤3获得的所有扩增子混合纯化后使用IlluminaHiseq2500PE250进行建库及测序;(5本文档来自技高网
...

【技术保护点】
1.一种基于高通量测序的线粒体全基因组测序方法,其特征在于,具体步骤如下:(1)提取全血细胞总基因组DNA;(2)设计两组引物,其中第一组引物包含61对引物1,61对引物1覆盖线粒体全基因组,且均包含粘性接头,引物序列分别如SEQ ID NO.1~122所示;第二组引物,包含多个正向引物和相同数量的反应引物,任一正向引物可与任一方向引物进行配对,组成引物2;所述正向引物和反向引物均包含与第一组引物的粘性接头配对的粘性接头,用于标记不同样本;第二组引物中的正向引物包括SEQ ID NO.123~126,反向引物包括SEQ ID NO.127~130;(3)将多个不同来源的全血细胞总基因组DNA,利用交叉混合一步法分别进行PCR扩增,扩增子的长度不大于450bp;(4)将步骤3获得的所有扩增子混合纯化后使用Illumina Hiseq2500 PE250进行建库及测序;(5)测序数据进行分析。

【技术特征摘要】
1.一种基于高通量测序的线粒体全基因组测序方法,其特征在于,具体步骤如下:(1)提取全血细胞总基因组DNA;(2)设计两组引物,其中第一组引物包含61对引物1,61对引物1覆盖线粒体全基因组,且均包含粘性接头,引物序列分别如SEQIDNO.1~122所示;第二组引物,包含多个正向引物和相同数量的反应引物,任一正向引物可与任一方向引物进行配对,组成引物2;所述正向引物和反向引物均包含与第一组引物的粘性接头配对的粘性接头,用于标记不同样本;第二组引物中的正向引物包括SEQIDNO.123~126,反向引物包括SEQIDNO.127~130;(3)将多个不同来源的全血细胞总基因组DNA,利用交叉混合一步法分别进行PCR扩增,扩增子的长度不大于450bp;(4)将步骤3获得的所有扩增子混合纯化后使用IlluminaHiseq2500PE250进行建库及测序;(5)测序数据进行分析。2.根据权利要求1所述的方法,其特征在于...

【专利技术属性】
技术研发人员:陈江华郎夏冰杨毅杨万岭郭梦彪张彦
申请(专利权)人:浙江大学香港大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1