一种快速获得脊椎动物线粒体基因组序列的方法技术

技术编号:37343852 阅读:15 留言:0更新日期:2023-04-22 21:35
本发明专利技术属于生物技术领域,具体涉及线粒体DNA的基因文库的建立方法和获取线粒体基因组序列的方法。建立文库的方法为:(1)样本总DNA与RNA探针杂交后,捕获靶序列;(2)收集靶序列并进行扩增,获得扩增后的线粒体DNA。扩增后的DNA进行破碎、平末端修复、连接测序接头和索引PCR,构建文库。所获得基因文库进行测序,并对测序后的结果进行组装。本发明专利技术的方案,在构建测序文库之前即对原始的长片段线粒体DNA进行富集,可获得更多线粒体DNA数据,从而提高富集效率,提高线粒体基因组数据量占比和覆盖度,可实现完整组装;同时降低了组装所需的数据量,大大降低测序成本。本发明专利技术无需相应物种参考基因组,可以相对快速、经济地获得各种脊椎动物的线粒体全基因组,为建立脊椎动物环境DNA线粒体基因组数据库提供了可行的技术路线。线。线。

【技术实现步骤摘要】
一种快速获得脊椎动物线粒体基因组序列的方法


[0001]本专利技术属于生物
,具体涉及线粒体DNA的基因文库的建立方法和获取线粒体基因组序列的方法。

技术介绍

[0002]动物线粒体基因序列具有母系遗传、拷贝数多、基因组序列数据量较核基因组小等特点,同时其整体上变异速率较高,但部分基因编码参与极为重要的生命活动而变异相对保守。基于此,动物线粒体基因序列成为了系统发育学与生态学等研究领域的良好工具。比如,目前环境DNA研究常以线粒体基因序列来评估环境中生物的种类和数量。然而不同研究者往往采用不同的线粒体基因标记,例如CO1,12S等基因序列,造成环境DNA数据库难以统一。同时,单个或数个分子标记的分析结果也往往不足以将一个具体生境情况研究透彻,而研究者们基于不同标记所开发的环境DNA采集提取、扩增富集和处理分析手段不尽相同,这又为科学家们选取适用于自身研究的方法设置了门槛,也增加了试错成本。而使用完整的线粒体基因组序列作为环境DNA数据库将解决上述问题。因为单位点线粒体基因或多位点线粒体基因的研究都可以使用线粒体基因组数据库作为参考数据库,而不受方法的限制,并且完整的线粒体基因组所提供的相应物种信息远大于数个位点基因序列,多位点结合分析后亦可解决因序列信息不足所导致的物种鉴定难题。
[0003]然而,用线粒体基因组作为环境DNA的数据库需要获得大量的线粒体基因组数据,而当前获得线粒体基因组获得方法要么耗时耗力,要么价格昂贵,如基于PCR和Sanger测序的引物步移法(Primer Walking)或长片段PCR扩增法(Long

range PCR Amplification),以及基于高通量测序的基因组概览(Genome Skimming)。
[0004]不同组织细胞中线粒体拷贝数具有显著差异,在含有线粒体的细胞中,线粒体的数量从数个到数百个不等。一般而言,动物肝脏和肌肉组织中的线粒体数量最多,相应的线粒体DNA的含量也更多。而核DNA与线粒体DNA在细胞裂解后也难以分开,因此目前没有专门用于提取线粒体的方法,而是直接提取全基因组DNA,随后用不同的手段将线粒体DNA纯化,便于后续的分析。
[0005]尽管线粒体DNA在细胞中拥有多个拷贝,但比起序列长度可达数十亿碱基的核DNA仍然是极其微小的一部分,因此,无论是哪一种测序方法,都需要对线粒体DNA进行一定程度的纯化,以提高其占比,从而增加测序的效率。而纯化某一类目标DNA通常采用两种思路:一种是将目标DNA通过PCR等手段进行扩增,增加有效数据量,从而提高其比例;另一种则是通过设计探针,杂交捕获目标DNA,同时洗去非目标DNA片段,使非目标DNA的数量下降,也能提高目标DNA的比例。
[0006]要想获得一个物种的完整线粒体基因组,除了上述DNA的提取、纯化与测序之外,还需要对测序的结果进行组装和校对。而在这个过程中,如果我们有目标物种的线粒体基因组参考序列,或是其近缘种的线粒体基因组参考序列,那么通过映射(mapping)的方式可以快速简便地获得较为准确的结果,但在研究过程中,研究者们往往会遇到不能确定目标
物种的具体类型,或者通过形态学鉴定后发现没有目标物种的参考序列,那么组装的过程就会复杂许多。
[0007]靶序列捕获(Target Sequence Capture),也被称为基因捕获或基因富集,是一种用于捕获科学家感兴趣的目标序列的方法。它通常基于事先设计的RNA或DNA诱饵(探针),与已经建好的DNA文库中的目标序列杂交,再利用一系列手段将富集到的序列分离纯化以用于测序或下游实验。是利用探针杂交的原理将研究者们感兴趣的核酸片段富集纯化,从而提高有效数据的占比,降低测序和分析成本。该类方法的出现顺应了高通量测序技术的发展。此外也有利用核酸蛋白复合体如CRISPR/Cas系统对目标序列进行捕获的方法。
[0008]例如Sevigny J等根据所有后生动物的线粒体基因组序列设计探针,随后利用探针对任意后生动物的高通量测序文库进行富集,富集后测序。但由于探针设计采用全序列,大幅增加了合成成本,加上富集只针对文库短序列,有效数据占比不高,位点外信息不全,因此成本高,效率低。
[0009]因此,需要建立一种能够快速获得线粒体基因组序列的方法,提高有效数据占比,降低测序成本,同时能够获得更全面的序列信息。

技术实现思路

[0010]本专利技术旨在提供建立快速获得动物线粒体基因组序列的方法。
[0011]一种用于富集线粒体DNA的RNA探针,其核苷酸含有选自SEQ ID No.1

No.11中的任意一个或任意多个的序列。
[0012]优选的,所述RNA探针的核苷酸序列选自SEQ ID No.1

No.11中的任意一个或任意多个的序列。
[0013]更优选的,所述RNA探针的核苷酸序列如SEQ ID No.1

No.11所示。
[0014]进一步,所述的RNA探针用生物素修饰。
[0015]上述的RNA探针可用于富集动物线粒体、测定动物线粒体基因组序列、获取动物线粒体基因组序列或者建立动物环境DNA线粒体基因组数据库。尤其是用于富集脊椎动物线粒体、测定脊椎动物线粒体基因组序列、获取脊椎动物线粒体基因组序列或者建立脊椎动物环境DNA线粒体基因组数据库。
[0016]本专利技术另一个方案为,一种建立线粒体基因组文库的方法,包括以下步骤:
[0017](1)样本总DNA与上述的RNA探针杂交后,捕获靶序列;
[0018](2)收集靶序列并进行扩增,获得扩增后的线粒体DNA。
[0019]优选的,步骤(2)中,用修饰链霉亲和素的磁珠收集靶序列。
[0020]步骤(2)中,用多次退火环状循环扩增,然后清洗获得扩增后的线粒体DNA。
[0021]进一步,所述建立线粒体基因组文库的方法还包括以下步骤:
[0022]扩增后的线粒体DNA进行破碎、平末端修复、连接测序接头和索引PCR,构建文库。
[0023]本专利技术的另一个方案为,一种快速获得脊椎动物线粒体基因组序列的方法,其特征在于,包括以下步骤:
[0024]I.将上述方法获得的基因文库进行测序;
[0025]II.测序后的结果进行组装。
[0026]优选的,步骤II中,采用Trinity和NOVOPlasty进行组装。
[0027]进一步,用Trinity从头组装筛选得到的保守位点读序,组装出保守位点序列的重叠群(contig)后,由NOVOPlasty进行延伸,得到完整的线粒体基因组。
[0028]优选的,测序结果经过预处理,随后根据富集位点的保守序列利用BLAST筛选出最相似的序列,再用Trinity从头组装。组装结果再进一步利用BLAST筛选得到最相似的contig,并使用NOVOPlasty,对最终的contig进行延伸,得到完整的线粒体基因组。
[0029]本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于富集线粒体DNA的RNA探针,其特征在于,其核苷酸含有选自SEQ ID No.1

No.11中的任意一个或任意多个的序列。2.根据权利要求1所述的RNA探针,其特征在于,其核苷酸序列选自SEQ ID No.1

No.11中的任意一个或任意多个的序列。3.根据权利要求1或2所述的RNA探针,其特征在于,所述的RNA探针用生物素修饰。4.权利要求1

3任一项所述的RNA探针在富集脊椎动物线粒体、测定脊椎动物线粒体基因组序列、获取动物线粒体基因组序列或者建立动物环境DNA线粒体基因组数据库中的应用。5.一种建立线粒体基因组文库的方法,其特征在于,包括以下步骤:(1)样本总DNA与权利要求1

3任一项所述的RNA探针杂交后,捕获靶序列;(2)收集靶序列并进行扩增,获得扩增后的线粒体D...

【专利技术属性】
技术研发人员:李晨虹陈文隽王颖刘芊芊
申请(专利权)人:上海海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1