一种基于高通量测序的线粒体序列拼接及拷贝数测定的方法技术

技术编号：19320907 阅读：100 留言：0更新日期：2018-11-03 11:08

本发明专利技术属于基因组学技术领域，具体涉及一种利用高通量测序(下一代测序、第二代测序、深度测序)技术直接测定真核生物线粒体序列及拷贝数的方法。本发明专利技术包括对总DNA进行高通量测序；测序数据的质控；基于类似宏基因组的序列拼接；线粒体含量的计算。本方法实现了在不需进行线粒体富集操作的前提下使用较少测序数据进行线粒体的组装，具有实验简单，样本质量要求低，拼接完整度好，可以测量线粒体相对含量的特点。可以在一定程度上满足科研及应用需求。

A method for sequencing and copy number determination of mitochondria based on high throughput sequencing

The invention belongs to the technical field of genomics, in particular to a method for directly determining mitochondrial sequence and copy number of eukaryotic organisms by high throughput sequencing (next generation sequencing, second generation sequencing, depth sequencing). The invention includes high throughput sequencing of total DNA, quality control of sequencing data, sequence splicing based on similar macrogenome, and calculation of mitochondrial content. This method realizes the assembly of mitochondria with less sequencing data without the need of mitochondrial enrichment. It has the characteristics of simple experiment, low sample quality requirement, good stitching integrity, and can measure the relative content of mitochondria. To a certain extent, it can meet the needs of scientific research and application.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于高通量测序的线粒体序列拼接及拷贝数测定的方法
本专利技术属于基因组学
，具体涉及一种利用高通量测序(下一代测序、第二代测序、深度测序)技术直接测定真核生物线粒体序列及拷贝数的方法。
技术介绍
线粒体是真核生物细胞中提供能量的细胞器，在生物体的能量转换和新陈代谢过程中占有核心地位。线粒体内部含有DNA，称为线粒体DNA(mitochondrialDNA,mtDNA)，mtDNA组成了与细胞核不同的基因组，即线粒体基因组。线粒体基因组大小远小于核基因组，通常后生动物的线粒体基因组只有十几kb大小，植物线粒体基因组则稍大，为数百kb左右。不同细胞中线粒体DNA拷贝数量差异很大，如肝脏细胞中可有1000-2000个线粒体，而红细胞内则没有线粒体。在不同个体间同样的组织中，线粒体数量的差异与个体间的健康状况有关，线粒体数量较少的个体表现得更加孱弱，线粒体数量的改变也与部分肿瘤的恶性转化、肿瘤进展、转移以及预后密切相关。对线粒体基因组进行测序的方法主要分为两种：Sanger测序法和高通量测序法。目前大多数的线粒体测序工作由Sanger法完成，通过对线粒体的一些区域设计十几对引物进行PCR反应，再对PCR产物逐段进行测序。该法有着成本高、实验周期长和不能测定线粒体拷贝数和变异的缺点。近年来随着技术的进步，高通量测序已经广泛地应用在生物学和医学的多个领域之中，其中也包括线粒体基因组的测序。利用高通量测序测定线粒体基因组序列遇到的主要问题是线粒体基因组在细胞总DNA中的占比很小，需要通过一定的手段将其放大。目前主流的方法一是通过设计多条引物，利用PCR或等温扩...

【技术保护点】
1.一种基于高通量测序的线粒体序列拼接及拷贝数测定的方法，其特征在于：1)利用高通量测序技术对线粒体进行组装拼接；2)测序数据与上述组装拼接进行比对；3)使用Reseqtools软件计算经过质量控制数据的总碱基数，记为Ntotal；4)计算拼接后的线粒体DNA总长度，记为Smito；5)使用samtools计算比对到线粒体DNA序列的reads的总碱基数，记为Nmito；6)归一化计算样本的拷贝数M＝(Nmito/Smito)/Ntotal。

【技术特征摘要】
1.一种基于高通量测序的线粒体序列拼接及拷贝数测定的方法，其特征在于：1)利用高通量测序技术对线粒体进行组装拼接；2)测序数据与上述组装拼接进行比对；3)使用Reseqtools软件计算经过质量控制数据的总碱基数，记为Ntotal；4)计算拼接后的线粒体DNA总长度，记为Smito；5)使用samtools计算比对到线粒体DNA序列的reads的总碱基数，记为Nmito；6)归一化计算样本的拷贝数M＝(Nmito/Smito)/Ntotal。2.按权利要求1所述的基于高通量测序的线粒体序列拼接及拷贝数测定的方法，其特征在于：所述对线粒体进行组装拼接为：(1)利用高通量测序技术对样本进行测序；(2)对高通量测序数据进行质量控制；(3)基于类似宏基因组方法的序列拼接；(4)从拼接数据中筛选出线粒体序列。3.按权利要求2所述的基于高通量测序的线粒体序列拼接及拷贝数测定的方法，其特征在于：所述步骤(1)中高通量测序的测序量应不低于所测样本基因组大小的25％。4.按权利要求2所述的基于高通量测序的线粒体序列拼接及拷贝数测定的方法，其特征在于：所述步骤(2)中测序数据的质量控制使用Trimmomatic软件对原始序列中低质量及接头序列进行去除。5.按权利要求2所述...

【专利技术属性】
技术研发人员：王尧峰，薛金会，郭海燕，王伟伟，程恩泽，
申请(专利权)人：胤安国际辽宁基因科技股份有限公司，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人