The invention discloses a composition of microbial community V1/V2 hypervariable region 16S rRNA gene based method and apparatus. The method comprises the following steps: extraction of microbial DNA in the sample, the sample DNA 16S rRNA hypervariable region V1/V2 were amplified by PCR; the results of Solexa database, and through the joint with a label sequence and in the construction process, for each sample mark; mixed with different samples tag sequence, mixed use Solexa after sequencing tools were sequenced, got the original sequences according to the label to distinguish long read (reads); the overlapping relationship read length of assembly sequence of the full-length sequence of the hypervariable region of V1/V2 or V6 (unique reads); comparative analysis of full-length sequence similarity to read long. In order to realize the calculation of classification samples and relative abundance of microorganisms. The method and apparatus of the present invention are accurate in analyzing the composition of microbial communities.
【技术实现步骤摘要】
一种基于高通量测序的微生物群落组成的方法和装置
本专利技术涉及生物信息学分析
,尤其涉及一种微生物基因组16SrRNA高可变区V6区域的分类方法和装置。
技术介绍
为了微生物群体的种类及丰度的传统方法包括:直接对微生物进行培养,变性梯度凝胶电泳、末端限制性内切酶片段长度多态性、焚光原位杂交、对可能的微生物种类进行PCR(聚合酶链式反应);但这些方式都只能揭露环境中很小一部分微生物种类。如果能进行宏基因组的分析,通过直接对环境中的微生物群体进行基因组研究,得到一个比较全面的微生物种类目录,将有助于对微生物群体的后续研究和应用。原核生物中16SrRNA(核蛋白核糖核酸,ribosomalRNA)的序列一方面在整体上高度保守,同时含有种间差异的高变异区(V1-V7),因此该基因医疗可精确指示细菌之间的亲缘关系及其进化关系,易操作,适用于各级分类单元;所以在微生物基因组的研究中,16SrRNA测序是最常用的聚类和分类方法。但传统的基因测序是通过Sanger技术测定16SrRNA基因序列,这个技术一般得到至少500bp的读长,能帮助我们去精准地研究每一条序列的物种来源,但它容易产生嵌合体,而且测序成本比较高,费时又费力。随着新开发出的测序技术以及测序成本的逐步降低,基因组的研究变得越来越实用,所涉及的技术包括Pyrosequencing、Solexa等。对于这些革命性的技术的一个主要挑战就是读长太短,无法对每个个体的16SrRNA进行测序,因而它的测序信息不足以让我们去精准地对微生物进行分类。但测定16SrRNA的变异区可用来来对微生物进行分类,通过设计特定的 ...
【技术保护点】
一种对微生物16S rRNA基因高可变区V1/V2进行高通量测序聚类分析的方法,其特征在于,该方法包括:提取微生物样品中的脱氧核糖核酸(DNA);对提取DNA的宏基因组16S核糖体核糖核酸(rRNA)的高可变区V6进行扩增,得到作为扩增产物的DNA片段;对DNA片段进行PCR‑Free Solexa建库,建库过程中在DNA片段上加上标签序列以对每个样品进行标记;将各个样品的带有标签序列的DNA片段进行混合,使用Solexa测序工具对混合后的DNA片段进行测序,得到按照标签区分的测序读长(reads);利用测序序列的重叠关系组装得到高可变区V6的全长序列(unique reads);对全长序列进行分类分析,以实现对微生物群体的分类。
【技术特征摘要】
1.一种对微生物16SrRNA基因高可变区V1/V2进行高通量测序聚类分析的方法,其特征在于,该方法包括:提取微生物样品中的脱氧核糖核酸(DNA);对提取DNA的宏基因组16S核糖体核糖核酸(rRNA)的高可变区V6进行扩增,得到作为扩增产物的DNA片段;对DNA片段进行PCR-FreeSolexa建库,建库过程中在DNA片段上加上标签序列以对每个样品进行标记;将各个样品的带有标签序列的DNA片段进行混合,使用Solexa测序工具对混合后的DNA片段进行测序,得到按照标签区分的测序读长(reads);利用测序序列的重叠关系组装得到高可变区V6的全长序列(uniquereads);对全长序列进行分类分析,以实现对微生物群体的分类。2.根据权利要求1所述的方法,其特征在于,所述对全长序列进行分类分析包括:计算全长序列之间的序列差异度;根据序列差异度执行操作分类学单元(OTU)的分类,将全长序列分配到OTU中;将每一个OTU分类中的全长序列比对到16SrRNA的V6数据库中,将比对结果根据众数原则对OTU进行物种注释。3.根据权利要求1所述的方法,其特征在于,该方法还包括:在对测序序列进行分类分析之后,基于分类分析结果,进行种群多样性分析和/或统计得到微生物群体的相对丰度值。4.根据权利要求1所述的方法,其特征在于,所述对DNA片段进行PCR-FreeSolexa建库进一步包括:将所述DNA片段进行纯化;对纯化后的DNA片段进行浓度定量;定量后不同样品取等浓度的量分别进行末端修复,在3’端加上碱基A,然后加上标签序列,再进一步加上PCR-Free的接头;对得到的样品进行纯化。5.根据权利要求1所述的方法,其特征在于,该方法还包括:在得到按照标签区分的测序序列后,对所述测序序列进行筛选,以过滤掉低质量的测序序列;所述低质量的测序序列选自以下序列中的任意一种或数种:接头污染序列,含有多个poly(A|T|C|G)的序列、以及含有连续2个以上的未确定核苷酸(N)的序列。6.根据权利要求1所述的方法,其特征在于,所述的利用测序序列的重叠关系组装得到高可变区V6的全长序列进一步包括:运用拼接软件,根据序列两端的重叠关系对读长进行拼接,将其组装成V6的全长序列;拼接的条件是最小匹配长度为S3P,重叠区域不允许错配,N所占最大百分比是0.4%;不满足以上结果的序列将各切除5bp继续组装,如此重复多次;如果最终的拼接结果小于50bp也不用于后续分析。7.一种基于16SrRNA基因高可变区V6的分类装置,所述装置包括:DNA提取设备,用于提取微生物...
【专利技术属性】
技术研发人员:朱永亮,
申请(专利权)人:苏州普瑞森基因科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。