【技术实现步骤摘要】
一种结合二代和三代测序的多菌株全基因组分析方法
[0001]本专利技术属于环境微生物领域,公开了一种结合二代和三代测序的多菌株全基因组分析方法
。
技术介绍
[0002]微生物菌株全基因组测序能够全面
、
精确分析细菌基因组的碱基组成,是掌握菌株系统分类
、
基因突变
、
代谢功能等的重要手段
。
菌株全基因组测序分析方法目前流行的有3种,即二代测序
、
三代测序以及传统二代
‑
三代混合测序
。
二代测序技术成本较低,但由于读长短,生成的基因组数据完整性和拼装质量较差,组装获得的基因组通常存在较多的缺失序列
。
因此,二代测序很难或者几乎不能获得完整的环状
DNA
,对菌株基因组的测序完整度一般只能达到
90
%左右
。
为填补上述缺失序列
、
获得完成的基因组,还需要进行一代测序或三代测序
。
其中,一代测序填补缺失序列的方法非常繁琐,涉及特异性引物设计
、
克隆文库建立
、
蓝白斑筛选
、
一代测序
、
序列拼装等复杂过程
。
一代测序填补缺失序列需要在每个缺失序列前后设计引物,建立克隆文库,最后通过一代测序获得缺失序列的序列信息
。
三代测序技术具有长读长的优势,但价格比较昂贵,常用的技术包括
...
【技术保护点】
【技术特征摘要】
1.
一种结合二代和三代测序的多菌株全基因组分析方法,其特征在于,步骤包括:
S1
:提取多个菌株的基因组
DNA
,得到每个菌株的单独
DNA
样品,并测定所述单独
DNA
样品中的
DNA
浓度;将多个菌株的单独
DNA
样品进行二代测序得到单独样品下机数据,对所述单独样品下机数据分别进行质量控制
、
过滤和去嵌合体后,得到单独样品读长序列;对于有参考基因组的菌株,采用
Sibelia
算法进行组装;对于无参考基因组的菌株,采用
De Bruijn
图算法进行组装;最终获得每个菌株的支架数据,即获得基因组草图;
S2
:将所述单独
DNA
样品根据
DNA
浓度等质量比混合,获得多个菌株的
DNA
混合样品;将多个菌株的
DNA
混合样品进行三代测序得到混合样品下机数据,对所述混合样品下机数据进行质量控制
、
过滤和去嵌合体后,得到混合样品有效数据;对所述混合样品有效数据进行修剪和组装,获得三代测序组装的
DNA
混合样品的长读长;
S3
:利用三代测序获得的长读长数据,逐一填补步骤
S1
中二代测序获得的每个菌株支架数据中的缺失序列,从而获得完整
、
封闭成环的菌株基因组完整图
。2.
根据权利要求1所述的结合二代和三代测序的多菌株全基因组分析方法,其特征在于,所述二代测序采用
Illumina
二代测序,所述三代测序采用
Oxford Nanopore
三代测序
。3.
根据权利要求1所述的结合二代和三代测序的多菌株全基因组分析方法,其特征在于,
S1
中所述
DNA
浓度采用生物检测分析仪检测
。4.
根据权利要求2所述的结合二代和三代测序的多菌株全基因组分析方法,其特征在于,每个菌株的
Illumina
二代测序数据量为
6.0Gb。5.
根据权利要求2所述的结合二代和三代测序的多菌株全基因组分析方法,其特征在于,
Illum...
【专利技术属性】
技术研发人员:何崭飞,谷涵远,沈佳泉,杨莹莉,李群群,潘响亮,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。