一种结合二代和三代测序的多菌株全基因组分析方法技术

技术编号:39581455 阅读:6 留言:0更新日期:2023-12-03 19:31
本发明专利技术公开了一种结合二代和三代测序的多菌株全基因组分析方法,属于环境微生物领域

【技术实现步骤摘要】
一种结合二代和三代测序的多菌株全基因组分析方法


[0001]本专利技术属于环境微生物领域,公开了一种结合二代和三代测序的多菌株全基因组分析方法


技术介绍

[0002]微生物菌株全基因组测序能够全面

精确分析细菌基因组的碱基组成,是掌握菌株系统分类

基因突变

代谢功能等的重要手段

菌株全基因组测序分析方法目前流行的有3种,即二代测序

三代测序以及传统二代

三代混合测序

二代测序技术成本较低,但由于读长短,生成的基因组数据完整性和拼装质量较差,组装获得的基因组通常存在较多的缺失序列

因此,二代测序很难或者几乎不能获得完整的环状
DNA
,对菌株基因组的测序完整度一般只能达到
90
%左右

为填补上述缺失序列

获得完成的基因组,还需要进行一代测序或三代测序

其中,一代测序填补缺失序列的方法非常繁琐,涉及特异性引物设计

克隆文库建立

蓝白斑筛选

一代测序

序列拼装等复杂过程

一代测序填补缺失序列需要在每个缺失序列前后设计引物,建立克隆文库,最后通过一代测序获得缺失序列的序列信息

三代测序技术具有长读长的优势,但价格比较昂贵,常用的技术包括
PacBio

Oxford Nanopore。
其中,
Oxford Nanopore
技术可以直接对
DNA
进行测序,样品输入量要求更低,设备便携,测序速度快,价格相对于
PacBio
技术较低,更适合微生物的基因组研究

除了价格昂贵,三代测序还存在碱基错误率高的问题

传统二代

三代混合测序技术的测序质量和基因组完整度都较高

[0003]在环境微生物的纯菌研究中,经常需要对多个菌株的全基因组进行分析,需要同时大批量获得多个菌株的完成的

封闭成环的基因组完成图

针对上述情况,传统的二代

三代混合测序方法用于环境微生物测序的费用非常昂贵

因此,亟需一种针对环境微生物更廉价的测序分析方法


技术实现思路

[0004]本专利技术的目的在于解决现有技术中存在的问题,提供了一种结合二代和三代测序的多菌株全基因组分析方法

[0005]为了实现上述专利技术目的,本专利技术所用的具体技术方案如下:
[0006]本专利技术提供一种结合二代和三代测序的多菌株全基因组分析方法,步骤包括:
[0007]S1
:提取多个菌株的基因组
DNA
,得到每个菌株的单独
DNA
样品,并测定单独
DNA
样品中的
DNA
浓度

将多个菌株的单独
DNA
样品进行二代测序得到单独样品下机数据,对单独样品下机数据分别进行质量控制

过滤和去嵌合体后,得到单独样品读长

[0008]对于有参考基因组的菌株,采用
Sibelia
算法进行组装

对于无参考基因组的菌株,采用
De Bruijn
图算法进行组装

最终获得每个菌株的支架数据,即获得基因组草图

[0009]S2
:将单独
DNA
样品根据
DNA
浓度等质量比混合,获得多个菌株的
DNA
混合样品

将多个菌株的
DNA
混合样品进行三代测序得到混合样品下机数据,对混合样品下机数据进行
质量控制

过滤和去嵌合体后,得到混合样品有效数据

对混合样品有效数据进行修剪和组装,获得三代测序组装
DNA
混合样品的长读长

[0010]S3
:利用三代测序获得的长读长数据,逐一填补步骤
S1
中二代测序获得的每个菌株支架数据中的缺失序列,从而获得完整

封闭成环的菌株基因组完整图

[0011]作为优选,上述二代测序采用
Illumina
二代测序,三代测序采用
Oxford Nanopore
三代测序

[0012]作为优选,上述
S1
中的
DNA
浓度采用生物检测分析仪检测

[0013]作为优选,上述每个菌株的
Illumina
二代测序数据量为
6.0Gb。
[0014]作为优选,上述
Illumina
二代测序得到的单独样品下机数据使用
FastQC
软件进行首次质量控制,使用
fastp
软件进行过滤,再次使用
FastQC
软件进行二次质量控制,得到
Illumina
二代测序读长序列

使用
MetaSPAdes
软件,将
Illumina
二代测序获得的读长序列组装成菌株支架数据

[0015]作为优选,上述
Oxford Nanopore
三代测序数据量范围为
(0.05

0.1)
×
mGb
,其中
m

DNA
混合样品中待分析的菌株数量

[0016]作为优选,上述
Oxford Nanopore
三代测序得到的混合样本下机数据使用
NanoPlot
软件进行首次质量控制,使用
filtlong
软件进行数据过滤,再次使用
NanoPlot
软件进行二次质量控制

[0017]作为优选,上述
S2
中的混合样品有效数据进行修剪和组装的过程采用
flye
软件

[0018]作为优选,上述三代测序组装
DNA
混合样品长读长序列的过程使用
flye
软件

[0019]作为优选,上述填补过程使用
Unicycler
软件,利用
Oxford Nanopore
三代测序产生的长读长序列,对
Illumina
二代测序生成的每个菌株的支架数据逐一进行拼装和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种结合二代和三代测序的多菌株全基因组分析方法,其特征在于,步骤包括:
S1
:提取多个菌株的基因组
DNA
,得到每个菌株的单独
DNA
样品,并测定所述单独
DNA
样品中的
DNA
浓度;将多个菌株的单独
DNA
样品进行二代测序得到单独样品下机数据,对所述单独样品下机数据分别进行质量控制

过滤和去嵌合体后,得到单独样品读长序列;对于有参考基因组的菌株,采用
Sibelia
算法进行组装;对于无参考基因组的菌株,采用
De Bruijn
图算法进行组装;最终获得每个菌株的支架数据,即获得基因组草图;
S2
:将所述单独
DNA
样品根据
DNA
浓度等质量比混合,获得多个菌株的
DNA
混合样品;将多个菌株的
DNA
混合样品进行三代测序得到混合样品下机数据,对所述混合样品下机数据进行质量控制

过滤和去嵌合体后,得到混合样品有效数据;对所述混合样品有效数据进行修剪和组装,获得三代测序组装的
DNA
混合样品的长读长;
S3
:利用三代测序获得的长读长数据,逐一填补步骤
S1
中二代测序获得的每个菌株支架数据中的缺失序列,从而获得完整

封闭成环的菌株基因组完整图
。2.
根据权利要求1所述的结合二代和三代测序的多菌株全基因组分析方法,其特征在于,所述二代测序采用
Illumina
二代测序,所述三代测序采用
Oxford Nanopore
三代测序
。3.
根据权利要求1所述的结合二代和三代测序的多菌株全基因组分析方法,其特征在于,
S1
中所述
DNA
浓度采用生物检测分析仪检测
。4.
根据权利要求2所述的结合二代和三代测序的多菌株全基因组分析方法,其特征在于,每个菌株的
Illumina
二代测序数据量为
6.0Gb。5.
根据权利要求2所述的结合二代和三代测序的多菌株全基因组分析方法,其特征在于,
Illum...

【专利技术属性】
技术研发人员:何崭飞谷涵远沈佳泉杨莹莉李群群潘响亮
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1