基于宏基因组和宏转录组识别油藏驱油功能微生物的方法技术

技术编号：36602507 阅读：22 留言：0更新日期：2023-02-04 18:19

本发明专利技术涉及一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法，包括以下步骤：S1：自油藏产出水样提取总DNA和总RNA；S2：对获得的总DNA和总RNA进行测序，获取油藏样品的宏基因组和宏转录组原始数据；S3：通过对宏基因组和宏转录组结果进行分析，识别具有驱油功能的微生物。与现有技术相比，本发明专利技术不依赖传统的速度较慢的微生物单菌分离鉴定手段，适合处理未知物种较多的样本，且可检测极低丰度物种，检测全面、快速。快速。

全部详细技术资料下载

【技术实现步骤摘要】
基于宏基因组和宏转录组识别油藏驱油功能微生物的方法

[0001]本专利技术涉及微生物检测
，尤其是涉及一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法。

技术介绍

[0002]我国稠油资源量约为198.7亿吨，年产量高达3087万吨(2017年)，已占原油总产量的16.2％。由于稠油粘度高(50
‑
10000mPa.s)，在油藏中流动性差，一般以蒸汽热采方法为主，而热采法耗能大、成本高、开采效果差。此外，油藏是一个天然生物反应发生器，同时蕴含了具有各种功能的好氧及厌氧微生物。通过利用微生物来采油的技术绿色环保、成本低，可用于稠油开采，其主要机理是通过微生物在油藏中乳化原油、产气、产表面活性剂、产多糖和降解烃等五方面功能降低稠油粘度、提高水驱效率。
[0003]近20年来，对油藏环境中微生物的研究已经从最初的纯菌分离培养模式过渡到了依赖测序的分子生物学研究方式。其中，测序手段可以大致分为依赖PCR扩增的测序技术和不依赖PCR扩增的宏基因组与宏转录组测序技术。前者以16S rRNA基因克隆文库方法为代表，在油藏环境样品中已经受到广泛应用，通过设计特异性的引物可以扩增出样品中的相关基因序列，从而在基因的水平上阐述微生物的潜在代谢功能。而后者不需要PCR扩增，可以同时测定样品中所有基因的序列信息。因此，采用宏基因组测序分析油藏环境样品可以深入解析样品中潜在的代谢网络，进一步将宏基因组技术和宏转录组技术结合能够得到代谢途径上各个基因的转录水平，从而推断油藏环境下的各种微生物代谢过程。/>[0004]现有的宏基因组学分析手段(例如一种基于宏转录组学和宏基因组学的环境中抗生素抗性基因的活性定量及宿主鉴定方法，申请号202110740585.0)已经可以根据需求对一些常规环境样品的目标功能基因和重要微生物进行分析。但是地下油藏作为一个以厌氧条件为主的特殊环境，如果不对样品的采集和提取过程进行针对性的处理，样品中的微生物组成极易受到干扰而发生变化，RNA也会发生降解，从而导致后续的分析无法获得真正的油藏原位微生物数据。并且油藏中微生物的功能多种多样，其中值得关注研究的种类繁多，单一数据库无法对这些功能进行有效的分析，因此必须结合多个公开数据库以及本地自建数据库才能更全面地注释和分析样品中的这些关键功能。
[0005]可见，基于目前的技术空白，亟需开发一种特别针对油藏环境而开发的基于宏基因组学和宏转录组学的微生物识别、分析方法。

技术实现思路

[0006]本专利技术的目的就是为了解决对现有技术中油藏微生物检测手段可以获得的信息有限的问题，提供了一种联合应用宏基因组和宏转录组准确地识别油藏中微生物和代谢功能的方法。
[0007]本专利技术的目的通过以下技术方案实现：
[0008]本专利技术的目的是提供一种基于宏基因组和宏转录组识别油藏驱油功能微生物的
方法，包括以下步骤：
[0009]S1：自油藏产出水样提取总DNA和总RNA；
[0010]S2：对获得的总DNA和总RNA进行测序，获取油藏样品的宏基因组和宏转录组原始数据；
[0011]S3：通过对宏基因组和宏转录组结果进行分析，识别具有驱油功能的微生物。
[0012]进一步地，S1中，在提取总DNA和总RNA之前，在待提取RNA的样品中加入抑制剂以抑制厌氧微生物的RNA降解。
[0013]进一步地，S2中，还包括：对油藏样品的宏基因组和宏转录组原始数据进行预处理，得到去除接头和低质量片段的目标数据；
[0014]所述预处理的过程包括：
[0015]利用fastp软件分别对对油藏样品的宏基因组和宏转录组中各DNA或RNA链序列双端的原始数据进行滑窗质量剪裁，同时，根据序列首尾两端的引物信息，利用cutadapt软件去除引物，得到质控后的双端序列数据。
[0016]进一步地，滑窗质量剪裁的参数为
‑
W 4，
‑
M 20，即滑动窗大小为4，平均质量值为20。
[0017]进一步地，S3中，对宏基因组和宏转录组结果进行分析的过程包括：
[0018]对质控后的双端序列数据进行组装、分箱并评估质量，去除冗余后提取其中高质量的MAGs(宏基因组组装基因组)数据集；
[0019]根据构建的参考数据库对高质量的MAGs组装数据进行注释，识别出具有不同驱油功能的功能基因和MAGs，并计算对应的测序深度和相对丰度；
[0020]对高质量的MAGs数据集做进化关系分析，进而做出驱油微生物的群落结构分析；
[0021]将宏转录组测序得到的序列短片段质控过滤后与MAGs数据对比，计算出各个基因的转录水平。
[0022]进一步地，S3中，组装、分箱并评估质量的过程包括：
[0023]组装：使用拼接程序SPADes在Meta模式下，将质控后的双端序列数据样品短序列拼接成长度不一的contigs(交替片段产物)，然后根据双端测序的信息将不同contigs连接成有测序缺口的scaffolds(骨架序列)；
[0024]分箱：采用bowtie2软件将质控后的MAGs短序列数据信息比对到长序列信息上，获得不同长序列的测序覆盖度信息，进一步同时采用Maxbin2、Metabat2、CONCOCT三种Binning手段从MAGs中分离出优势菌的基因组，并进一步导入DAS_Tool程序中进行评估，最终整合并提高不同方法生成基因组的质量；
[0025]评估质量：利用dRep软件将质控后的MAGs中相似度较高的基因组去除冗余，通过CheckM工具根据基因组中单拷贝标记基因的有无和数量来估算基因组的完整度和污染度。
[0026]进一步地，S3中，对高质量的MAGs组装数据进行注释的过程包括：
[0027]使用Prodigal程序(预测开放阅读框)将拼接后的长序列翻译成编码蛋白序列(CDS)，并提交到KEGG数据库，采用GhostKOALA工具进行功能性注释并获得代表不同旁系同源亚基的KO号；
[0028]同时采用本地软件KofamKOALA根据各个KO旁系同源家族蛋白的隐马可夫模型(HMM)和推荐的置信标准给各个蛋白序列注释KO号；
[0029]最后采用EggNOG emapper 2工具给蛋白序列注释COG号，再转换成KO号，使得最终每个蛋白质的KO号注释采用以下顺序：1)GhostKOALA KO,2)KofamKOALA KO，3)EggNOG emapper KO。
[0030]进一步地，S3中，所述驱油功能包括烷烃降解、产气、产乳化剂、产表面活性剂、产多糖中的一种或多种。
[0031]进一步地，S3中，识别出具有不同驱油功能的功能基因和MAGs，并结合bowtie2软件对比得到的各序列的测序覆盖度信息计算对应的测序深度和相对丰度的过程包括：
[0032]针对氢气还原酶，首先通过本地的氢气还原酶亚组的HMM模型比对找出潜在的功能基因蛋白；
[0033]之本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法，其特征在于，包括以下步骤：S1：自油藏产出水样提取总DNA和总RNA；S2：对获得的总DNA和总RNA进行测序，获取油藏样品的宏基因组和宏转录组原始数据；S3：通过对宏基因组和宏转录组结果进行分析，识别具有驱油功能的微生物。2.根据权利要求1所述的一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法，其特征在于，S1中，在提取总DNA和总RNA之前，在待提取RNA的样品中加入抑制剂以抑制厌氧微生物的RNA降解。3.根据权利要求1所述的一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法，其特征在于，S2中，还包括：对油藏样品的宏基因组和宏转录组原始数据进行预处理，得到去除接头和低质量片段的目标数据；所述预处理的过程包括：利用fastp软件分别对对油藏样品的宏基因组和宏转录组中各DNA或RNA链序列双端的原始数据进行滑窗质量剪裁，同时，根据序列首尾两端的引物信息，利用cutadapt软件去除引物，得到质控后的双端序列数据。4.根据权利要求3所述的一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法，其特征在于，S3中，对宏基因组和宏转录组结果进行分析的过程包括：对质控后的双端序列数据进行组装、分箱并评估质量，去除冗余后提取其中高质量的MAGs数据集；根据构建的参考数据库对高质量的MAGs组装数据进行注释，识别出具有不同驱油功能的功能基因和MAGs，并计算对应的测序深度和相对丰度；对高质量的MAGs数据集做进化关系分析，进而做出驱油微生物的群落结构分析；将宏转录组测序得到的序列短片段质控过滤后与MAGs数据对比，计算出各个基因的转录水平。5.根据权利要求4所述的一种基于宏基因组和宏转录组识别油藏驱油功能微生物的方法，其特征在于，S3中，组装、分箱并评估质量的过程包括：组装：使用拼接程序SPADes在Meta模式下，将质控后的双端序列数据样品短序列拼接成长度不一的contigs，然后根据双端测序的信息将不同contigs连接成有测序缺口的scaffolds；分箱：采用bowtie2软件将质控后的MAGs短序列数据信息比对到长序列信息上，获得不同长序列的测序覆盖度信息，进一步同时采用Maxbin2、Metabat2、CONCOCT三种Binning手段从MAGs中分离出优势菌的基因组，并进一步导入DAS_Tool程序中进行评估，最终整合并提高不同方法生成基因组的质量；评估质量：利用dRep软件将质控后的MAGs中相似度较高的基因组去除冗余，通过CheckM工具根据基因组中单拷贝标记基因的有无和数量来估算基因组的完整度和污染度。6.根据权利要求4所述的一种基于宏基因组和宏转录组识...

【专利技术属性】
技术研发人员：牟伯中，刘一凡，寿利斌，
申请(专利权)人：华东理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人