基于全基因组序列的巴西橡胶树萜类合成酶基因家族的挖掘与分析方法技术

技术编号:35688033 阅读:17 留言:0更新日期:2022-11-23 14:34
本发明专利技术涉及生物信息技术领域,更具体地,涉及一种基于全基因组序列的巴西橡胶树萜类合成酶基因家族的挖掘与分析方法。其包括HbTPS的挖掘和鉴定、HbTPS基因序列分析、HbTPS的顺式作用元件分析、HbTPS系统发育树分析、HbTPS功能注释与次级代谢通路预测、HbTPS的差异表达分析、HbTPS的三维结构预测与分子对接分析等。本发明专利技术通过巴西橡胶树的基因组挖掘出所有的TPS,对HbTPS进行基因序列分析、顺式作用元件分析、系统发育树分析、功能注释、差异表达分析、蛋白质三维结构预测及其与相应底物的对接分析等。对接分析等。对接分析等。

【技术实现步骤摘要】
基于全基因组序列的巴西橡胶树萜类合成酶基因家族的挖掘与分析方法


[0001]本专利技术涉及生物信息
,更具体地,涉及一种基于全基因组序列的巴西橡胶树萜类合成酶基因家族的挖掘与分析方法。

技术介绍

[0002]巴西橡胶树作为一种重要的经济植物,其体内的主要次生代谢产物是萜类化合物,其中占萜类化合物比重较大的是多萜化合物——天然橡胶。天然橡胶因其具有优良的弹性、良好的绝缘性、可塑性、以及耐磨、耐拉、隔水隔气等特性,被广泛应用于工业、农业、国防、交通运输、医疗卫生和日常生活等方面,是不可或缺的战略物资和工业原料。全球天然橡胶所需量的90%来源于巴西橡胶树。根据国际橡胶专利技术组织(IRSG)报道,预计2022年全球天然橡胶需求量将达到1437万吨。因此,人们致力于专利技术如何提高天然橡胶产量。
[0003]巴西橡胶树中除了天然橡胶这种多萜化合物以外,还存在其他萜类化合物。萜类合成酶(TPS:terpene synthase)是单萜、倍半萜、二萜等萜类化合物合成过程中一类非常关键的酶,它们与相应底物法呢基二磷酸(FPP:farnesyl diphosphate)、对映

柯巴基二磷酸(ECP:ent

copalyl diphosphate)、双牻牛儿基二磷酸(GGPP:geranylgeranyl diphosphate)、二甲烯丙基焦磷酸(DMAPP:dimethylallyl pyrophosphate)等结合并发生催化反应。TPS控制着这些萜类化合物的产生、产量、种类等,会影响萜骨架单体IPP和DMAPP的浓度和流向,这些单体也是天然橡胶生物合成时所需要的单体,因此TPS会影响天然橡胶的生物合成。虽然巴西橡胶树的基因组已经被测序,但目前为止还没有基于巴西橡胶树全基因组TPS基因的挖掘与分析,巴西橡胶树中萜类化合物的合成途径也尚未清楚。

技术实现思路

[0004]为解决
技术介绍
提出的问题,本专利技术提出了一种基于全基因组序列的巴西橡胶树萜类合成酶基因家族的挖掘与分析方法。
[0005]本专利技术通过巴西橡胶树的基因组挖掘出所有的TPS,对巴西橡胶树的萜类合成酶(HbTPS:hevea brasiliensis terpene synthase)进行基因序列分析、顺式作用元件分析、系统发育树分析、功能注释、差异表达分析、蛋白质三维结构预测及其与相应底物的对接分析等。这些分析将有助于揭示HbTPS的作用及其分子机理,为巴西橡胶树体内天然橡胶生物合成的有效调控提供新的见解。
[0006]为实现上述目的,本专利技术的技术方案如下;
[0007]本专利技术基于全基因组序列的巴西橡胶树萜类合成酶基因家族的挖掘与分析方法。其包括如下步骤:
[0008]S1、HbTPS的挖掘和鉴定;
[0009]S2、HbTPS基因序列分析;
[0010]S3、HbTPS的顺式作用元件分析;
[0011]S4、HbTPS系统发育树分析;
[0012]S5、HbTPS功能注释与次级代谢通路预测;
[0013]S6、HbTPS的差异表达分析;
[0014]S7、HbTPS的三维结构预测与分子对接分析。
[0015]上述挖掘与分析方法,其中步骤S1具体包括以下步骤:
[0016]S11.从NCBI数据库的子数据库Genome中下载巴西橡胶树及其他物种的基因组序列;
[0017]S12.从Pfam数据库下载TPS的两个保守结构域模型,分别为N末端结构域模型,其id号为PF01397;C末端结构域模型,其id号为PF03936;
[0018]S13.使用HMMER软件分别搜索它们的蛋白质序列数据;以氨基酸残基数大于200和E

value小于10

5为条件进行筛选,搜索包含一个或两个保守结构域的序列,由同一个基因编码的蛋白质序列取最长那条HbTPS基因序列。
[0019]上述挖掘与分析方法,其中步骤S2具体包括以下步骤:
[0020]S21.使用GSDS工具对HbTPS基因的内含子外显子结构进行可视化;
[0021]S22.使用MEME(https://meme

suite.org/meme/tools/meme)预测保守结构域;
[0022]S23.通过MUSCLE软件对HbTPS进行多序列比对以分析保守基序。
[0023]上述挖掘与分析方法,其中步骤S3具体为:
[0024]根据HbTPS的注释信息,使用TBtools提取每个HbTPS基因编码区前面的2000bp序列,使用PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)预测HbTPS的顺式作用元件。
[0025]上述挖掘与分析方法,其中步骤S4具体为:
[0026]TPS使用MUSCLE进行序列比对,比对后的结果使用MEGA X构建系统发育树,系统发育树的结果使用iTOL(https://itol.embl.de/)工具进行美化。
[0027]进一步的,所述系统发育树的参数设置为邻接法和JTT模型,boostrap值设置为1000。
[0028]上述挖掘与分析方法,其中步骤S5具体为:使用BLAST和软件对UniProt数据库进行blastp搜索,使用InterProScan进行InterPro数据库和GO数据库注释,从而得到其他物种中相似的TPS序列,据此推测这些序列在细胞组成、分子功能、代谢过程等方面的功能信息,GO数据库的注释结果使用WEGO(https://wego.genomics.cn/)进行可视化;使用KEGG数据库的工具BlastKOALA(http://www.kegg.jp/blastkoala/)对HbTPS进行次级代谢通路预测,以对HbTPS进行功能分类和代谢通路分析,使用KOBAS(http://kobas.cbi.pku.edu.cn/annotate/)对HbTPS的功能分类进行补充。
[0029]上述挖掘与分析方法,其中步骤S6中具体包括以下步骤:
[0030]S61.从SRA数据库下载巴西橡胶树叶子和乳胶中的RNA

seq数据,id号为PRJNA742874;
[0031]S62.使用sra

tools将RNA

seq数据转换为fastq格式;
[0032]S63.使用fastqc进行测序数据质量的评估;
[0033]S64.使用trimmomatic进行去接头和低质量数据剔除;
[0034]S65.使用Hisat2将巴西橡胶树的RNA

seq比对到基因组序列;
[0035]S66.使用samtools进行相关数据的排序和格式转换;
[0036]S67.使用Subread的featurec本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于全基因组序列的巴西橡胶树萜类合成酶基因家族的挖掘与分析方法,其特征在于:包括S1、HbTPS的挖掘和鉴定;S2、HbTPS基因序列分析;S3、HbTPS的顺式作用元件分析;S4、HbTPS系统发育树分析;S5、HbTPS功能注释与次级代谢通路预测;S6、HbTPS的差异表达分析;S7、HbTPS的三维结构预测与分子对接分析。2.根据权利要求1所述的方法,其特征在于:步骤S1具体包括以下步骤:S11.从NCBI数据库的子数据库Genome中下载巴西橡胶树及其他物种的基因组序列;S12.从Pfam数据库下载TPS的两个保守结构域模型,分别为N末端结构域模型,其id号为PF01397;C末端结构域模型,其id号为PF03936;S13.使用HMMER软件分别搜索它们的蛋白质序列数据;以氨基酸残基数大于200和E

value小于10

5为条件进行筛选,搜索包含一个或两个保守结构域的序列,由同一个基因编码的蛋白质序列取最长那条HbTPS基因序列。3.根据权利要求1所述的方法,其特征在于:步骤S2具体包括以下步骤:S21.使用GSDS工具对HbTPS基因的内含子外显子结构进行可视化;S22.使用MEME预测保守结构域;S23.通过MUSCLE软件对HbTPS进行多序列比对以分析保守基序。4.根据权利要求1所述的方法,其特征在于:步骤S3具体为:根据HbTPS的注释信息,使用TBtools提取每个HbTPS基因编码区前面的2000bp序列,使用PlantCARE预测HbTPS的顺式作用元件。5.根据权利要求1所述的方法,其特征在于:步骤S4具体为:TPS使用MUSCLE进行序列比对,比对后的结果使用MEGA X构建系统发育树。6.据权利要求5所述的方法,其特征在于:所述系统发育树的参数设置为邻接法和JTT模型。...

【专利技术属性】
技术研发人员:梁家豪傅明辉王德黄伟文谢淳
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1