一种用于异源基因体外表达的密码子优化方法及应用技术

技术编号:22645891 阅读:52 留言:0更新日期:2019-11-26 17:08
本发明专利技术公开了一种用于异源基因体外表达的密码子优化方法,该方法包括:获取宿主细胞全基因组的核苷酸序列和全蛋白组的氨基酸序列;以密码子对为统计对象,统计每个密码子对在宿主细胞全基因组中的权重;选定待优化蛋白,构建一个以密码子为节点、上下游密码子对间的权重值为线值的单向图模型;根据单向图模型,得到优化后基因的核苷酸序列。本发明专利技术利用宿主细胞的全基因组和全蛋白组作为序列库,以密码子对为统计对象,通过构建以密码子为节点、上下游密码子对间的权重值为线值的单向图模型,来获得最优的密码子组合顺序,得到具有最优化核苷酸序列的优化基因,该优化基因能够在体外高效表达,表达量显著提高。

A method of codon optimization for the expression of heterologous genes in vitro and its application

The invention discloses a codon optimization method for heterologous gene expression in vitro, the method includes: obtaining the nucleotide sequence and amino acid sequence of the whole proteome of the host cell; taking the codon pair as the statistical object, counting the weight of each codon pair in the whole genome of the host cell; selecting the protein to be optimized, constructing a codon as the node, up and down According to the one-way graph model, the optimized nucleotide sequence was obtained. The invention uses the whole genome and whole proteome of the host cell as the sequence library, takes the codon pair as the statistical object, constructs a one-way graph model with the codon as the node and the weight value between the upstream and downstream codon pairs as the line value to obtain the optimal codon combination order, and obtains the optimized gene with the optimized nucleotide sequence, which can be efficiently expressed in vitro , the expression was significantly increased.

【技术实现步骤摘要】
一种用于异源基因体外表达的密码子优化方法及应用
本专利技术涉及分子生物学基因工程
,尤其涉及一种用于异源基因体外表达的密码子优化方法以及通过该方法在烟草无细胞重组蛋白表达系统中获得优化的水母绿色荧光蛋白的应用。
技术介绍
密码子是指信使RNA链上决定一个氨基酸的相邻的三个碱基,也叫做三联体密码子。由于遗传密码子具有简并性,因此一个氨基酸通常由2~6个密码子编译,但是密码子的使用并不是均匀的,也不是随机的,在每一物种中,对于同义密码子的使用具有偏好性。密码子偏好性分析除了在物种选择进化上有着广泛的应用外,在转基因实验的应用中也很重要。外源基因要在宿主中高效表达,必须进行针对宿主物种密码子的优化。密码子的优化涉及的很多方面,可以从基因合成、载体构建、基因转录、mRNA翻译、翻译后修饰等角度出发,但是目的只有一个,就是使得外源基因高效表达。密码子优化分为两个步骤,第一步是对宿主物种进行密码子偏好性分析,获得宿主物种密码子偏好性信息。第二步是对外源基因进行密码子优化,根据获得的宿主密码子偏好信息,综合考虑GC含量、重复序列、mRNA二级结构、限制性酶切位点等因素,对目标基因进行优化。主流的一些密码子分析优化工具只能完成密码子偏好分析或者优化的部分工作,需要编写脚本或者手工操作才能完成优化过程,部分密码子数据库更新缓慢,优化程序没有考虑一些新的因素。密码子的上下文关系即密码子对的偏好性也会影响外源基因的高效表达,而目前大多数的密码子优化软件没有考虑密码子对的偏好性。目前,有一种无细胞重组蛋白表达系统,该系统可以将DNA的转录和翻译在细胞外的环境中进行。相比较传统的细胞内蛋白表达系统,具有操作方便,可控性高的优点。该系统利用表达宿主细胞提取物,包括蛋白翻译因子、核糖体、酰胺tRNA合成酶、总tRNA等表达所需元件在体外的试管中表达异源基因。然而,外源基因在异源宿主细胞中的表达还存在很多问题,由于异源宿主的常用密码子与外源基因相差甚远,导致外源基因的表达量比较低。因此,提出一种针对异源基因的体外表达的密码子优化方法十分重要,将对构建高效的蛋白体外表达系统做出贡献。
技术实现思路
本专利技术提供了一种用于异源基因体外表达的密码子优化方法以及通过该方法在烟草无细胞重组蛋白表达系统中获得优化的水母绿色荧光蛋白的应用,该密码子优化方法获得的优化基因能够在体外高效表达,表达量显著提高。具体技术方案如下:一种用于异源基因体外表达的密码子优化方法,包括:(1)获取宿主细胞全基因组的核苷酸序列,检测核苷酸序列的正确性,去除不正确的核苷酸序列,得到用于步骤(2)统计的核苷酸序列库;(2)以密码子对为统计对象,统计每个密码子对在宿主细胞全基因组中的权重,统计公式如下:式(1)中,Q表示权重值,F(AB)表示每个密码子对在宿主细胞全基因组中出现的次数,F(XY)表示每个密码子对编码的氨基酸对所对应的所有密码子对在宿主细胞全基因组中出现的次数;(3)选定待优化蛋白,获取所述蛋白所对应的氨基酸序列,罗列氨基酸序列中每个氨基酸所对应的多个密码子,根据氨基酸序列中上、下游氨基酸的排序,依次将上游氨基酸所对应的上游密码子与下游氨基酸所对应的下游密码子进行连线,并在连线上标注步骤(2)获取的相应密码子对的权重值,构建一个以密码子为节点、上下游密码子对间的权重值为线值的单向图模型;(4)根据步骤(3)中所述的单向图模型,依次取两两上下游密码子之间权重值最大的连线,组合成一条以起始密码子为起点,终止密码子为终点的权重值总和最大的路线,将所述路线所经过的每个密码子按顺序组合成优化后基因的核苷酸序列。本专利技术的创新之处在于:利用宿主细胞的全基因组作为序列库,以密码子对为统计对象,通过构建以密码子为节点、上下游密码子对间的权重值为线值的单向图模型,来获得最优的密码子组合顺序,得到的最优化核苷酸序列能够在体外高效表达,表达量显著提高。进一步地,步骤(1)中,检测所述核苷酸序列正确性的方法,包括:(a)比对各基因的核苷酸序列的长度是否符合3的倍数;(b)比对各蛋白的氨基酸序列所对应的基因编码序列中的每个密码子是否都符合标准密码子表;若(a)和(b)均为符合,则判定核苷酸序列和氨基酸序列正确;其他情况,则判定核苷酸序列和氨基酸序列不正确。进一步地,步骤(1)中,所述宿主细胞为烟草(NicotianatabacumL.)细胞。本专利技术还以烟草无细胞重组蛋白表达系统作为宿主环境,对水母绿色荧光蛋白(简称GFP蛋白)的编码基因进行优化,得到了核苷酸序列如SEQIDNo.1所示的水母绿色荧光蛋白的优化基因。所述的无细胞重组蛋白表达系统是指将细胞中的相关细胞器提取出来,在体外构建一个细胞环境;此类无细胞重组蛋白表达系统均可市售购买。进一步地,本专利技术还提供了一种利用所述密码子优化方法优化得到的水母绿色荧光蛋白的优化基因,所述优化基因的核苷酸序列如SEQIDNo.1所示。在步骤(3)中,选定待优化蛋白后,也可以先获得蛋白的编码基因,再翻译成对应的蛋白氨基酸序列,并核对氨基酸序列的正确性。与现有技术相比,本专利技术具有以下有益效果:(1)本专利技术利用宿主细胞的全基因组作为序列库,以密码子对为统计对象,通过构建以密码子为节点、上下游密码子对间的权重值为线值的单向图模型,来获得最优的密码子组合顺序,得到具有最优化核苷酸序列的优化基因,该优化基因能够在体外高效表达,表达量显著提高。(2)本专利技术以烟草无细胞重组蛋白表达系统作为宿主环境,对水母绿色荧光蛋白的编码基因进行优化,得到了核苷酸序列如SEQIDNo.1所示的GFP优化基因,该优化基因在不同曝光时间的UV下荧光强度显著高于原始GFP基因。附图说明图1为应用例1的步骤(2)中获取的每个密码子对在宿主细胞全基因组中的权重表。图2为实施例1密码子优化方法第(3)步中获得的单向图模型示意图。图3为实施例1中采用密码子优化方法获得的优化基因与原始基因的琼脂糖凝胶电泳图;其中,泳道1为原始GFP基因的PCR扩增产物;泳道2为GFP优化基因的PCR扩增产物。图4为实施例1中TOB无细胞蛋白表达反应在凝胶成像仪中不同曝光时间下UV照射的结果;其中,A为在80ms紫外曝光结果;B为在120ms紫外曝光结果。具体实施方式下面结合具体实施例对本专利技术作进一步描述,以下列举的仅是本专利技术的具体实施例,但本专利技术的保护范围不仅限于此。实施例1一种用于异源基因体外表达的密码子优化方法,具体步骤如下:(1)获取宿主细胞全基因组的核苷酸序列,检测核苷酸序列的正确性,去除不正确的核苷酸序列,得到用于步骤(2)统计的核苷酸序列库;检测所述核苷酸序列正确性的方法为:(a)比对各基因的核苷酸序列的长度是否符合3的倍数;(b)比对各蛋白的氨基酸序列所对应的基因编码序列中的每本文档来自技高网
...

【技术保护点】
1.一种用于异源基因体外表达的密码子优化方法,其特征在于,包括:/n(1)获取宿主细胞全基因组的核苷酸序列,检测核苷酸序列的正确性,去除不正确的核苷酸序列,得到用于步骤(2)统计的核苷酸序列库;/n(2)以密码子对为统计对象,统计每个密码子对在宿主细胞全基因组中的权重,统计公式如下:/n

【技术特征摘要】
1.一种用于异源基因体外表达的密码子优化方法,其特征在于,包括:
(1)获取宿主细胞全基因组的核苷酸序列,检测核苷酸序列的正确性,去除不正确的核苷酸序列,得到用于步骤(2)统计的核苷酸序列库;
(2)以密码子对为统计对象,统计每个密码子对在宿主细胞全基因组中的权重,统计公式如下:



式(1)中,Q表示权重值,F(AB)表示每个密码子对在宿主细胞全基因组中出现的次数,F(XY)表示每个密码子对编码的氨基酸对所对应的所有密码子对在宿主细胞全基因组中出现的次数;
(3)选定待优化蛋白,获取所述蛋白所对应的氨基酸序列,罗列氨基酸序列中每个氨基酸所对应的多个密码子,根据氨基酸序列中上、下游氨基酸的排序,依次将上游氨基酸所对应的上游密码子与下游氨基酸所对应的下游密码子进行连线,并在连线上标注步骤(2)获取的相应密码子对的权重值,构建一个以密码子为节点、上下游密码子对间的权重值为线值的单向图模型;
(4)根据步骤(3)中所述的单向图模型,依...

【专利技术属性】
技术研发人员:徐盛春郑元庭徐飞李素娟邵健丰王钢军李琪恺
申请(专利权)人:浙江省农业科学院
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利