一种用于植物外源基因改造的CodonPlant系统及其改造方法技术方案

技术编号:18592599 阅读:46 留言:0更新日期:2018-08-04 20:05
本发明专利技术公开了一种用于植物外源基因改造的CodonPlant系统及其改造方法,该CodonPlant系统,包括输入模块、处理模块、输出模块;其中,输入模块用于用户输入基因序列、密码子使用频率排序表以及群体个数n;处理模块用于接收输入的密码子信息内容、密码子使用频率排序表信息内容,并依据用户输入的群体个数n,进行有效处理,并通过输出模块,输出对应的结果。本发明专利技术将剪切位点和mRNA等参数进行定点突变放入遗传算法中来保持进化过程中种群的多样性,并加入了基于罚函数的排挤机制,使算法具有良好的全局寻优能力,同时具有很高的全局搜索能力和收敛速度,增加了种群多样性,弥补了遗传算法的收敛性效率偏低的不足,可以使算法提高寻找最优解的能力,有很好的实用性。

CodonPlant system for transformation of plant exogenous gene and its modification method

The invention discloses a CodonPlant system for plant exogenous gene transformation and its transformation method. The CodonPlant system includes input module, processing module and output module, in which the input module is used for user input gene sequence, codon use frequency sorting table and population number n, and processing module is used for receiving. The input codons information content, codon use frequency to sort information content, and according to the number of users input group n, carry out effective processing, and output the corresponding results through the output module. This invention puts the fixed point mutation of the shear site and mRNA into the genetic algorithm to maintain the diversity of the population in the evolutionary process, and adds the extrusion mechanism based on the penalty function, which makes the algorithm have a good global optimization ability, and has a high global search ability and convergence speed, and increases the population diversity. It makes up for the shortage of low convergence efficiency of genetic algorithm and improves the ability of searching for the optimal solution.

【技术实现步骤摘要】
一种用于植物外源基因改造的CodonPlant系统及其改造方法
本专利技术属于基因工程
,具体涉及一种用于植物外源基因改造的CodonPlant系统及其改造方法。
技术介绍
目前,常用的密码子优化软件均对多目标进行优化,并采用了不同的优化方法。例如,CodonOptimizer(Fuglsang,2003),JCat,OPTIMIZEROPTIMIZER(Puigbòetal.,2007)和ATGme(Danieletal.,2015)等。最近发展根据多目标寻优算法发展了不同思路的软件。其中GeneDesigner,Upgene和GeMS都先随机生成一组候选序列,然后根据预定义的条件执行筛选器。SGD(Wuetal.,2006)沿着合成基因一步一步地扫描密码,选择基于概率模型的首选密码。DNAWorks(HooverandLubkowski,2002)和EuGene(Gaoetal.,2004)使用模拟退火算法来进行codon优化。GASCO(Sandhuetal.,2008)软件包分别采用遗传算法进行密码子优化,QPSOBT(Caietal.,2008)采用改进的粒子群优化算法进行密码子优化。COStar是一种基于d星的动态搜索算法,用于codon优化算法。而在实际进行植物密码子优化的实验过程中,如果仅仅使用软件是不能实现的。在真实的进行原核生物优化为植物基因,密码子优化,改变基因序列内的密码子以改进重组蛋白质表达的过程已经被广泛实践。当优化基因序列时,需要考虑影响蛋白质表达的多个相互联系的因素。通常在植物中表达的转基因来自其他植物物种或非植物。这些基因是进化适应于在宿主生物体中以所需表达水平表达的宿主生物体,但是可能不适合在转化的植物中表达。另外还有一些与植物相同植物的基因在相同的植物中可能不适合高水平的表达。不同的生物有所不同DNA碱基组成(AT%或GC%),如真核细胞内的不同基因组(核与线粒体(也有T到U)和植物细胞(质体))。DNA碱基对组成的这种差异影响了DNA的频率出现编码相同氨基酸的简并密码子(密码子使用频率)。同源的丰富带电荷的tRNA通常与基因组中目标密码子的频率成比例。因此例如基因由于缺乏某些带电荷的tRNA,富含GC%的富含AT%的生物体翻译不充分。它是本领域众所周知的是通过重新编码转基因可以克服这个问题,使得密码子的使用反映了这一点用于转基因生物中,如果需要高表达,则匹配密码子使用与高表达该生物体中的基因。除了密码子使用问题之外,真核细胞核基因还有转录剪接和聚腺苷酸化信号在真核生物之间可能不同(例如在动物和昆虫之间或在双子叶植物之间和单子叶植物),并且可能在其他生物如原核生物中不存在。由于植物中的多聚腺苷酸化信号富含AT,而原核生物缺乏这些信号,富含AT%的原核生物经常含有可被识别为聚腺苷酸化序列的序列。因此,在转基因的编码区域存在这种“隐蔽的”聚腺苷酸化基序已被归因于差在植物中表达,诸如苏云金芽孢杆菌(Bacillusthuringiensis)的基因。Fischhoff等人(US7741118B1)描述了这一点六聚体AATAAA样基序的去除将改善基因表达。他们提供了16个潜在的聚腺苷酸化的列表在转基因的编码区中频率应该降低的基序以改善植物中的表达。植物中非植物基因的高水平表达是关键的农艺问题。因此,需要开发新的方法来提高植物中的基因表达,特别是通过提供比本领域已知的一些其他基因修饰方法提出的修饰少的修饰方法。
技术实现思路
专利技术目的:针对现有技术中存在的不足,本专利技术的目的是提供一种用于植物外源基因改造的CodonPlant系统,满足植物外源基因改造的使用需求。本专利技术的另一目的是提供一种上述CodonPlant系统的植物外源基因改造方法。技术方案:为了实现上述专利技术目的,本专利技术采用的技术方案为:一种用于植物外源基因改造的CodonPlant系统,包括输入模块、处理模块、输出模块;其中,输入模块用于用户输入基因序列、密码子使用频率排序表以及群体个数n;处理模块用于接收输入的密码子信息内容、密码子使用频率排序表信息内容,并依据用户输入的群体个数n,进行有效处理,并通过输出模块,输出对应的结果;所述的输入模块包括序列模块、密码子使用频率排序表模块和群体个数模块,序列模块可输入的序列必须为三的倍数,输入的序列以三联体划分,传送到处理模块中;密码子使用频率排序表模块可输入的格式为同义密码子放在同一行,且按使用频率高低从左到右依次排列,中间以冒号隔开,非同义密码子在换行表示;群体个数模块用于输入群体个数n;所述的处理模块依据遗传算法进行处理最终获得一条最优序列,至少包括种群序列产生模块、期望值设置模块、种群序列处理模块以及增加序列模块;所述的输出模块,输出的序列保存在output.txt中。所述的种群序列产生模块用于依据用户输入的信息,产生n条随机序列构成一个种群;期望值设置模块用于用户输入多目标优化期望值;种群序列处理模块在收到用户输入的多目标优化期望值,根据轮盘赌原则选择2条基因,进行基因交叉处理,然后进行基因随机变异,针对剪切位点,进行定点随机变异,针对重复序列,进行定点随机变异,其中,随机变异均使用同义密码子替换,计算估值函数,并替换较差序列,放回原种群,进行循环操作,依据多目标参数计算估值函数得到打分,最终得到优化种群,从中选择出最优序列。所述的增加序列模块,用于增加亚细胞器定位序列、kozak序列、内含子片段序列等,获得最终用于输出的序列。所述的遗传算法,过程如下:1)依据输入的种群数量,随机产生20条序列,构成一个种群;2)轮盘赌法随机挑取2条序列;3)1条父本序列,一条母本序列,50%交叉率得到子代;4)5%随机同义突变;5)检查是否含有剪切位点,含有时进行定点同义突变:去除植物序列剪切信号、去除多聚腺苷酸化序列、去除酶切信号;6)检查是否有mRNA二级结构,含有时进行定点同义突变:正向重复、反向重复、镜像重复、倒转重复;7)统计剪切位点个数、重复序列个数和CAI指数,多目标参数计算估值函数,得到打分。所述的CodonPlant系统的植物外源基因的改造方法,包括以下步骤:第一步:序列以及密码子使用频率的输入,并输入群体个数n;第二步:遗传算法计算,依据用户输入的信息,产生n条随机序列构成一个种群,用户输入多目标优化期望值,根据轮盘赌原则选择2条基因,进行基因交叉处理,然后进行基因随机变异,针对剪切位点,进行定点随机变异,针对重复序列,进行定点随机变异,其中,随机变异均使用同义密码子替换,删除mRNA降解信号,去除植物序列剪切信号、去除多聚腺苷酸化序列、去除内含子切割序列CATTG、去除AT富集区;计算估值函数,并替换较差序列,放回原种群,进行循环操作,依据多目标参数计算估值函数得到打分,最终得到优化种群,从中选择出最优序列;第三步:增加亚细胞器定位序列、kozak序列、内含子片段序列;第四步:输出序列:输出结果保存在output.txt中,方法结束。第一步中,基因序列由ATG开始TAA终止,每条序列为三的整数倍,要求一个序列一行,序列结束有换行。第一步中,密码子使用频率表要求格式为同义密码子放在同一行,且按使用频率高低从左到右依次排列,中间以冒号隔开,非同义密本文档来自技高网
...

【技术保护点】
1.一种用于植物外源基因改造的CodonPlant系统,其特征在于,包括输入模块、处理模块、输出模块;其中,输入模块用于用户输入基因序列、密码子使用频率排序表以及群体个数n;处理模块用于接收输入的密码子信息内容、密码子使用频率排序表信息内容,并依据用户输入的群体个数n,进行有效处理,并通过输出模块,输出对应的结果;所述的输入模块包括序列模块、密码子使用频率排序表模块和群体个数模块,序列模块可输入的序列必须为三的倍数,输入的序列以三联体划分,传送到处理模块中;密码子使用频率排序表模块可输入的格式为同义密码子放在同一行,且按使用频率高低从左到右依次排列,中间以冒号隔开,非同义密码子在换行表示;群体个数模块用于输入群体个数n;所述的处理模块依据遗传算法进行处理最终获得一条最优序列,至少包括种群序列产生模块、期望值设置模块、种群序列处理模块以及增加序列模块;所述的输出模块,输出的序列保存在output.txt中。

【技术特征摘要】
1.一种用于植物外源基因改造的CodonPlant系统,其特征在于,包括输入模块、处理模块、输出模块;其中,输入模块用于用户输入基因序列、密码子使用频率排序表以及群体个数n;处理模块用于接收输入的密码子信息内容、密码子使用频率排序表信息内容,并依据用户输入的群体个数n,进行有效处理,并通过输出模块,输出对应的结果;所述的输入模块包括序列模块、密码子使用频率排序表模块和群体个数模块,序列模块可输入的序列必须为三的倍数,输入的序列以三联体划分,传送到处理模块中;密码子使用频率排序表模块可输入的格式为同义密码子放在同一行,且按使用频率高低从左到右依次排列,中间以冒号隔开,非同义密码子在换行表示;群体个数模块用于输入群体个数n;所述的处理模块依据遗传算法进行处理最终获得一条最优序列,至少包括种群序列产生模块、期望值设置模块、种群序列处理模块以及增加序列模块;所述的输出模块,输出的序列保存在output.txt中。2.根据权利要求1所述的用于植物外源基因改造的CodonPlant系统,其特征在于,所述的种群序列产生模块用于依据用户输入的信息,产生n条随机序列构成一个种群;期望值设置模块用于用户输入多目标优化期望值;种群序列处理模块在收到用户输入的多目标优化期望值,根据轮盘赌原则选择2条基因,进行基因交叉处理,然后进行基因随机变异,针对剪切位点,进行定点随机变异,针对重复序列,进行定点随机变异,其中,随机变异均使用同义密码子替换,计算估值函数,并替换较差序列,放回原种群,进行循环操作,依据多目标参数计算估值函数得到打分,最终得到优化种群,从中选择出最优序列。3.根据权利要求1所述的用于植物外源基因改造的CodonPlant系统,其特征在于,所述的增加序列模块,用于增加亚细胞器定位序列、kozak序列、内含子片段序列等,获得最终用于输出的序列。4.根据权利要求1所述的用于植物外源基因改造的CodonPlant系统,其特征在于,所述的遗传算法,过程如下:1)依据输入的种群数量,随机产生20条序列,构成一个种群;2)轮盘赌法随机挑取2条序列;3)1条父本序列,一条母本序列,50%交叉率得到子代;4)5%随机同义突变;5)检查是否含有剪切位点,含有时进行定点同义突变:去除植物序列剪切信号、去除多聚腺苷酸化序列、去除酶切信号;6)检查是否有mRNA二级结构,含有时进行定点同义突变:正向重复、反向重复、镜像重复、倒转重复;7)统计剪切位点个数、重复序列个数和CAI指数,多目标参数计算估值函数,得到打分。5.权利要求1所述的CodonPlant系统的植物外源基因的改造方法,其特征在于,包括以下步骤:第一步:序列以及密码子使用频率的输入,并输入群体个数n;第二步:遗传算法计算,依据用户输入的信息,产生n条随机序列构成一个种群,用户输入多目标优化期望值,根据轮盘赌原则选择2条基因,进行基因交叉处理,然后进行基因随机变异,针对剪切位点,进行定点随机变...

【专利技术属性】
技术研发人员:续晨贲爱玲蔡小宁周加宝王立科钱保俐华春
申请(专利权)人:南京晓庄学院
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1