【技术实现步骤摘要】
一种基于分治法的mRNA序列优化的方法与装置
本申请属于基因优化
,尤其是涉及一种基于分治法的mRNA序列优化的方法与装置。
技术介绍
遗传密码子有64种,但是大部分生物倾向于利用这些密码子中的一部分,被频繁用到的密码子称为最佳密码子,不被经常用到的被称为稀有密码子。密码子优化是一种基因工程方法,通常用于增强重组蛋白表达。当功能蛋白在外源宿主中表达,由于功能蛋白基因使用了低频密码子等因素,会使其在外源宿主中很难表达。由于密码子简并性,每个氨基酸平均有三个对应密码子,这使得不同的核苷酸序列可以编码出相同的氨基酸序列。可以通过同义密码子替换使基因与宿主的密码子使用频率相匹配来提高蛋白表达水平。近年来,具有合适密码子用法的合成基因序列已成为试图改善重组表达的重要工具之一。到目前为止,通常主要通过选择表达宿主中频繁出现的密码子来优化编码区,这主要是通过商业供应商的专有算法来进行的。必须注意的是,不同的优化算法采用不同的方法来确定表达宿主中的密码子频率,例如,基于所有蛋白质编码基因中或仅针对有限的一组高度表达基因中的密码子使用; ...
【技术保护点】
1.一种基于分治法的mRNA序列优化的方法,其特征在于,包括以下步骤:/nS1:获取一段待优化的mRNA序列,截取蛋白质编码区,并且获取mRNA序列来源物种的相同蛋白质对应的密码子的使用频率;/nS2:将mRNA序列连续均分若干次,最终均分得到仅含有1个密码子的序列片段;/nS3:将表达为相同蛋白质的密码子统一替换成S1步骤中使用频率最高的密码子;/nS4:逆向操作均分过程,从2个密码子开始进行合并直至合并形成与待优化的mRNA序列相同的长度,每次合并均检查是否有发夹结构生成以及是否具有影响蛋白表达的因素,若没有发夹结构和影响蛋白表达的因素则进入下一次合并,否则则将发夹结构 ...
【技术特征摘要】
1.一种基于分治法的mRNA序列优化的方法,其特征在于,包括以下步骤:
S1:获取一段待优化的mRNA序列,截取蛋白质编码区,并且获取mRNA序列来源物种的相同蛋白质对应的密码子的使用频率;
S2:将mRNA序列连续均分若干次,最终均分得到仅含有1个密码子的序列片段;
S3:将表达为相同蛋白质的密码子统一替换成S1步骤中使用频率最高的密码子;
S4:逆向操作均分过程,从2个密码子开始进行合并直至合并形成与待优化的mRNA序列相同的长度,每次合并均检查是否有发夹结构生成以及是否具有影响蛋白表达的因素,若没有发夹结构和影响蛋白表达的因素则进入下一次合并,否则则将发夹结构处或者影响蛋白表达的因素处的密码子替换成与替换前的密码子相比使用频率更小的密码子;
S5:以S4步骤确定的mRNA序列作为优化后的mRNA序列。
2.根据权利要求1所述的基于分治法的mRNA序列优化的方法,其特征在于,S4步骤中每次合并检查时还检查GC含量,若GC含量不处于百分之三十和七十之间时,则将其中的至少一个密码子替换成与替换前的密码子相比使用频率更小的密码子,直至GC含量处于百分之三十和七十之间。
3.根据权利要求1或2所述的基于分治法的mRNA序列优化的方法,其特征在于,所述影响蛋白表达的因素包括:特定限制酶识别位点、Chi-site延伸重组热点、SD核糖体结合位点序列、CpG含量、TATAbox、串联稀有密码子、起始密码子与终止密码子环境、核糖核酸酶E、真核表达中的PolyA结构和隐蔽剪切位点。
4.根据权利要求1-3任一项所述的基于分治法的mRNA序列优化的方法,其特征在于,还包括S6步骤,计算优化后的mRNA序列的密码子适应指数。
5.根据权利要求1-4任一项所述的基于分治法的mRNA序列优化的方法,其特征在于,S4步骤中当密码子合并达到设定的阈值长度才开始检查是否有发夹结构生成以及是否具有影响蛋白表达的因素。
6.一种基于分治法的mRNA序列优化的装置,其特征在于,包括:<...
【专利技术属性】
技术研发人员:孙振华,侯强波,左炽健,董世英,
申请(专利权)人:江苏普瑞康生物医药科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。