信使核糖核酸密码子序列的处理方法、装置及电子设备制造方法及图纸

技术编号:37853340 阅读:11 留言:0更新日期:2023-06-14 22:45
本发明专利技术公开了一种信使核糖核酸密码子序列的处理方法、装置及电子设备。其中,该方法包括:对多个初始密码子序列进行分类处理,得到第一序列集和第二序列集,其中,多个初始密码子序列对应于不同的信使核糖核酸;采用第一序列集,第二序列集,多个初始密码子序列对应的氨基酸序列,对预先构建的循环生成对抗网络模型进行训练,基于训练后的循环生成对抗网络模型,将第二序列集中的初始密码子序列转换为具备第一序列特征的目标密码子序列。本发明专利技术解决了相关技术中主要采用人工收集序列特征,并采用回归预测模型进行信使核糖核酸密码子序列优化的方法,存在的特征收集不全面,回归模型拟合能力有限,序列优化效果差的技术问题。序列优化效果差的技术问题。序列优化效果差的技术问题。

【技术实现步骤摘要】
信使核糖核酸密码子序列的处理方法、装置及电子设备


[0001]本专利技术涉及密码子序列生成与优化领域,具体而言,涉及一种信使核糖核酸密码子序列的处理方法、装置及电子设备。

技术介绍

[0002]信使核糖核酸mRNA(即信使RNA,信使核糖核酸)分子的翻译区,即密码子序列对于mRNA的各项性质包括稳定性、翻译效率等至关重要。由于密码子的简并性,对于相同的蛋白质氨基酸序列,其密码子序列可能不同,而不同的密码子组成序列在细胞体内翻译产生蛋白的水平不同,因此,通过优化mRNA分子的密码子序列可以改善mRNA分子的各项性质。
[0003]目前已有的序列优化技术主要是通过人工收集的序列特征(包括GC含量、二级结构、酶切位点等等),基于实验测出的稳定性、翻译效率等数据构建线性回归预测模型,然后根据回归模型训练得到的特征权重分布来优化给定的序列,从而达到提升序列性质的目的。但上述方法中人工收集特征的工作量较大,特征收集不全面。并且回归预测通常拟合能力有限,序列优化效果较差。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种信使核糖核酸密码子序列的处理方法、装置及电子设备,以至少解决相关技术中主要采用人工收集序列特征,并采用回归预测模型进行信使核糖核酸密码子序列优化的方法,存在的特征收集不全面,回归模型拟合能力有限,序列优化效果差的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种信使核糖核酸密码子序列的处理方法,包括:对多个初始密码子序列进行分类处理,得到第一序列集和第二序列集,其中,上述第一序列集和上述第二序列集是基于上述多个初始密码子序列分别对应的蛋白表达水平和上述多个初始密码子序列分别对应述半衰期确定的,上述多个初始密码子序列对应于不同的信使核糖核酸;采用上述第一序列集,上述第二序列集,以及上述多个初始密码子序列对应的氨基酸序列,对预先构建的循环生成对抗网络模型进行训练,得到训练后的循环生成对抗网络模型;基于上述训练后的循环生成对抗网络模型,将上述第二序列集中的初始密码子序列转换为具备第一序列特征的目标密码子序列,其中,上述第一序列特征为与上述第一序列集对应的序列特征。
[0007]根据本专利技术实施例的另一方面,还提供了一种信使核糖核酸密码子序列的处理装置,包括:分类模块,用于对多个初始密码子序列进行分类处理,得到第一序列集和第二序列集,其中,上述第一序列集和上述第二序列集是基于上述多个初始密码子序列分别对应的蛋白表达水平和上述多个初始密码子序列分别对应述半衰期确定的,上述多个初始密码子序列对应于不同的信使核糖核酸;训练模块,用于采用上述第一序列集,上述第二序列集,以及上述多个初始密码子序列对应的氨基酸序列,对预先构建的循环生成对抗网络模
型进行训练,得到训练后的循环生成对抗网络模型;转换模块,用于基于上述训练后的循环生成对抗网络模型,将上述第二序列集中的初始密码子序列转换为具备第一序列特征的目标密码子序列,其中,上述第一序列特征为与上述第一序列集对应的序列特征。
[0008]根据本专利技术实施例的另一方面,还提供了一种非易失性存储介质,上述非易失性存储介质存储有多条指令,上述指令适于由处理器加载并执行任意一项上述的信使核糖核酸密码子序列的处理方法。
[0009]根据本专利技术实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,上述存储器用于存储一个或多个程序,其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现任意一项上述的信使核糖核酸密码子序列的处理方法。
[0010]在本专利技术实施例中,通过对多个初始密码子序列进行分类处理,得到第一序列集和第二序列集,其中,上述第一序列集和上述第二序列集是基于上述多个初始密码子序列分别对应的蛋白表达水平和上述多个初始密码子序列分别对应述半衰期确定的,上述多个初始密码子序列对应于不同的信使核糖核酸;采用上述第一序列集,上述第二序列集,以及上述多个初始密码子序列对应的氨基酸序列,对预先构建的循环生成对抗网络模型进行训练,得到训练后的循环生成对抗网络模型;基于上述训练后的循环生成对抗网络模型,将上述第二序列集中的初始密码子序列转换为具备第一序列特征的目标密码子序列,其中,上述第一序列特征为与上述第一序列集对应的序列特征,达到了基于循环生成对抗网络模型,将劣质密码子序列重组优化为优质的密码子序列的目的,从而实现了提升密码子序列的优化效率和优化质量的技术效果,进而解决了相关技术中主要采用人工收集序列特征,并采用回归预测模型进行信使核糖核酸密码子序列优化的方法,存在的特征收集不全面,回归模型拟合能力有限,序列优化效果差的技术问题。
附图说明
[0011]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0012]图1是根据本专利技术实施例的信使核糖核酸密码子序列的处理方法的流程图
[0013]图2是根据本专利技术实施例的一种可选的循环生成对抗网络模型训练的流程图;
[0014]图3是根据本专利技术实施例的一种可选的优化过程翻译效率提升效果图;
[0015]图4是根据本专利技术实施例的另一种可选的优化后的密码子序列与对应氨基酸序列对比示意图;
[0016]图5是根据本专利技术实施例的一种信使核糖核酸密码子序列的处理装置的结构示意图。
具体实施方式
[0017]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范
围。
[0018]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0019]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信使核糖核酸密码子序列的处理方法,其特征在于,包括:对多个初始密码子序列进行分类处理,得到第一序列集和第二序列集,其中,所述第一序列集和所述第二序列集是基于所述多个初始密码子序列分别对应的蛋白表达水平和所述多个初始密码子序列分别对应的半衰期确定的,所述多个初始密码子序列对应于不同的信使核糖核酸;采用所述第一序列集,所述第二序列集,以及所述多个初始密码子序列对应的氨基酸序列,对预先构建的循环生成对抗网络模型进行训练,得到训练后的循环生成对抗网络模型;基于所述训练后的循环生成对抗网络模型,将所述第二序列集中的初始密码子序列转换为具备第一序列特征的目标密码子序列,其中,所述第一序列特征为与所述第一序列集对应的序列特征。2.根据权利要求1所述的方法,其特征在于,所述对多个初始密码子序列进行分类处理,得到第一序列集和第二序列集,包括:获取所述多个初始密码子序列对应的所述蛋白表达水平,以及所述多个初始密码子序列对应的所述半衰期;基于所述多个初始密码子序列中所述蛋白表达水平大于第一预设数量,并且所述半衰期大于第二预设数量的密码子序列,得到所述第一序列集;基于所述多个初始密码子序列中所述蛋白表达水平小于第三预设数量,或者所述半衰期小于第四预设数量的密码子序列,得到所述第二序列集,其中,所述第一预设数量大于所述第三预设数量,所述第二预设数量大于所述第四预设数量,所述第一预设数量与所述第三预设数量之间的差值大于预设第一差值,第二预设数量与所述第四预设数量之间的差值大于预设第二差值。3.根据权利要求1所述的方法,其特征在于,在所述采用所述第一序列集,所述第二序列集,以及所述多个初始密码子序列对应的氨基酸序列,对预先构建的循环生成对抗网络模型进行训练,得到训练后的循环生成对抗网络模型之后,所述方法还包括:获取第一密码子序列;基于所述训练后的循环生成对抗网络模型,将所述第一密码子序列转换为具备所述第一序列特征的所述目标密码子序列。4.根据权利要求1至3中任意一项所述的方法,其特征在于,在所述循环生成对抗网络模型包括第一生成器,与所述第一生成器对应的第一判别器,第二生成器,与所述第二生成器对应的第二判别器,以及翻译器的情况下,所述采用所述第一序列集,所述第二序列集,以及所述多个初始密码子序列对应的氨基酸序列,对预先构建的循环生成对抗网络模型进行训练,得到训练后的循环生成对抗网络模型,包括:基于所述第一序列集,对所述第一生成器进行训练,得到第三生成器,以及具有第二序列特征的第一生成序列集,其中,所述第二序列特征为与所述第二序列集对应的序列特征;基于所述第一生成序列集和所述第二序列集,采用所述第一判别器,得到第一判别结果,其中,所述第一判别结果用于指示所述第一生成序列集与所述第二序列集之间的第一区分度;基于所述第二序列集,对所述第二生成器进行训练,得到第四生成器,以及具有所述第
一序列特征的第二生成序列集;基于所述第二生成序列集和所述第一序列集,采用所述第二判别器,得到第二判别结果,其中,所述第二判别结果用于指示所述第二生成序列集与所述第一序列集之间的第二区分度;基于所述第一生成序列集和所述第二生成序列集,对所述翻译器进行训练,得到训练后的翻译器,所述第...

【专利技术属性】
技术研发人员:贺选王德品
申请(专利权)人:南京燧坤智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1