信使核糖核酸密码子序列的处理方法、装置及电子设备制造方法及图纸

技术编号：37853340 阅读：19 留言：0更新日期：2023-06-14 22:45

本发明专利技术公开了一种信使核糖核酸密码子序列的处理方法、装置及电子设备。其中，该方法包括：对多个初始密码子序列进行分类处理，得到第一序列集和第二序列集，其中，多个初始密码子序列对应于不同的信使核糖核酸；采用第一序列集，第二序列集，多个初始密码子序列对应的氨基酸序列，对预先构建的循环生成对抗网络模型进行训练，基于训练后的循环生成对抗网络模型，将第二序列集中的初始密码子序列转换为具备第一序列特征的目标密码子序列。本发明专利技术解决了相关技术中主要采用人工收集序列特征，并采用回归预测模型进行信使核糖核酸密码子序列优化的方法，存在的特征收集不全面，回归模型拟合能力有限，序列优化效果差的技术问题。序列优化效果差的技术问题。序列优化效果差的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
信使核糖核酸密码子序列的处理方法、装置及电子设备

[0001]本专利技术涉及密码子序列生成与优化领域，具体而言，涉及一种信使核糖核酸密码子序列的处理方法、装置及电子设备。

技术介绍

[0002]信使核糖核酸mRNA(即信使RNA，信使核糖核酸)分子的翻译区，即密码子序列对于mRNA的各项性质包括稳定性、翻译效率等至关重要。由于密码子的简并性，对于相同的蛋白质氨基酸序列，其密码子序列可能不同，而不同的密码子组成序列在细胞体内翻译产生蛋白的水平不同，因此，通过优化mRNA分子的密码子序列可以改善mRNA分子的各项性质。
[0003]目前已有的序列优化技术主要是通过人工收集的序列特征(包括GC含量、二级结构、酶切位点等等)，基于实验测出的稳定性、翻译效率等数据构建线性回归预测模型，然后根据回归模型训练得到的特征权重分布来优化给定的序列，从而达到提升序列性质的目的。但上述方法中人工收集特征的工作量较大，特征收集不全面。并且回归预测通常拟合能力有限，序列优化效果较差。
[0004]针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种信使核糖核酸密码子序列的处理方法、装置及电子设备，以至少解决相关技术中主要采用人工收集序列特征，并采用回归预测模型进行信使核糖核酸密码子序列优化的方法，存在的特征收集不全面，回归模型拟合能力有限，序列优化效果差的技术问题。
[0006]根据本专利技术实施例的一个方面，提供了一种信使核糖核酸密码子序列的处理方法，包括...

【技术保护点】

【技术特征摘要】
1.一种信使核糖核酸密码子序列的处理方法，其特征在于，包括：对多个初始密码子序列进行分类处理，得到第一序列集和第二序列集，其中，所述第一序列集和所述第二序列集是基于所述多个初始密码子序列分别对应的蛋白表达水平和所述多个初始密码子序列分别对应的半衰期确定的，所述多个初始密码子序列对应于不同的信使核糖核酸；采用所述第一序列集，所述第二序列集，以及所述多个初始密码子序列对应的氨基酸序列，对预先构建的循环生成对抗网络模型进行训练，得到训练后的循环生成对抗网络模型；基于所述训练后的循环生成对抗网络模型，将所述第二序列集中的初始密码子序列转换为具备第一序列特征的目标密码子序列，其中，所述第一序列特征为与所述第一序列集对应的序列特征。2.根据权利要求1所述的方法，其特征在于，所述对多个初始密码子序列进行分类处理，得到第一序列集和第二序列集，包括：获取所述多个初始密码子序列对应的所述蛋白表达水平，以及所述多个初始密码子序列对应的所述半衰期；基于所述多个初始密码子序列中所述蛋白表达水平大于第一预设数量，并且所述半衰期大于第二预设数量的密码子序列，得到所述第一序列集；基于所述多个初始密码子序列中所述蛋白表达水平小于第三预设数量，或者所述半衰期小于第四预设数量的密码子序列，得到所述第二序列集，其中，所述第一预设数量大于所述第三预设数量，所述第二预设数量大于所述第四预设数量，所述第一预设数量与所述第三预设数量之间的差值大于预设第一差值，第二预设数量与所述第四预设数量之间的差值大于预设第二差值。3.根据权利要求1所述的方法，其特征在于，在所述采用所述第一序列集，所述第二序列集，以及所述多个初始密码子序列对应的氨基酸序列，对预先构建的循环生成对抗网络模型进行训练，得到训练后的循环生成对抗网络模型之后，所述方法还包括：获取第一密码子序列；基于所述训练后的循环生成对抗网络模型，将所述第一密码子序列转换为具备所述第一序列特征的所述目标密码子序列。4.根据权利要求1至3中任意一项所述的方法，其特征在于，在所述循环生成对抗网络模型包括第一生成器，与所述第一生成器对应的第一判别器，第二生成器，与所述第二生成器对应的第二判别器，以及翻译器的情况下，所述采用所述第一序列集，所述第二序列集，以及所述多个初始密码子序列对应的氨基酸序列，对预先构建的循环生成对抗网络模型进行训练，得到训练后的循环生成对抗网络模型，包括：基于所述第一序列集，对所述第一生成器进行训练，得到第三生成器，以及具有第二序列特征的第一生成序列集，其中，所述第二序列特征为与所述第二序列集对应的序列特征；基于所述第一生成序列集和所述第二序列集，采用所述第一判别器，得到第一判别结果，其中，所述第一判别结果用于指示所述第一生成序列集与所述第二序列集之间的第一区分度；基于所述第二序列集，对所述第二生成器进行训练，得到第四生成器，以及具有所述第
一序列特征的第二生成序列集；基于所述第二生成序列集和所述第一序列集，采用所述第二判别器，得到第二判别结果，其中，所述第二判别结果用于指示所述第二生成序列集与所述第一序列集之间的第二区分度；基于所述第一生成序列集和所述第二生成序列集，对所述翻译器进行训练，得到训练后的翻译器，所述第...

【专利技术属性】
技术研发人员：贺选，王德品，
申请(专利权)人：南京燧坤智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人