一种基于强化学习和分子模拟的靶向多肽设计方法及系统技术方案

技术编号:37324088 阅读:18 留言:0更新日期:2023-04-21 23:03
本发明专利技术公开了一种基于强化学习和分子模拟的靶向多肽设计方法,包括:分别训练多肽分子生成器和多肽

【技术实现步骤摘要】
一种基于强化学习和分子模拟的靶向多肽设计方法及系统


[0001]本专利技术属于生物基因和人工智能多肽药物研究
,尤其涉及一种基于强化学习和分子模拟的靶向多肽设计方法及系统。

技术介绍

[0002]多肽药物由于其靶向特异性强、毒副作用小、易于修饰的特点,在内分泌代谢和肿瘤免疫等领域受到了越来越多的关注。如图1所示,多肽由20种天然氨基酸脱水缩合而成,多肽(黑色)和靶点蛋白(灰色)结合是一种蛋白和蛋白之间相互作用,表面形状互补,关键的氨基酸形成了氢键、盐桥等分子间相互作用,氨基酸随机地排列组合形成了庞大的分子空间(如一个8肽化学空间就高达8
20
),这限制了虚拟筛选和实验验证的效率,同时也很容易发生免疫原性的问题,因此如何利用已有数据,自动化地找到与靶点蛋白具有高亲和力并且氨基酸分布符合人源多肽分布规律的分子空间至关重要。
[0003]传统的方法通常是对已知多肽分子的生物化学性质进行分析,并人工设计虚拟多肽文库,这种方法通常依赖于专家的领域知识和经验,对可更改的氨基酸位点进行突变、插入和删除等操作,可探索的分子空间十分有限,并且由于蛋白质共进化信息十分复杂,上述操作很容易发生免疫原性的问题。近些年来,有人提出了基于机器学习或智能算法的方法自动生成新的多肽分子,常用的方法是将多肽表示为20种氨基酸缩写的字符串,训练时间序列模型或者自然语言处理模型来自动生成多肽分子,或者使用随机搜索算法对模版多肽分子进行优化。具体的,目前多肽分子的设计方法主要有:
[0004]方法一:选择突变位点,建立虚拟肽文库进行筛选;(参见《一种炭疽保护性抗原的亲和多肽的筛选方法》),包括:
[0005](1)准备模版多肽和靶点蛋白的结构,将模版多肽与靶点蛋白进行分子对接和能量优化,选择最佳的对接构象;
[0006](2)根据多肽和蛋白相互作用分析出关键的氨基酸位点,选择对接能量值小于0的非关键位点作为高价值突变位点,保留关键氨基酸位点,对高价值氨基酸位点进行随机突变,构建虚拟肽文库;
[0007](3)使用分子对接和分子动力学模拟来进行亲和力筛选。
[0008]方法一的不足之处在于:
[0009](1)模版多肽结构限制探索更大多肽化学空间的可能性,新颖性不足;
[0010](2)基于分子对接的方法无法获取精确的多肽

靶点蛋白的复合物结构,在此基础上分析关键氨基酸和高价值氨基酸位点不具有指导意义;
[0011](3)只对高价值氨基酸位点进行随机突变,探索的化学空间有限,并可能会引入免疫原性的问题。
[0012]方法二:基于随机搜索算法与优化函数进行迭代设计;(参见《一种基于随机搜索算法和对接评估的蛋白质多肽设计集成装置》),包括:
[0013](1)从20种氨基酸中盲目选择若干个氨基酸组合为初始序列,通过突变和交叉操
作生成多肽序列集合;
[0014](2)利用集成结构预测模块中的结构预测工具对多肽的三维结构进行建模,并利用对接工具评估多肽与目标蛋白三维结构间的相互作用;
[0015](3)搜索算法的评价函数为对接过程获取的RMSD与对接能量的比值,基于搜索算法对多肽序列进行迭代优化。
[0016]该方法的不足之处在于:
[0017](1)初始模版多肽序列的构建具有盲目性,需要大量计算迭代优化出合理序列,探索的化学空间有限,新颖性不足;
[0018](2)在搜索过程中以分子对接结果作为搜索算法的评价函数,需要大量计算资源,效率较低;
[0019](3)随机的突变和交叉操作容易引入免疫原性的问题。
[0020]方法三:基于机器学习算法构建连续可微的潜空间;(参见《机器学习引导的多肽设计》),包括:
[0021](1)通过使用首先在UniProt数据库上预训练的模型、然后使用该模型并对其进行训练以从序列预测荧光,在迁移学习的帮助下生成了编码器神经网络;
[0022](2)对嵌入空间进行基于梯度的优化,该梯度包含了荧光模型的预测概率;
[0023](3)在训练编码器之后,选择当前不发荧光的序列作为种子蛋白质,并使用已训练编码器将其投射到嵌入空间(例如,2维空间)中。运行基于梯度的更新程序来改进嵌入,从而优化种子蛋白质的嵌入;
[0024](4)计算导数并将其用于朝向更高功能的区域移动通过嵌入空间。优化的嵌入坐标在荧光功能方面得到了改进。一旦实现所需的功能水平,嵌入空间中的坐标就会被投射回蛋白质空间,从而产生具有所需功能的氨基酸序列。
[0025]该方法的不足之处在于:
[0026](1)将编码器和解码器进行分别训练,一定程度上增加了模型训练的难度;
[0027](2)该方法未涉及多肽与靶点蛋白相互作用评价;
[0028](3)不涉及分子模拟相关的技术,难以评价设计的多肽的热力学和动力学性质。
[0029]因此,上述的现有技术确实有待提出更佳解决方案的必要性。

技术实现思路

[0030]针对以上现有自动化靶向多肽药物设计技术中的不足,为了设计与靶点蛋白有较高结合亲和力的新颖多肽分子,并且规避可能的潜在免疫原性风险,本专利技术的目的是提供一种基于强化学习和分子模拟的靶向多肽设计方法及系统,首先通过使人源蛋白质序列预训练变分自编码器,使模型“学习”到人源蛋白质中氨基酸的潜在分布表示,再基于迁移学习策略,通过人源多肽数据对模型进行微调,使模型在序列长度和氨基酸分布等方面更加符合人源多肽的性质,即得到一个连续可微的潜空间(Latent Space);同时使用多肽

蛋白相互作用数据训练预测器,该预测器可以是基于多肽和靶点蛋白多维度信息融合的机器学习(如SVM、XGBoost、LightGBM等)或神经网络算法(RNN、CNN、Self

Attention等);然后将预测器输出的值作为奖励函数,基于强化学习策略引导潜空间分布“定向”偏移,从潜空间中采样生成新的多肽序列;最后通过分子对接得到多肽

靶点蛋白复合物结构,并通过分子动
力学模拟和自由能估计筛选得到候选多肽分子。
[0031]本专利技术一方面提供了一种基于强化学习和分子模拟的靶向多肽设计方法,包括:
[0032]S1,分别训练多肽分子生成器和多肽

靶点蛋白相互作用预测器,并对所述多肽分子生成器和多肽

靶点蛋白相互作用预测器联用进行强化学习获得多肽氨基酸分布的新潜空间;
[0033]S2,从新潜空间采样生成新颖多肽分子集合,并与靶点蛋白进行分子对接获取多肽

靶点蛋白复合物三维结构;
[0034]S3,基于所述多肽

靶点蛋白复合物三维结构进行分子动力学模拟,计算结合自由能,按照结合自由能从大大小排序并推荐分子。
[0035]优选的,所述S1包括:
[0036]S11,基于人源蛋白质和多肽序列本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习和分子模拟的靶向多肽设计方法,其特征在于,包括:S1,分别训练多肽分子生成器和多肽

靶点蛋白相互作用预测器,并对所述多肽分子生成器和多肽

靶点蛋白相互作用预测器联用进行强化学习获得多肽氨基酸分布的新潜空间;S2,从新潜空间采样生成新颖多肽分子集合,并与靶点蛋白进行分子对接获取多肽

靶点蛋白复合物三维结构;S3,基于所述多肽

靶点蛋白复合物三维结构进行分子动力学模拟,计算结合自由能,按照结合自由能从大大小排序并推荐分子。2.根据权利要求1所述的一种基于强化学习和分子模拟的靶向多肽设计方法,其特征在于,所述S1包括:S11,基于人源蛋白质和多肽序列数据训练多肽分子生成器,基于多肽分子生成器获取以高维正态分布表示的潜空间;S12,基于多肽

靶点蛋白相互作用的数据集训练多肽

靶点蛋白相互作用预测器,并基于所述多肽

靶点蛋白相互作用预测器获取每个多肽

靶点蛋白对的结合强度或概率值;S13,多肽分子生成器和多肽

靶点蛋白相互作用预测器进行联用和强化学习。3.根据权利要求2所述的一种基于强化学习和分子模拟的靶向多肽设计方法,其特征在于,所述S11包括:(1)基于变分自编码器构建多肽分子生成器,包括:构建氨基酸词汇表,使用人源蛋白质数据作为预训练数据集,将所述预训练数据集映射到氨基酸词汇表获取氨基酸序列的嵌入向量x,变分自编码器拟合训练数据得到后验分布q(z|x),所述后验分布q(z|x)将观察作为输入并输出一组参数,一组所述参数用于指定潜变量z的条件分布;将潜变量z和一个服从标准高斯分布的随机噪声ε组合作为解码器的输入,观察p(x|z)的条件分布;(2)将每个潜变量z作为一个样本z,对于每个样本z,分别确定样本z对应的正态分布的均值和标准差,然后积分域中所有高斯分布的累加形成原始分布P(x)作为VAE的目标函数为:P(x)=∫P(z)P(χ|z)dz;
ꢀꢀꢀꢀ
(1)(3)对所述变分自编码器的目标函数进行最大似然估计,获得VAE模型的损失函教.其中所述损失函教公式为:所述损失函数分为两部分,

D
kl
(Q
φ
(z|X)||P
z
)这一部分是编码器

...

【专利技术属性】
技术研发人员:李高登李津辰安铎周晓城
申请(专利权)人:星希尔生物科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1