一种基于深度学习的抗体结构生成方法技术

技术编号:37717100 阅读:12 留言:0更新日期:2023-06-02 00:13
本发明专利技术属于生物信息技术领域,具体涉及一种基于深度学习的抗体结构生成方法,该方法包括:获取待预测的序列数据,对该数据进行预处理;采用PCA方法对预处理后的特征序列进行分解降维处理,分解降维处理的过程包括计算序列特征的协方差矩阵,并计算出协方差矩阵的特征值;对特征值进行排序,根据排序后的特征值筛选出对应的特征向量,将筛选出的特征作为分解降维后的序列特征;将分解降维后的序列数据输入到训练好的改进神经网络模型中,得到抗体结构预测结果;本发明专利技术针对抗体结构,对每一个氨基酸提取所有重原子信息作为标签使用,能够更精确的表达抗体的空间结构。精确的表达抗体的空间结构。精确的表达抗体的空间结构。

【技术实现步骤摘要】
一种基于深度学习的抗体结构生成方法


[0001]本专利技术属于生物信息
,具体涉及一种基于深度学习的抗体结构生成方法。

技术介绍

[0002]抗体(Antibody)是在体液免疫中起关键作用的蛋白质。抗体的结构由两条重(H)和两条轻(L)多肽链组成。它们的主要功能是以高亲和力和特异性结合外来入侵者,抗体的产生是为了介导针对外来病原体的免疫反应,作为适应免疫的一部分。随着人工智能(Artificial Intelligence,AI)技术,特别是深度学习(Deep Learning,DL)技术的发展和抗体结构数据的积累,基于深度学习的抗体结构预测已经取得了巨大的进展。在药物发现和蛋白质工程中,一个主要目的是设计一种能够作为治疗药物发挥有用功能的抗体,这要求对抗体结构进行解析,传统方法对抗体进行解析,费时,费力,且非常昂贵。在计算机视觉和自然语言处理等领域取得成果的推动下,近年来深度学习技术在抗体领域得到了广泛的应用。
[0003]一个抗体单体由两条重链(H)和两条轻链(L)组成,重链和轻链结合在一起,形成“Y”形结构。它们具有一个NH2末端可变区或抗原结合片段(Fab)和一个COOH恒定区或可结晶片段(Fc),结构的不同部分具有不同的功能。可变区决定了抗体的独特型,并且对病原体抗原具有亲和力。恒定区执行其他免疫相关功能,例如补体结合、巨噬细胞结合,研究中可用同位素标记该抗体。
[0004]抗体的抗原结合位点存在于Fab区,主要由六个互补决定区(CDR)组成:重链和轻链各三个。由于抗体合成过程中产生的多样性,抗体可以识别数百万种不同的抗原。重链和轻链进行基因重组,其中发生不同的基因组合以增加最终基因产物的多样性。在六个抗体CDR区中其中五个CDR通常折叠为几种经典构象之一,可以用现有方法预测,而剩余的环(CDR H3),由于实验观察到的结构高度可变,传统方法不能够较好的预测。为了对抗体进行计算分析或预测其有效性,通常需要生成三维模型。由于X射线晶体学、核磁共振(NMR)和低温电子显微镜(CryoEM)等传统结构测定方法费力、耗时且昂贵。
[0005]现有的用于蛋白质结构预测的机器学习方法都集中在基于协同进化的方法上。这些方法的准确性取决于数据库中可用的同源蛋白质序列的数量。对于许多蛋白质,尤其是那些没有足够序列同源物的蛋白质,例如抗体。基于协同进化的方法机器学习效果低,预测的结构准确度差。

技术实现思路

[0006]为解决以上现有技术存在的问题,本专利技术提出了一种基于深度学习的抗体结构生成方法,包括:获取待预测的序列数据,对该数据进行预处理;将预处理后的序列数据输入到训练好的改进神经网络模型中,得到预测的抗体结构;根据预测的抗体结构构建抗体;改进神经网络模型维改进的ResNet

RCCA模型;
[0007]对改进神经网络模型进行训练的过程包括:
[0008]S1:获取原始抗体数据集,其中原始抗体数据为抗体的序列信息,包括抗体一级结构、抗体二级结构以及抗体三级结构;
[0009]S2:将原始抗体数据集中的抗体序列信息转化为矩阵数据,并将矩阵数据作为序列特征;获取抗体结构的原子坐标信息,并将该信息作为结构标签;
[0010]S3:采用PCA方法对序列特征进行分解降维处理;
[0011]S4:将结构标签和分解降维后的序列特征输入到改进后的ResNet

RCCA模型中,得到抗体结构预测结果;
[0012]S5:根据抗体结构预测结果计算模型的损失函数,不断调整模型参数,方损失函数最小时完成模型训练。
[0013]优选的,将原始抗体数据集中的抗体序列信息转化为矩阵数据的过程包括:将抗体序列信息输入到预训练的蛋白质语义模型ESM

1B中,得到具有抗体序列信息的矩阵数据,其中蛋白质语义模型ESM

1B为以蛋白质序列作为输入,经过超参数优化训练的高模型容量的Transformer模型。
[0014]优选的,采用PCA方法对序列特征进行分解降维处理的过程包括:计算序列特征的协方差矩阵,并计算出协方差矩阵的特征值;对特征值进行排序,根据排序后的特征值筛选出对应的特征向量,将筛选出的特征作为分解降维后的序列特征。
[0015]优选的,改进后的ResNet

RCCA模型包括ResNet模型和6个RCCA模块;ResNet模型由一维残差卷积网络和二维残差卷积网络构成,每个一维卷积块由两个卷积层,两个池化层组成,卷积层卷积核大小为5*5;维残差卷积网络由一个二维卷积层、池化层、25个二维卷积块组成,二维卷积块由两个卷积层,两个池化层组成,卷积层卷积核大小为3*3,RCCA模块设置于二维卷积层之后。
[0016]优选的,采用改进的ResNet

RCCA模型对结构标签和分解降维后的序列特征进行处理的过程包括:将分解降维后的序列特征输入到一维残差卷积网络中,得到一维特征图;将一维特征图与输入的序列特征进行拼接,并将拼接后的特征图输入到二维残差卷积网络中,得到二维特征图;将二维特征图输入到RCCA模块中,通过残差卷积网络学习二维特征图的时序信息,采用交叉注意力机制学习二维特征图的空间信息;根据二维特征图的时序信息和空间信息对抗体结构进行预测,得到预测后的抗体结构。
[0017]为实现上述目的,本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行,所述计算机程序被处理器执行时实现任一上述基于深度学习的抗体结构生成方法。
[0018]为实现上述目的,本专利技术还提供一种基于深度学习的抗体结构生成装置,包括处理器和存储器;所述存储器用于存储计算机程序;所述处理器与所述存储器相连,用于执行所述存储器存储的计算机程序,以使所述一种基于深度学习的抗体结构生成装置执行任一上述基于深度学习的抗体结构生成方法。
[0019]本专利技术有以下有益效果:
[0020]本专利技术充分利用了抗体序列信息和氨基酸特征信息,未适用共进化信息对抗体结构进行预测;本专利技术针对抗体结构,对每一个氨基酸提取所有重原子信息作为标签使用,能够更精确的表达抗体的空间结构;本专利技术提出了一种新的混合神经网络,将ResNet和交叉
注意力机制进行了融合,融合之后的网络可以更有效的提取并学习蛋白质序列信息,提高了预测精度,且针对不同的数据集都有着不错的泛化性能。
附图说明
[0021]图1为本专利技术的基于深度学习的抗体结构预测方法的流程图;
[0022]图2为本专利技术的模型框架结构图;
[0023]图3为本专利技术的改进神经网络结构图。
具体实施方式
[0024]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的抗体结构生成方法,其特征在于,包括:获取待预测的序列数据,对该数据进行预处理;将预处理后的序列数据输入到训练好的改进神经网络模型中,得到预测的抗体结构;根据预测的抗体结构构建抗体;改进神经网络模型维改进的ResNet

RCCA模型;对改进神经网络模型进行训练的过程包括:S1:获取原始抗体数据集,其中原始抗体数据为抗体的序列信息,包括抗体一级结构、抗体二级结构以及抗体三级结构;S2:将原始抗体数据集中的抗体序列信息转化为矩阵数据,并将矩阵数据作为序列特征;获取抗体结构的原子坐标信息,并将该信息作为结构标签;S3:采用PCA方法对序列特征进行分解降维处理;S4:将结构标签和分解降维后的序列特征输入到改进后的ResNet

RCCA模型中,得到抗体结构预测结果;S5:根据抗体结构预测结果计算模型的损失函数,不断调整模型参数,方损失函数最小时完成模型训练。2.根据权利要求1所述的一种基于深度学习的抗体结构生成方法,其特征在于,将原始抗体数据集中的抗体序列信息转化为矩阵数据的过程包括:将抗体序列信息输入到预训练的蛋白质语义模型ESM

1B中,得到具有抗体序列信息的矩阵数据,其中蛋白质语义模型ESM

1B为以蛋白质序列作为输入,经过超参数优化训练的高模型容量的Transformer模型。3.根据权利要求1所述的一种基于深度学习的抗体结构生成方法,其特征在于,采用PCA方法对序列特征进行分解降维处理的过程包括:计算序列特征的协方差矩阵,并对协方差矩阵做特征值分解,求得其特征值和特征向量,并将特征值从大到小排序;根据排序后的特征值筛选出对应的特征向量,将筛选出的特征作为分解降维后的序列特征。4.根据权利要求1所述的一种基于深度学习的抗体结构生成方法,其特征在于,改进后的...

【专利技术属性】
技术研发人员:周文舒坤贤
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1