基于深度学习模型预测抗体翻译后修饰位点的方法和系统技术方案

技术编号：39196343 阅读：9 留言：0更新日期：2023-10-27 08:43

本发明专利技术涉及人工智能领域，具体涉及一种基于深度学习模型预测抗体翻译后修饰位点的方法和系统，所述方法包括：获取待预测抗体的蛋白质序列；将所述待预测抗体的蛋白质序列输入预先训练的修饰位点预测模型，以得到所述修饰位点预测模型输出的修饰位点预测结果；其中，所述修饰位点预测模型是基于预先构建的注意力卷积神经网络框架和胶囊网络框架、利用抗体样本的蛋白质序列以及抗体样本对应的修饰位点进行训练得到的。利用预先训练的深度学习模型对多种修饰位点进行快速、准确的预测，解决了现有技术中修饰位点预测过程复杂耗时，泛化能力较差的技术问题。能力较差的技术问题。能力较差的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习模型预测抗体翻译后修饰位点的方法和系统

[0001]本专利技术涉及人工智能领域，具体涉及一种基于深度学习模型预测抗体翻译后修饰位点的方法和系统。

技术介绍

[0002]公开于该
技术介绍
部分的信息仅仅旨在增加对本专利技术的总体背景的理解，而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
[0003]抗体是一种免疫球蛋白分子，可以识别和结合外来抗原并调节免疫反应。抗体的基本结构包括两个重链和两个轻链，它们通过二硫键相互连接形成一个Y形分子。
[0004]抗体在翻译后会发生多种修饰，这些修饰可以影响抗体的结构、功能和稳定性。其中最常见的修饰包括糖基化、去乙酰化、磷酸化、甲基化等。
[0005]糖基化是抗体翻译后最常见的修饰之一，大约90%的抗体都会发生糖基化。糖基化可以增强抗体的稳定性、活性和黏附性，并且还可以调节抗体与其他分子之间的相互作用。此外，糖基化还可以影响抗体的免疫原性和清除效率。
[0006]去乙酰化也是一种常见的修饰，在抗体的某些位点上发生去乙酰化可以增加其亲和力和特异性。磷酸化则可能影响抗体与其他分子的相互作用，例如抗体与受体或信号转导分子之间的相互作用。
[0007]甲基化是一种较少被研究的修饰，但已经发现可以影响抗体的稳定性和免疫原性。此外，还有其他一些不太常见的修饰方式，如二硫键桥的形成、脯氨酸的异构化等。
[0008]总之，抗体翻译后的修饰对其结构、功能和稳定性都有很大的影响，如何对抗体翻译后的修饰位点进...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习模型预测抗体翻译后修饰位点的方法，其特征在于，所述方法包括：获取待预测抗体的蛋白质序列；将所述待预测抗体的蛋白质序列输入预先训练的修饰位点预测模型，以得到所述修饰位点预测模型输出的修饰位点预测结果；其中，所述修饰位点预测模型是基于预先构建的注意力卷积神经网络框架和胶囊网络框架、利用抗体样本的蛋白质序列以及抗体样本对应的修饰位点进行训练得到的。2.根据权利要求1所述的方法，其特征在于，基于预先构建的注意力卷积神经网络框架和胶囊网络框架、利用抗体样本的蛋白质序列以及抗体样本对应的修饰位点进行训练，得到所述修饰位点预测模型，具体包括：获取抗体样本的蛋白质序列以及抗体样本对应的修饰位点；将抗体样本对应的修饰位点进行分类，以得到多个位点类别；以所述抗体样本的蛋白质序列和抗体样本对应的位点类别构建数据集；将所述数据集中的训练集分别输入预先构建的注意力卷积神经网络框架和胶囊网络框架中进行训练，以得到所述修饰位点预测模型；在训练过程中，将所述注意力卷积神经网络框架得到的预测分数与所述胶囊网络框架的预测分数取平均值，以所述平均值作为预测结果值。3.根据权利要求2所述的方法，其特征在于，获取抗体样本的蛋白质序列以及抗体样本对应的修饰位点，具体包括：获取带有翻译后修饰注释信息的抗体样本的蛋白质序列；在所述抗体样本的蛋白质序列中，提取含有以翻译后修饰位点为中心的n个氨基酸残基的片段序列作为一维向量进行二进制单热编码，得到翻译后修饰位点的n
×
m二维矩阵数据；其中，n为≥7的奇数；m为氨基酸种类的特征维度。4.根据权利要求1所述的方法，其特征在于，所述修饰位点预测模型包括多个子模型；将所述待预测抗体的蛋白质序列输入预先训练的修饰位点预测模型，以得到所述修饰位点预测模型输出的修饰位点预测结果，具体包括：将所述待预测抗体的蛋白质序列输入至少一个子模型，以分别得到子模型输出的预测分数；将所述子模型输出的预测分数的平均值与预设的阈值进行比较，在所述预测分数的平均值高于阈值的情况下，则判定该待预测抗体包含翻译后修饰位点，并得到修饰位点预测结果。5.根据权利要求1所述的方法，其特征在于，预先构建的所述注意力卷积神经网络框架包括三层卷积层、注意力层、全连接层和输出层，其中，注意力卷积神经网络的第一卷积层用于提取序列编码后的特征，并逐一滤波求和；其中，第一卷积层的卷积通道数为100，卷积核大小：1
×
1，步长：1，采样率：0.8；注意力卷积神经网络的第二卷积层用于将第一卷积层的输出结果进行填充继续提取特征，再汇总求和，其中，所述第二卷积层卷积核通道数为50，卷积核大小：6
×
6，步长：1，采样率：0.5；
注意力卷积神经网络的第三...

【专利技术属性】
技术研发人员：司马鹏，
申请(专利权)人：苏州创腾软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人