抗原呈递预测模型的训练方法及其预测方法、设备和介质技术

技术编号：36839137 阅读：47 留言：0更新日期：2023-03-15 15:19

本公开提供了一种抗原呈递预测模型的训练方法及其预测方法、设备和介质，所述训练方法包括：获取抗原序列训练数据及用于表征抗原序列呈递概率的呈递概率训练数据；将抗原序列训练数据输入至待训练的抗原呈递预测模型；通过抗原呈递预测模型对抗原序列训练数据进行呈递预测处理以预测出抗原序列训练数据对应的呈递概率，其中，通过抗原呈递预测模型的特征编码模块对抗原序列训练数据进行氨基酸编码及向量映射处理；根据预测出的呈递概率及呈递概率训练数据训练抗原呈递预测模型。本公开利用深度学习技术有效地建立了基于抗原序列的神经网络算法模型，有效地解决了预测新抗原呈递能力较差的问题，提升了预测抗原呈递能力的准确性和效率。的准确性和效率。的准确性和效率。

全部详细技术资料下载

【技术实现步骤摘要】
抗原呈递预测模型的训练方法及其预测方法、设备和介质

[0001]本公开涉及人工智能
，特别涉及一种抗原呈递预测模型的训练方法及其预测方法、设备和介质。

技术介绍

[0002]最近免疫治疗取得的成功证明了一个长期的假设：肿瘤是具有免疫原性的并且能够引发获得性免疫反应。肿瘤细胞中的主要组织相容性复合物(major Histocompatibility complex,MHC)或者人类白细胞抗原(human leukocyte antigen,HLA)能够呈递肿瘤特异性抗原，这些抗原能够被CD8+(一种白细胞分化抗原)的杀伤性T细胞所识别。多年来研究人员一直在探究能够刺激T细胞产生对肿瘤有效反应的抗原的性质。
[0003]肿瘤抗原能够分为两大类：自身和非自身抗原。肿瘤相关的自身抗原包括癌症
‑
睾丸(种系)抗原，分化抗原和癌症细胞过度表达的抗原。自身抗原的优点是在不同的肿瘤病人和肿瘤中共享。但是，这些自身抗原受到免疫耐受的限制，因此只能引起很弱的或者不能引起T细胞应答。肿瘤所积累的非同义体突变很久以前就被假设为能够被获得性免疫系统所识别的非自身抗原(也称肿瘤新生抗原)，因此能够引起更加强烈的免疫反应。对肿瘤新生抗原的最初报道已经有二十年之久，但是对新生抗原的综合鉴定一直以来都是一件非常困难的事情，直到下一代测序技术的出现才得到提高。随着下一代测序的广泛使用，数项研究已经展示了非同义突变与免疫治疗高度相关。肿瘤中的突变负荷能够预测病人对免疫检查位点抑制疗法的响应，新抗原特异性的T细胞在越来越多的...

【技术保护点】

【技术特征摘要】
1.一种抗原呈递预测模型的训练方法，其特征在于，包括：获取抗原序列训练数据及用于表征抗原序列呈递概率的呈递概率训练数据；将所述抗原序列训练数据输入至待训练的抗原呈递预测模型；通过所述抗原呈递预测模型对所述抗原序列训练数据进行呈递预测处理以预测出所述抗原序列训练数据对应的呈递概率，其中，通过所述抗原呈递预测模型的特征编码模块对所述抗原序列训练数据进行氨基酸编码及向量映射处理；以及，根据预测出的所述呈递概率及所述呈递概率训练数据训练所述抗原呈递预测模型。2.如权利要求1所述的训练方法，所述抗原序列训练数据包括主要由氨基酸组成的多肽序列、短肽序列以及短肽对应的pseudo序列；和/或，所述呈递概率训练数据包括label值。3.如权利要求2所述的训练方法，所述通过所述抗原呈递预测模型对所述抗原序列训练数据进行呈递预测处理以预测出所述抗原序列训练数据对应的呈递概率的步骤，还包括：通过所述抗原呈递预测模型的第一特征提取模块对进行氨基酸编码及向量映射处理后的抗原序列训练数据进行多肽序列一维卷积特征提取处理。4.如权利要求3所述的训练方法，所述第一特征提取模块包括三个并联的卷积结构。5.如权利要求4所述的训练方法，所述三个并联的卷积结构包括卷积核尺寸分别为1*1、1*5、1*9的一层卷积层。6.如权利要求3所述的训练方法，所述通过所述抗原呈递预测模型对所述抗原序列训练数据进行呈递预测处理以预测出所述抗原序列训练数据对应的呈递概率的步骤，还包括：通过所述抗原呈递预测模型的第二特征提取模块对进行多肽序列一维卷积特征提取处理后的抗原序列训练数据进行多肽序列有序特征提取处理。7.如权利要求6所述的训练方法，所述通过所述抗原呈递预测模型对所述抗原序列训练数据进行呈递预测处理以预测出所述抗原序列训练数据对应的呈递概率的步骤，还包括：通过所述抗原呈递预测模型的特征融合模块对进行多肽序列有序特征提取处理后的抗原序列训练数据进行特征融合处理。8.如权利要求1所述的训练方法，所述将所述抗原序列训练数据输入至待训练的抗原呈递预测模型的步骤之前，所述训练方法还包括：对获取到的所述抗原序列训练数据进行预处理，其中，所述预处理包括无效数据过滤处理、字符串序列数字化处理及归一化处理中的至少一种。9.如权利要求1所述的训练方法，还包括：获取抗原序列测试数据；将所述抗原序列测试数据输入至训练出的所述抗原呈递预测模型，以对...

【专利技术属性】
技术研发人员：张碧武，李京宇，刘耿，刘宇轩，
申请(专利权)人：深圳吉诺因生物科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人