【技术实现步骤摘要】
HLA II型分子与多肽的亲和力预测模型的获取方法及装置
[0001]本申请涉及计算机辅助生物分子结合领域,尤其涉及一种HLA II型分子与多肽的亲和力预测模型的获取方法及装置。
技术介绍
[0002]随着肿瘤技术的不断深入,推出了一种新的肿瘤免疫治疗技术,肿瘤免疫治疗技术消灭肿瘤细胞的过程一般包括:肿瘤新生抗原与肿瘤细胞人类白细胞抗原(Human Leukocyfe Antigen,HLA)分子结合,结合后的复合体被提呈到细胞膜表面被T细胞识别,通过T细胞消灭肿瘤。HLA分子分为HLA I型分子和HLA II型分子,目前已有一些可以预测HLA II型分子与多肽片段亲和力的机器学习方法,然而现有方法在构建机器学习模型时,对于机器学习模型的输入数据部分仅考虑由氨基酸表示的HLA II型分子序列与多肽序列的简单拼接,忽略了HLA II型分子与多肽片段的融合信息,从而导致现有HLA II型分子与多肽片段的亲和力预测结果准确率低、稳定性差。
技术实现思路
[0003]为了解决上述技术问题,本申请实施例提供了一种HLA ...
【技术保护点】
【技术特征摘要】
1.一种HLA II型分子与多肽的亲和力预测模型的获取方法,其特征在于,所述方法包括:获取修正训练数据集,所述修正训练数据集包括HLA II型分子、肽段、HLA II型分子和肽段的组合对的归一化亲和力值;分别对所述HLA II型分子、所述肽段、所述组合对进行编码转换处理,得到对应的第一特征编码矩阵、第二特征编码矩阵和第三特征编码矩阵;通过初始深度学习网络模型分别对所述第一特征编码矩阵、所述第二特征编码矩阵和所述第三特征编码矩阵进行计算,以得到第一输出特征张量、第二输出特征张量和第三输出特征张量;将所述第一输出特征张量、所述第二输出特征张量和所述第三输出特征张量进行拼接,得到第一拼接特征张量;对所述第一拼接特征张量进行计算,得到HLA II型分子与肽段的组合对的第一预测亲和力值;获取所述第一预测亲和力值与所述归一化亲和力值之间的第一误差数据,根据所述第一误差数据对所述初始深度学习网络模型的权重参数进行调整,得到修正深度学习网络模型;根据所述修正深度学习网络模型、所述第一特征编码矩阵、所述第二特征编码矩阵和所述第三特征编码矩阵获取所述组合对的第二预测亲和力值;获取所述第二预测亲和力值与所述归一化亲和力值之间的第二误差数据,在所述第二误差数据小于或等于所述第一误差数据时,将所述修正深度学习网络模型作为HLA II型分子与多肽的亲和力预测模型。2.根据权利要求1所述的方法,其特征在于,所述获取修正训练数据集,包括:获取初始训练数据集,所述初始训练数据集包括HLA II型分子、肽段、HLA II型分子和肽段的组合对的初始亲和力值,对所述初始亲和力值进行归一化处理,得到所述归一化亲和力值;将所述HLA II型分子、所述肽段、所述归一化亲和力值作为所述修正训练数据集。3.根据权利要求1所述的方法,其特征在于,所述根据所述修正深度学习网络模型、所述第一特征编码矩阵、所述第二特征编码矩阵和所述第三特征编码矩阵获取所述组合对的第二预测亲和力值,包括:通过所述修正深度学习网络模型分别对所述第一特征编码矩阵、所述第二特征编码矩阵和所述第三特征编码矩阵进行计算,以得到第四特征张量、第五特征张量和第六特征张量;将所述第四特征张量、第五特征张量和第六特征张量进行拼接,得到第二拼接特征张量;对所述第二拼接特征张量进行计算,得到HLA II型分子与肽段的组合对的第二预测亲和力值。4.根据权利要求1所述的方法,其特征在于,所述初始深度学习网络模型包括第一一维卷积块、第一Attention模块、第二一维卷积块;通过初始深度学习网络模型对第一特征编码矩阵进行计算,得到第一输出特征张量,包括:通过所述第一一维卷积块对第一特征编码矩阵进行计算,得到第一初始特征张量;通过所述第一Attention模块对所述第一初始特征张量进行计算,得到第一权重矩阵,将所述第一权重矩阵与所述第一初始特征张量进行加权计算,得到第一修正特征张量;
通过所述第二一维卷积块对所述第一修正特征张量进行计算,得到所述第一输出特征张量。5.根据权利要求4所述的方法,其特征在于,所述初始深度学习网络模型还包括第三一维卷积块、第二Attention模块、第四一维卷积块;通过初始深度学习网络模型对所述第二特征编码矩阵进行计算,以得到第二输出特征张量,包括:通过所述第三一维卷积块对第二特征编码矩阵进行计算,得到第二初始特征张量;通过所述第二Attention模块对所述第二初始特征张量进行计算,得到第二权重矩阵,将所述第二权重矩阵与所述第二初始特征张量进行加权计算,得到第二修正特征张量;通过所述第四一维卷积块对所述第二修正特征张量进行计算,得到所述第二输出特征张量。6.根据权利要求5所述的方法,其特征在于,所述初始深度学习网络模型还包括第一二维卷积块、第三Attention模块、第二二维卷积块;通过初始深度学习网络模型对所述第三特征编码矩阵进行计算,以得到第三输出特征张量,包括:通过所述第一二维卷积块对第三特征编码矩阵进行计算,得到初始二维特征张量;通过所述第三Attention模块对所述初始二维特征张量进行计算,得到第三权重矩阵,将...
【专利技术属性】
技术研发人员:莫凡,孙英强,
申请(专利权)人:杭州纽安津生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。