【技术实现步骤摘要】
Bioinformatics2021
;
19:2188
‑
2196.)
是一种具有注意力机制的循环神经网络模型,可以预测肽
‑
HLA II
类结合
。
最近,
You
等人提出了一种具有结合核心感知的相互作用模型
DeepMHCII(You R,Qu W,Mamitsuka H et al.DeepMHCII:a novel binding core
‑
aware deep interaction model for accurate MHC
‑
II peptide binding affinity prediction,Bioinformatics 2022
;
38:i220
‑
i228.)
,以增强
MHC
‑
II
和肽结合亲和力预测
。
[0005]当前的方法尽管在预测性能方面取得了一定的进步,但仍然面临四个主要问题:
(1)MHC
‑
II
分子的高度多样性和结合数据的稀缺性导致训练数据有限的
MHC
‑
II
分子的预测精度较低;
(2)
虽然一些算法旨在通过分析注意力模块来增强模型的可解释性,但仍然存在很大的改进空间;
(3)
大多数方法对
MHC
‑
II
分子和肽序列进行单一表征,
【技术保护点】
【技术特征摘要】
1.
一种基于监督对比学习的可解释
MHC
‑
II
肽结合亲和力预测方法,其特征在于,包括步骤:步骤1:搜集
MHC
‑
II
肽亲和力数据,并对
MHC
‑
II
分子
、
肽序列分别进行特征编码,转换为特征向量;步骤2:将步骤1处理后的数据按时间构建训练集;步骤3:根据结合亲和力值将训练集构建为预训练分类数据集
Pre
‑
Dataset
;步骤4:构建基于
Transformer
模块与残差模块的深度学习框架;步骤5:将
Pre
‑
Dataset
输入构建的深度学习框架,使用监督对比学习对其进行预训练;步骤6:对步骤5训练得到的深度学习框架进行优化学习;步骤7:将待预测
MHC
‑
II
分子序列和肽序列输入步骤6训练好的深度学习模型,通过模型的前向计算,输出对应
MHC
‑
II
分子和肽的结合亲和力预测值
。2.
根据权利要求1所述的基于监督对比学习的可解释
MHC
‑
II
肽结合亲和力预测方法,其特征在于,
MHC
‑
II
分子
、
肽序列通过
one
‑
hot
编码方式进行编码,将
MHC
‑
II
分子和肽序列中的氨基酸转换为相应特征向量的形式
。3.
根据权利要求1所述的基于监督对比学习的可解释
MHC
‑
II
肽结合亲和力预测方法,其特征在于,所述基于
Transformer
模块与残差模块的深度学习框架包括
MHC
‑
II
肽交互模块
、
两组
Transformer
模块
、
堆叠的若干个残差模块
、
平均池化层
、
预训练阶段的线性变换层以及用于步骤6优化学习的
sigmoid
函数
。4.
根据权利要求2所述的基于监督对比学习的可解释
MHC
‑
II
肽结合亲和力预测方法,其特征在于,所述
Transformer
模块为
:Transformer(X)
=
Concat(head1,
…
,head
h
)
式中,是投影权重矩阵;是投影权重矩阵;表示交互特征的相对位置编码;
d
w
表示特征长度;
i
表示第
i
个注意力头;
d
model
是
Transformer
的输入特征维数;
d
k
是投影变换后的输入特征维数;
X
表示
Transformer
模块的输入特征矩阵,
Concat()
为张量拼接函数;
Attention()
为注意力机制模块
。5.
根据权利要求2所述的基于监督对比学习的可解释
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。