【技术实现步骤摘要】
基于深度学习的HLA
‑
I类与TCR结合预测方法
[0001]本专利技术涉及的是一种计算机与基因工程交叉领域的技术,具体是一种基于深度学习的主要组织相容性复合体
HLA
‑
I
类与
TCR
结合预测方法
(PanTCR)。
技术介绍
[0002]T
细胞受体
(TCR)
是一种位于
T
细胞表面的分子,能够识别并结合抗原,启动
T
细胞的免疫应答
。TCR
由
α
链和
β
链两个多肽链组成
。HLA
‑
I
分子则是几乎所有核细胞表面的分子,可以结合并呈递抗原给
T
细胞
。HLA
‑
I
分子由
α
链和
β2微球蛋白链两个多肽链组成
。
当
TCR
与
HLA
‑
I
复合物结 ...
【技术保护点】
【技术特征摘要】
1.
一种基于深度学习的
HLA
‑
I
类与
TCR
结合预测方法,其特征在于,包括以下步骤:步骤
1、
从
IEDB、VDJdb、PIRD
和
McPas
‑
TCR
四个数据库中收集全面的肽
‑
TCR
结合记录并构成数据集;步骤
2、
对进入模型前的数据进行预处理,得到独热编码矩阵,具体包括:
2.1)
将每个数据样例的肽段序列和
TCR
序列合并,并保留原始的肽段序列和
TCR
序列,得到肽段序列
、TCR
序列和合并序列;
2.2)
对步骤
2.1
得到的序列分别进行独热编码,得到三个独热编码矩阵;步骤
3、
将步骤2得到的独热编码矩阵输入深度学习模型进行学习,预测得到结合概率,具体包括:
3.1)TCR
序列的独热编码矩阵通过
CNN
‑
LSTM
模块进行解码得到解码特征,肽段序列和合并序列的独热编码矩阵从二维矩阵变形为一维特征;
3.2)
将步骤
3.1)
得到的解码特征与两类一维特征拼接为融合特征矩阵后,输入深度学习模型的全连接网络,将特征空间映射到标签空间,从而实现对抗原肽段与
TCR
的结合概率的预测
。2.
根据权利要求1所述的基于深度学习的
HLA
‑
I
类与
TCR
结合预测方法...
【专利技术属性】
技术研发人员:袁野,
申请(专利权)人:上海数因信科智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。