一种基于对比学习的TCR与抗原复合物亲和力预测算法制造技术

技术编号:34367114 阅读:24 留言:0更新日期:2022-07-31 09:20
本发明专利技术公布了一种基于自监督对比学习的TCR与抗原复合物亲和力预测算法,包括预训练与预测两个阶段:1)对比学习预训练阶段,使用TCR序列作为训练集,对TCR序列的氨基酸计算注意力权重,以一定概率掩盖部分氨基酸产生新的TCR序列,通过Transformer编码器进行编码,生成两条序列的向量表示(embedding),然后根据对比学习框架,计算两条序列的余弦相似性,归一化温度

A prediction algorithm of affinity between TCR and antigen complex based on comparative learning

【技术实现步骤摘要】
一种基于对比学习的TCR与抗原复合物亲和力预测算法


[0001]本专利技术涉及深度学习
,尤其涉及一种基于自监督学习的TCR与 抗原复合物亲和力预测方法。

技术介绍

[0002]在T细胞识别肿瘤细胞的过程中,新抗原发挥着至关重要的作用,但是 只有极小部分的新抗原可以激活T细胞免疫响应。在免疫和生物信息学领域, 预测T细胞与新抗原的结合一直是一个长期存在的挑战。
[0003]但是通过实验的方法进行验证需要消耗大量的人力物力,深度学习模型 在相应问题上已经有了不错的表现,为了减少实验验证的成本,我们希望设 计一种基于自监督对比学习的模型,用于预测TCR和抗原复合物的结合。
[0004]因此,本专利技术提出了一种基于自监督对比学习的TCR与抗原复合物亲和 力预测算法。

技术实现思路

[0005]本专利技术的目的是为了解决现有技术中存在的缺点,而提出的一种基于自 监督对比学习的TCR与抗原复合物亲和力预测算法。
[0006]为了实现上述目的,本专利技术采用了如下技术方案:一种基于自监督对比 学习的TCR与抗本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于对比学习的TCR与抗原复合物亲和力预测算法,其特征在于:包括以下步骤:S1:操作者使用TCR序列作为训练集放入对比学习模型中;S2:模型使用注意力机制对TCR序列的每个氨基酸进行编码,并计算注意力权重;S3:在模型训练的过程中,通过注意力权重概率掩盖方式来生成不同的掩盖TCR序列;S4:将原始TCR序列与掩盖生成的TCR序列输入到transformer编码器进行编码,生成两个向量h
i
和h
j
;S5:模型训练完成之后可根据注意力权重确定重要的氨基酸;S6:向量h
i
和h
j
可以通过对比学习的思想,计算余弦相似度,并使用归一化温度

尺度交叉熵(NT

Xent损失)计算损失,通过不断优化模...

【专利技术属性】
技术研发人员:刘辉房意明
申请(专利权)人:南京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1