基于Transformer的多肽与MHC-I分子结合预测方法技术

技术编号:46410615 阅读:2 留言:0更新日期:2025-09-16 19:57
本发明专利技术公开了一种基于深度学习Transformer架构预测多肽与MHC‑I型分子之间结合关系的方法,包括:将MHC序列使用伪序列的方式进行编码,然后通过一个嵌入表示层将MHC伪序列与多肽序列的每个氨基酸表示为一个密集的向量,并加入位置信息;融合模块将特征进行融合,得到综合的特征表示;编码模块采用Transformer的编码器(Encoder)结构,经过多个编码器对融合特征进行充分的学习;映射模块对融合后的特征进行处理,输出多肽与MHC分子结合的概率。该方法能够快速较准确地预测多肽与MHC‑I分子之间结合关系。

【技术实现步骤摘要】

本专利技术涉及人工智能与生物医药交叉领域,具体涉及一种基于transformer深度学习预测多肽与mhc i分子之间结合关系的方法,可以应用于疫苗开发、药物发现和肿瘤新抗原筛选等领域。


技术介绍

1、癌症是导致人类死亡的第二大疾病,尽管医学发展迅速,但传统治疗方法对晚期及转移性肿瘤疗效有限。近年来,肿瘤免疫治疗如嵌合抗原受体t细胞疗法和免疫检查点抑制剂等展现出良好的疗效,成为新的研究热点。其中,肿瘤新抗原(neoantigen)被认为是免疫治疗的理想靶标,如何准确鉴定新抗原成为一大挑战。准确预测主要组织相容性复合物i(mhc-i)与多肽的结合是提高新抗原鉴定效率的关键。随着测序技术和生物信息学的迅速发展,肿瘤新抗原的预测和识别已经成为免疫治疗研究的热点。以往,肿瘤新抗原的鉴定主要采用cdna文库筛选的方法,但是这种方法耗时费力、效率低下,难以推广应用。近些年来,随着二代测序技术的广泛应用,快速有效地筛选个性化新抗原成为可能。与传统实验方法相比,基于深度学习的计算预测方法可以更快速和准确地完成这一任务。目前常用的mhc-i类新抗原预测方法包括:基于深度学习的本文档来自技高网...

【技术保护点】

1.基于Transformer的多肽与MHC-I分子结合预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,MHC-I型分子的伪序列编码通过将每个MHC-I型分子均转化为结构上位于肽段内的34个氨基酸残基得到。

3.根据权利要求1所述的方法,其特征在于,输入的多肽序列的长度为8-15mer。

4.根据权利要求1所述的方法,其特征在于,所述训练集来自公开可获取的数据库中经过实验验证的数据,并通过以下策略进行筛选:

5.根据权利要求4所述的方法,其特征在于,还包括,通过以下策略向训练集中补入阴性样本:p>

6.根据权...

【技术特征摘要】

1.基于transformer的多肽与mhc-i分子结合预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,mhc-i型分子的伪序列编码通过将每个mhc-i型分子均转化为结构上位于肽段内的34个氨基酸残基得到。

3.根据权利要求1所述的方法,其特征在于,输入的多肽序列的长度为8-15mer。

4.根据权利要求1所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:钱程徐虎倪元丽单娟娟刘丽梅
申请(专利权)人:重庆大学附属肿瘤医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1