【技术实现步骤摘要】
本专利技术涉及人工智能与生物医药交叉领域,具体涉及一种基于transformer深度学习预测多肽与mhc i分子之间结合关系的方法,可以应用于疫苗开发、药物发现和肿瘤新抗原筛选等领域。
技术介绍
1、癌症是导致人类死亡的第二大疾病,尽管医学发展迅速,但传统治疗方法对晚期及转移性肿瘤疗效有限。近年来,肿瘤免疫治疗如嵌合抗原受体t细胞疗法和免疫检查点抑制剂等展现出良好的疗效,成为新的研究热点。其中,肿瘤新抗原(neoantigen)被认为是免疫治疗的理想靶标,如何准确鉴定新抗原成为一大挑战。准确预测主要组织相容性复合物i(mhc-i)与多肽的结合是提高新抗原鉴定效率的关键。随着测序技术和生物信息学的迅速发展,肿瘤新抗原的预测和识别已经成为免疫治疗研究的热点。以往,肿瘤新抗原的鉴定主要采用cdna文库筛选的方法,但是这种方法耗时费力、效率低下,难以推广应用。近些年来,随着二代测序技术的广泛应用,快速有效地筛选个性化新抗原成为可能。与传统实验方法相比,基于深度学习的计算预测方法可以更快速和准确地完成这一任务。目前常用的mhc-i类新抗原预测方法
...【技术保护点】
1.基于Transformer的多肽与MHC-I分子结合预测方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,MHC-I型分子的伪序列编码通过将每个MHC-I型分子均转化为结构上位于肽段内的34个氨基酸残基得到。
3.根据权利要求1所述的方法,其特征在于,输入的多肽序列的长度为8-15mer。
4.根据权利要求1所述的方法,其特征在于,所述训练集来自公开可获取的数据库中经过实验验证的数据,并通过以下策略进行筛选:
5.根据权利要求4所述的方法,其特征在于,还包括,通过以下策略向训练集中补入阴性样本:
...【技术特征摘要】
1.基于transformer的多肽与mhc-i分子结合预测方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,mhc-i型分子的伪序列编码通过将每个mhc-i型分子均转化为结构上位于肽段内的34个氨基酸残基得到。
3.根据权利要求1所述的方法,其特征在于,输入的多肽序列的长度为8-15mer。
4.根据权利要求1所述的方法,其特征在于,所...
【专利技术属性】
技术研发人员:钱程,徐虎,倪元丽,单娟娟,刘丽梅,
申请(专利权)人:重庆大学附属肿瘤医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。