【技术实现步骤摘要】
一种分子组学与计算结构联用的肿瘤新生抗原检测筛选方法及系统
[0001]本申请以申请日为2020年12月04日,申请号为202011398320.9的专利技术专利申请为优先权基础。
[0002]本专利技术属于肿瘤新生抗原检测领域以及蛋白质三维结构预测领域,具体涉及一种基于组学检测的肿瘤新生抗原检测方法以及TCR
‑
pMHC蛋白质三维结构预测的肿瘤新生抗原筛选方法。
技术介绍
[0003]肿瘤新生抗原(neoantigen),又称肿瘤特异性抗原(tumor
‑
specific antigen,缩写TSA),是指肿瘤细胞所特有的能够与主要组织相容性复合物(major histocompatibility complex,缩写MHC)以及T细胞受体(T cell receptor,TCR)特异性结合的多肽片段。上世纪的研究表明,肿瘤细胞能够特异性的表达一些短肽,这些短肽能够被MHC结合并呈递,这些短肽即为肿瘤新生抗原。到了上世纪90年代,Boon等人发现肿瘤新生抗原能够被CD8+或CD4+的T细胞识别,并且,TCR、肿瘤新生抗原和MHC是通过形成三元复合物来发挥免疫效应的。
[0004]近些年,以CAR
‑
T与免疫检查点抑制剂为代表的免疫疗法在肿瘤治疗中取得了很好的疗效,同样作为免疫疗法,基于癌症病人所特有的肿瘤新生抗原开发的个性化肿瘤疫苗在近几年也取得了较大的进展。2016年,Rosenberg研究团队在《新英格兰医学杂志》上发表重要成果,他们针对KR ...
【技术保护点】
【技术特征摘要】
1.一种分子组学与计算结构联用的肿瘤新生抗原检测筛选方法,其特征在于,所述方法基于全基因组和/或全外显子和/或转录组测序数据,包括以下步骤:步骤(1):HLA分子分型步骤:基于全基因组和/或全外显子数据进行,预测HLA分子类型;步骤(2):肿瘤体细胞基因变异注释;步骤(3):基因变异肽段翻译,得到变异抗原肽;步骤(4):所述抗原肽与HLA分子的亲和力预测;步骤(5):基于转录组测序数据进行抗原肽基因表达量检测;步骤(6):基于所述步骤(4)的亲和力预测结果以及所述步骤(5)的抗原肽基因表达量检测结果,并纳入抗原肽疏水性评估和氨基酸突变位点范式,综合定量抗原肽筛选;步骤(7):通过步骤(6)的抗原肽筛选结果,进行抗原肽结构稳定性预测筛选。2.如权利要求1所述的方法,其特征在于,所述方法适用于点突变、插入缺失突变和融合基因变异的肿瘤新生抗原筛选。3.如权利要求1所述的方法,其特征在于,所述步骤(1)中,进行HLA分子分型的方法包括:预测6种HLA分子类型,所述HLA分子类型覆盖MHC I和MHC II的主要亚型;参考HLA类型频率分布数据库,从6种HLA分子中挑选出1或2种在患者所属特征人群中出现频率最高的HLA,作为最终预测出的HLA分子;使用HLA分子分型软件,包括:HLAminer和/或Polysolver预测HLA分子类型。4.如权利要求1所述的方法,其特征在于,所述步骤(2)中,对于使用全基因组和/或全外显子测序技术检测出的肿瘤体细胞基因变异进行注释,包括:点突变、插入缺失突变和融合基因变异,将这些基因变异在染色体上注释出来,注释结果的获得由转录组基因表达量检测进行辅助验证确定其表达。5.如权利要求1所述的方法,其特征在于,所述步骤(3)中,将变异核酸序列翻译成氨基酸序列,将包含基因变异的氨基酸序列截短为8
‑
17个氨基酸长度的肽段,截取长度为n,n=8
‑
17个氨基酸的变异抗原肽;对于氨基酸点突变,以点突变为中心分别向前后各延伸n
‑
1个氨基酸,从变异氨基酸序列中截取2n
‑
1个氨基酸长度的肽段,使用长度为n的滑动窗口,将2n
‑
1个氨基酸长度的肽段截短为n个氨基酸长度的突变抗原肽;插入突变的长度为m个氨基酸,对于插入突变,向插入片段前后各延伸n
‑
1个氨基酸,从变异氨基酸序列中截取m+2n
‑
2个氨基酸长度的肽段,使用长度为n的滑动窗口,将m+2n
‑
2个氨基酸长度的肽段截短为n个氨基酸长度的突变抗原肽;对于缺失突变,以缺失位点为中心分别向前后各延伸n
‑
1个氨基酸,从变异氨基酸序列中截取2n
‑
2个氨基酸长度的肽段,使用长度为n的滑动窗口,将2n
‑
2个氨基酸长度的肽段截短为n个氨基酸长度的突变抗原肽;对于融合基因变异,以融合位点为中心分别向前后各延伸n
‑
1个氨基酸,从变异氨基酸序列中截取2n
‑
2个氨基酸长度的肽段,使用长度为n的滑动窗口,将2n
‑
2个氨基酸长度的肽段截短为n个氨基酸长度的变异抗原肽。6.如权利要求5所述的方法,其特征在于,所述氨基酸序列参考预测HLA分子分型匹配情况进行处理;MHC I和/或MHC II分型至少确保1种;和/或,MHC I相关分型截短为9肽、10肽或11肽,和/或,MHC II相关分型截短为13肽、14肽、15
肽或16肽。7.如权利要求1所述的方法,其特征在于,所述步骤(4)中,单独或综合使用软件包括netMHCpan和/或MetaMHCpan和/或PSSMHCpan,预测HLA与抗原肽的亲和力。8.如权利要求1所述的方法,其特征在于,所述步骤(5)中,基于转录组测序数据,采用基因表达量计算软件计算抗原肽所在基因的表达量,代表抗原肽的表达量,采用软件包括HTSeq和/或Salmon,计算抗原肽所在基因的read counts和/或TPM和/或FPKM和/或RPKM作为衡量抗原肽表达量高低的度量值。9.如权利要求1所述的方法,其特征在于,所述步骤(6)中,进行综合定量抗原肽筛选时,使用抗原肽的亲和力阈值和表达量阈值作为筛选依据;在筛选步骤中,同时纳入抗原肽疏水性评估和氨基酸突变位点范式,在抗原肽亲和力和表达值评分相近的情况下,依据抗原肽疏水性评估和氨基酸突变位点范式进行筛选。10.如权利要求9所述的方法,其特征在于,抗原肽筛选中,使用抗原肽的亲和力阈值和表达量阈值作为筛选依据,进一步筛选具有较高表达量且亲和力高的抗原肽;并在抗原肽亲和力和表达量评分相近的情况下,进一步筛选到其中疏水性整体较弱和/或突变位点符合固定范式的抗原肽,其中疏水性通过评分或疏水残基比例进行评估;和/或,所述突变位点范式重点考虑2号位和3号位氨基酸。11.如权利要求1所述的方法,其特征在于,所述步骤(7)中,进行抗原肽结构稳定性预测筛选时,在步骤(1)~(6)筛选后保留的抗原肽中,根据抗原肽长度和氨基酸分布规律进行稳定性估算;同时,使用抗原肽结构稳定性预测软件预测抗原肽的蛋白结构稳定性,确保在细胞内不被降解并进一步被MHC与TCR结合;采用软件NetMHCstab预测筛选抗原肽的结构稳定性,所述筛选包括:保留稳定性强的抗原肽。12.如权利要求11所述的方法,其特征在于,在筛选后剩余抗原肽中,针对HLA
‑
A、HLA
‑
B、HLA
‑
C分子结合的抗原肽,综合评分相近情况下,保留9肽和/或10肽;针对HLA
‑
DP、HLA
‑
DQ、HLA
‑
DR分子结合的抗原肽,综合评分相近情况下,保留15肽和/或16肽;进而,同等条件下保留M(Met)、W(Trp)、C(Cys)、G(Gly)、T(Thr)这五种氨基酸相对含量较低的抗原肽。13.如权利要求1所述的方法,其特征在于,进一步包括步骤(8):基于肿瘤免疫微环境的免疫细胞类型预测;和/或,所述步骤(8)中,基于转录组数据使用免疫细胞类型预测软件预测肿瘤免疫微环境中的免疫细胞和基质细胞的类型及比例。14.如权利要求1所述的方法,其特征在于,进一步包括步骤(9):抗原肽的质谱验证,使用质谱方法验证检测到的肿瘤新生抗原在人体中是否真实存在;和/或,所述步骤(9)中,提取癌症病人的样本,包括组织和/或血液,离体样本,进行质谱分析,使用质谱数据库搜索工具,针对质谱鉴定到的肽段,从包含突变的定制蛋白质数据库中搜索与之匹配的多肽;或,采用公共数据库中...
【专利技术属性】
技术研发人员:戴文韬,刘继翔,李园园,顾婷婷,
申请(专利权)人:上海朴岱生物科技合伙企业有限合伙,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。