基于高通量测序技术在多组学层面识别肿瘤新抗原的方法、装置及计算机可读存储介质制造方法及图纸

技术编号:38998545 阅读:8 留言:0更新日期:2023-10-07 10:30
本发明专利技术公开了鉴定领域中基于高通量测序技术在多组学层面识别肿瘤新抗原的方法、装置及计算机可读存储介质。本发明专利技术所要解决的技术问题是如何基于高通量测序技术在多组学层面分析识别肿瘤新抗原。本发明专利技术首先获得待测肿瘤患者肿瘤样本的全外显子测序数据、转录组测序数据以及血液白细胞样本的全外显子测序数据;将测序数据比对到参考基因组得到比对数据,从比对数据中获得肿瘤样本的突变数据和待测肿瘤患者的HLA I类抗原分型;然后基于突变数据确定突变型多肽,根据突变型多肽和HLA I类抗原的结合力鉴定突变型多肽是否为新抗原。本发明专利技术可以实现更多可能产生肿瘤新抗原的分子事件的识别,可应用于制备肿瘤疫苗和相关药物。可应用于制备肿瘤疫苗和相关药物。

【技术实现步骤摘要】
基于高通量测序技术在多组学层面识别肿瘤新抗原的方法、装置及计算机可读存储介质


[0001]本专利技术涉及鉴定领域中基于高通量测序技术在多组学层面识别肿瘤新抗原的方法、装置及计算机可读存储介质。

技术介绍

[0002]随着癌症治疗技术的发展,诸如免疫治疗(immunotherapy)等新技术逐渐成熟,并凭借低副作用和低复发率等相对优势被愈发广泛地应用于临床治疗。免疫治疗虽形式众多,比如单克隆抗体,CAR

T,TCR

T和癌症疫苗(cancer vaccine),但总的来说都是通过激活或强化患者的免疫系统,进而特异性地识别和杀伤肿瘤细胞。
[0003]在免疫系统对肿瘤细胞的识别过程中,肿瘤新抗原(neoantigen)具有重要作用。肿瘤新抗原源于肿瘤细胞基因组或转录组中的突变,携带突变的DNA或RNA片段被翻译为多肽后因其免疫原性会被人类白细胞抗原(HLA,Human Leukocyte Antigen)识别并呈现给免疫细胞。因此肿瘤新抗原的识别意义重大。一方面评估肿瘤新抗原负荷可以预测免疫治疗疗效。另一方面准确的肿瘤新抗原识别可以用来协助制备更有效的癌症疫苗。
[0004]对于肿瘤新抗原的识别,当前科学界主要关注基因组水平单核苷酸突变。然而,肿瘤新抗原的来源并不唯一,既可以在基因组层面产生,比如基因融合(gene fusion),也可以在转录组层面产生,比如选择性剪切(alternative splicing)和RNA编辑(RNA editing)。因此,只专注于基因组水平单核苷酸突变可能会导致肿瘤免疫原性的低估。另一方面,上述分子事件会造成更显著地多肽序列改变,因而通常会使多肽具有更高的免疫原性。因此只关注单核苷酸突变可能会错过具有更强免疫原性的多肽。

技术实现思路

[0005]本专利技术所要解决的技术问题是如何分析识别肿瘤新抗原和/或如何基于高通量测序技术在多组学层面分析识别肿瘤新抗原。
[0006]为了解决上述技术问题,本专利技术首先提供了鉴定或辅助鉴定肿瘤新抗原的方法,所述方法可包括如下步骤:
[0007]A1)获得待测肿瘤患者的测序数据,所述测序数据包括肿瘤样本的全外显子测序数据、肿瘤样本的转录组测序数据和血液白细胞样本的全外显子测序数据;
[0008]A2)将所述测序数据比对到参考基因组得到比对数据,所述比对数据包括肿瘤样本的全外显子比对数据、肿瘤样本的转录组比对数据和血液白细胞样本的全外显子比对数据,从所述比对数据中获得所述肿瘤样本的突变数据和所述血液白细胞样本的HLA I类抗原;所述突变数据包括所述肿瘤样本的全外显子比对数据中检测到的单核苷酸突变和小片段插入或缺失突变,以及所述肿瘤样本的转录组比对数据中检测到的选择性剪切突变、RNA编辑突变和RNA基因融合突变;
[0009]A3)基于所述突变数据确定所述突变数据对应的突变型多肽,根据所述突变型多
肽和所述HLA I类抗原的结合能力鉴定所述突变型多肽是否为新抗原或候选新抗原。
[0010]上述方法中,所述新抗原是一种来源于非同义突变的肿瘤特异性抗原。
[0011]所述HLA I类抗原可为所述待测肿瘤患者的任一种HLA I类抗原亚型。
[0012]所述小片段核苷酸的长度范围可为1

49bp。
[0013]上述方法中,根据所述突变型多肽和所述HLA I类抗原的结合能力鉴定所述突变型多肽是否为新抗原可为下述至少一种:
[0014]A3

1)满足条件A的由单核苷酸突变、小片段插入和/或缺失突变和/或RNA编辑突变产生的所述突变型多肽为新抗原或候选为新抗原,不满足所述条件A的由单核苷酸突变、小片段插入和/或缺失突变和/或RNA编辑突变产生的所述突变型多肽为非新抗原或候选为非新抗原;所述条件A为所述突变型多肽和所述HLA I类抗原的结合力分数小于500,且所述突变型多肽和所述HLA I类抗原的结合力分数与所述突变型多肽对应的野生型多肽和所述HLA I类抗原结合力分数的比值小于1;
[0015]A3

2)满足条件B的由RNA基因融合突变产生的所述突变型多肽为新抗原或候选为新抗原,不满足所述条件B的由RNA基因融合突变产生的所述突变型多肽为非新抗原或候选为非新抗原;所述条件B为所述突变型多肽的新抗原结合力分数小于500;
[0016]A3

3)满足条件C的由选择性剪切突变产生的所述突变型多肽为新抗原或候选为新抗原,不满足所述条件C的由选择性剪切突变产生的所述突变型多肽为非新抗原或候选为非新抗原;所述条件C为所述突变型多肽和所述HLA I类抗原的结合力分数小于1000,且所述突变型多肽和所述HLA I类抗原的结合力分数与所述突变对应的野生型多肽和所述HLA I类抗原的结合力分数的比值小于1。
[0017]上述方法中,所述HLA I类抗原可为人类的主要组织相容性复合体(major histocompatibility complex,MHC)I类抗原。所述方法还包括如下步骤:满足所述条件A或B或C的所述同一个突变事件产生的新抗原多肽的数目大于1,选择满足所述条件A或B或C的所述突变型多肽中和所述HLA I类抗原的结合力分数最低的所述突变型多肽为新抗原或候选为新抗原。
[0018]上述方法中,所述A2)中,获得所述肿瘤样本的突变数据可包括如下步骤:
[0019]A2

1)根据所述突变数据中的单核苷酸突变和小片段插入和/或缺失突变是否为非同义突变、所述突变在所述肿瘤样本比对数据和所述血液白细胞样本比对数据中的覆盖度、所述突变在所述肿瘤样本和所述血液白细胞样本的比对数据中的突变频率、所述突变所在的基因在所述转录组比对数据中的表达水平、所述突变所在的基因转录本转录支持水平(TSL)数值和所述突变的人工检查突变位点测序读长的覆盖情况检测结果来筛选单核苷酸突变和小片段插入和/或缺失突变;
[0020]所述覆盖度可为所述比对数据中比对到该位点的测序读长(reads)的数目。
[0021]所述转录支持水平(TSL,Transcript Support Level)表示了基因转录本模型的支持程度,基于UCSC和Ensembl提供的mRNA和EST比对数据进行评估,每个基因分配1

5数字代表支持程度,数值越低代表支持度越高。
[0022]A2

2)根据所述突变数据中的选择性剪切突变是否为罕见变异位点、所述突变对应的所述比对数据中突变位点的覆盖度、所述突变对应的5

/3

剪切位点的频率和所述突变对应的突变型多肽的免疫原性分数来筛选选择性剪切突变;
[0023]A2

3)根据所述突变数据中的RNA编辑突变是否为非同义突变位点、所述突变是否为罕见变异位点、所述突变的人群频率、所述突变在所述肿瘤样本比对数据的覆盖度和突变频率、所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.鉴定或辅助鉴定肿瘤新抗原的方法,其特征在于:所述方法包括如下步骤:A1)获得待测肿瘤患者的测序数据,所述测序数据包括肿瘤样本的全外显子测序数据、肿瘤样本的转录组测序数据和血液白细胞样本的全外显子测序数据;A2)将所述测序数据比对到参考基因组得到比对数据,所述比对数据包括肿瘤样本的全外显子比对数据、肿瘤样本的转录组比对数据和血液白细胞样本的全外显子比对数据,从所述比对数据中获得所述肿瘤样本的突变数据和所述血液白细胞样本的HLA I类抗原;所述突变数据包括所述肿瘤样本的全外显子比对数据中检测到的单核苷酸突变和小片段插入和/或缺失突变,以及所述肿瘤样本的转录组比对数据中检测到的选择性剪切突变、RNA编辑突变和RNA基因融合突变;A3)基于所述突变数据确定所述突变数据对应的突变型多肽,根据所述突变型多肽和所述HLA I类抗原的结合能力鉴定所述突变型多肽是否为新抗原或候选新抗原。2.根据权利要求1所述的方法,其特征在于:根据所述突变型多肽和所述HLAI类抗原的结合能力鉴定所述突变型多肽是否为新抗原为下述至少一种:A3

1)满足条件A的由单核苷酸突变、小片段插入和/或缺失突变和/或RNA编辑突变产生的所述突变型多肽为新抗原或候选为新抗原,不满足所述条件A的由单核苷酸突变、小片段插入和/或缺失突变和/或RNA编辑突变产生的所述突变型多肽为非新抗原或候选为非新抗原;所述条件A为所述突变型多肽和所述HLAI类抗原的结合力分数小于500,且所述突变型多肽和所述HLAI类抗原的结合力分数与所述突变型多肽对应的野生型多肽和所述HLA I类抗原结合力分数的比值小于1;A3

2)满足条件B的由RNA基因融合突变产生的所述突变型多肽为新抗原或候选为新抗原,不满足所述条件B的由RNA基因融合突变产生的所述突变型多肽为非新抗原或候选为非新抗原;所述条件B为所述突变型多肽的新抗原结合力分数小于500;A3

3)满足条件C的由选择性剪切突变产生的所述突变型多肽为新抗原或候选为新抗原,不满足所述条件C的由选择性剪切突变产生的所述突变型多肽为非新抗原或候选为非新抗原;所述条件C为所述突变型多肽和所述HLAI类抗原的结合力分数小于1000,且所述突变型多肽和所述HLAI类抗原的结合力分数与所述突变对应的野生型多肽和所述HLA I类抗原的结合力分数的比值小于1。3.根据权利要求1或2所述的方法,其特征在于:所述A2)中,获得所述肿瘤样本的突变数据包括如下步骤:A2

1)根据所述突变数据中的单核苷酸突变和小片段插入和/或缺失突变是否为非同义突变、所述突变在所述肿瘤样本比对数据和所述血液白细胞样本比对数据中的覆盖度、所述突变在所述肿瘤样本和所述血液白细胞样本的比对数据中的突变频率、所述突变所在的基因在所述转录组数据中的表达水平、所述突变所在的基因转录本转录支持水平数值和所述突变的人工检查突变位点测序读长的覆盖情况检测结果来筛选单核苷酸突变和插入和/或缺失突变;A2

2)根据所述突变数据中的选择性剪切突变是否为罕见变异位点、所述突变对应的所述测序数据中突变位点的覆盖度、所述突变对应的5

/3

剪切位点的频率和所述突变对应的突变型多肽的免疫原性分数来筛选选择性剪切突变;A2

3)根据所述突变数据中的RNA编辑突变是否为非同义突变位点、所述突变是否为罕
见变异位点、所述突变的人群频率、所述突变在所述肿瘤样本比对数据覆盖度和突变频率、所述突变在所述肿瘤样本全外显子的比对数据中是否检测为突变、所述突变所在的基因在所述转录组数据中的表达水平、所述突变所在的基因转录本转录支持水平数值和所述突变的人工检查突变位点测序读长的覆盖情况检测结果来筛选RNA编辑突变;A2

4)根据所述突变数据中的RNA基因融合突变在所述测序数据中对应的融合断点的覆盖度、所述突变在所述肿瘤样本的比对数据中的突变频率、所述突变是否为基因编码区域融合突变和所述突变的人工检查突变位点测序读长的覆盖情况检测结果来筛选RNA基因融合突变。4.鉴定或辅助鉴定肿瘤新抗原的装置,其特征在于:所述装置包括如下模块:B1)测序数据获得模块:用于获得待测肿瘤患者的测序数据,所述测序数据包括肿瘤样本的全外显子测序数据、肿瘤样本的转录组测序数据和血液白细胞样本的全外显子测序数据;B2)突变检测模块:用于将所述测序数据比对到参考基因组得到比对数据...

【专利技术属性】
技术研发人员:马景娇
申请(专利权)人:广州泛生子医学检验实验室有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1