基于基因融合事件的肿瘤新生抗原预测方法及其应用技术

技术编号:27022723 阅读:21 留言:0更新日期:2021-01-12 11:05
本发明专利技术公开了基于基因融合事件的肿瘤新生抗原预测方法及其应用。本发明专利技术的预测方法以高通量二代测序原始数据为基础进行融合基因和MHC的检测,根据科学构建的打分函数进行打分,筛选出可信度高的融合基因肿瘤新生抗原。本发明专利技术的预测方法能显著提高肿瘤新生抗原的筛选效率和准确度、降低结果的假阳性率,同时能应用于多癌种,不需要区分癌种即可实现对融合基因肿瘤新生抗原的预测。

【技术实现步骤摘要】
基于基因融合事件的肿瘤新生抗原预测方法及其应用
本专利技术属于生物信息学技术和肿瘤免疫治疗领域,具体而言,本专利技术涉及一种基于基因融合事件的肿瘤新生抗原预测方法及其应用。
技术介绍
目前恶性肿瘤的治疗仍然面临诸多困境,亟需要新的治疗策略。近年来,肿瘤的免疫治疗发展迅速,受到越来越多的关注。肿瘤的免疫治疗是指利用机体自身的免疫系统来清除肿瘤细胞,包括抗体治疗、细胞治疗、肿瘤疫苗等。在肿瘤的发生发展过程中,经常伴有多个基因的融合基因断点,新生抗原指的是由肿瘤细胞突变所产生的表位特异性抗原,只在肿瘤细胞上表达,不会导致机体的免疫耐受。已有较多的研究显示以新生抗原为靶标的免疫治疗,在一些癌症患者上已经取得了不错的临床效果。因此筛选鉴定出肿瘤特异性新生抗原是改善肿瘤免疫治疗效果的关键技术之一,也是实现个体化免疫治疗的基础。基因融合是指两个或多个正常状态下相互独立的基因,部分或全部基因区域连接在一起所形成的杂合基因。染色体的易位、倒置、插入、缺失等作用都有可能发生基因的融合。基因融合的发生跟肿瘤等疾病的发生发展密切相关,目前发现的肿瘤中普遍存在基因融合事件。1960年Nowell和Hungerford在慢性粒细胞白血病中发现了异常染色体结构(费城染色体)。1980年,首次研究揭示了BCR和ABL1基因融合事件在Burkitt淋巴瘤中的致病性作用。基因融合是肿瘤细胞中一种重要的变异形式,会对细胞功能特性产生重大影响。基于肿瘤新生抗原的肿瘤免疫疗法近几年得到医学界广泛关注,最近的研究和临床结果也显示肿瘤新抗原免疫疗法具有广阔的应用前景。肿瘤新生抗原的获得需要以肿瘤基因变异产生的新氨基酸或蛋白质序列为基础。基因的融合能够产生大量的具有活性的异常蛋白质序列,从而导致肿瘤的生成,因此融合基因是肿瘤新生抗原发掘的重点对象。然而针对融合基因肿瘤新生抗原的全基因组高通量筛选方法仍是医学界难点,鉴于此,本申请开发了一种高效准确筛选融合基因肿瘤新生抗原的高通量方法,可以显著提高融合基因肿瘤新生抗原的筛选效率和准确率。
技术实现思路
基于此,针对上述现有技术存在的问题,本专利技术的目的在于提供一种基于基因融合事件的肿瘤新生抗原预测方法,在本专利技术的预测方法中,创造性地利用基于融合基因肿瘤新生抗原特征值的打分函数计算新生抗原的得分值,按照分值高低进行排序,排序在前的新生抗原可信度高。本专利技术的方法包括多步骤质控和综合分析,极大了提高了结果的准确度和特异性抗原的验证率,并且大大缩短了实验验证的工作量,为后续抗肿瘤疫苗的设计、抗肿瘤药物的开发、肿瘤治疗响应生物标志物的评估奠定了基础。本专利技术的上述目的通过以下技术方案得以实现:本专利技术的第一方面提供了一种评估融合基因肿瘤新生抗原可信度的打分函数,其特征在于,所述打分函数包括如下特征值:支持融合基因的JunctionReads数量、支持融合基因的SpanningFragments数量、融合事件上游基因单碱基平均覆盖度、融合事件下游基因单碱基平均覆盖度。进一步,在本专利技术的具体实施方案中,所述打分函数如下所示:Score=-lg(IC/500)+[(JunctionReadCount+SpanningFragCount)*2/(upstreamcov+downstreamcov)];其中,IC=median(IC50[i:i+n]),表示对多种软件亲和力值取的中位数;JunctionReadCount表示支持融合基因的JunctionReads数量;SpanningFragCount表示支持融合基因的SpanningFragments数量;upstreamcov指融合事件上游基因单碱基平均覆盖度;downstreamcov指融合事件下游基因单碱基平均覆盖度。进一步,所述多种软件包括NetMHCpan、NetMHCIIpan、NetMHC、NetMHCII。本专利技术的第二方面提供了一种融合基因肿瘤新生抗原的预测方法。进一步,所述预测方法包括获得以下特征值:肿瘤组织RNA-bam文件、肿瘤组织中融合基因、基因表达量、突变多肽亲和力预测值。进一步,所述预测方法包括本专利技术的第一方面所述的打分函数获得的融合基因肿瘤新生抗原的可信度排序。进一步,所述预测方法包括如下步骤:(1)获取肿瘤组织样本和RNA-seq测序数据;(2)肿瘤组织的融合基因检测;(3)计算融合基因表达量;(4)融合基因注释;(5)融合多肽提取;(6)MHC分子类型鉴定;(7)HLA亲和力预测;(8)利用本专利技术的第一方面所述的打分函数获得融合基因肿瘤新生抗原可信度的打分排序。进一步,所述预测方法步骤(1)包括:获取任何癌种肿瘤患者的肿瘤组织,通过illumina高通量测序平台完成肿瘤组织的RNA-seq测序。进一步,上述测序方法获得的原始数据需要通过质量控制、参考基因组比对、bam文件处理。其中,质量控制:RNA测序原始fastq数据通过FastQC软件进行质量控制得到质控之后的数据AO.clean.fq.gz;参考基因组比对:质控之后的RNA使用hisat2软件进行参考基因组比对,得到肿瘤RNA数据的bam文件;bam文件处理:比对之后的bam文件需要进一步处理,RNA数据bam文件进行排序和质量控制处理得到处理之后的RNA-bam文件。优选地,使用RSEM对融合基因表达量进行计算;优选地,使用star-fusion软件检测肿瘤组织中的融合基因;优选地,使用AGFusion对检测得到的融合基因进行注释;优选地,多肽提取使用滑窗模式,具体的分别以8-15个氨基酸长度的滑窗,在突变位点上下游位置进行逐步滑窗提取包含突变氨基酸的多肽序列,滑窗的步移长度为1;优选地,使用seq2HLA进行MHCI和MHCII分子类型的鉴定;优选地,使用NetMHCpan、NetMHCIIpan、NetMHC、NetMHCII多种软件进行预测,每种方法得到对应的亲和力预测结果IC50值。进一步,所述预测方法步骤(8)中可信度的打分排序是基于本专利技术的第一方面所述的打分函数获得的融合基因肿瘤新生抗原的得分值所获得的,按照得分值的高低由高到低进行排序,分值高者代表其为融合基因肿瘤新生抗原的可信度高。本专利技术的第三方面提供了本专利技术第一方面所述的打分函数在预测融合基因肿瘤新生抗原中的应用。本专利技术的第四方面提供了一种融合基因肿瘤新生抗原。进一步,所述新生抗原选自以下组中的一种或多种:RBP4_FRA10AC1、AHNAK_RPS11、SMURF1_KPNA7、STRN3_HECTD1。本专利技术的第五方面提供了一种本专利技术第四方面所述新生抗原的筛选方法。进一步,所述筛选方法包括本专利技术第二方面所述的预测方法。进一步,所述筛选方法还包括对预测得到的结果进行验证。优选地,所述对预测得到的结果进行的验证包括融合基因验证和免疫学验证;优选地,所本文档来自技高网
...

【技术保护点】
1.一种评估融合基因肿瘤新生抗原可信度的打分函数,其特征在于,所述打分函数包括如下特征值:支持融合基因的Junction Reads数量、支持融合基因的SpanningFragments数量、融合事件上游基因单碱基平均覆盖度、融合事件下游基因单碱基平均覆盖度。/n

【技术特征摘要】
1.一种评估融合基因肿瘤新生抗原可信度的打分函数,其特征在于,所述打分函数包括如下特征值:支持融合基因的JunctionReads数量、支持融合基因的SpanningFragments数量、融合事件上游基因单碱基平均覆盖度、融合事件下游基因单碱基平均覆盖度。


2.根据权利要求1所述的打分函数,其特征在于,所述打分函数如下所示,Score=-lg(IC/500)+[(JunctionReadCount+SpanningFragCount)*2/(upstreamcov+downstreamcov)];
其中,IC=median(IC50[i:i+n]),表示对多种软件亲和力值取的中位数;JunctionReadCount表示支持融合基因的JunctionReads数量;SpanningFragCount表示支持融合基因的SpanningFragments数量;upstreamcov指融合事件上游基因单碱基平均覆盖度;downstreamcov指融合事件下游基因单碱基平均覆盖度;
优选地,多种软件包括NetMHCpan、NetMHCIIpan、NetMHC、NetMHCII。


3.一种融合基因肿瘤新生抗原的预测方法,其特征在于,所述预测方法包括利用权利要求1或2所述的打分函数获得的融合基因肿瘤新生抗原的可信度排序。


4.根据权利要求3所述的预测方法,其特征在于,所述预测方法包括如下步骤:
(1)获取肿瘤组织样本和RNA-seq测序数据;
(2)肿瘤组织的融合基因检测;
(3)计算融合基因表达量;
(4)融合基因注释;

【专利技术属性】
技术研发人员:程旭东管旭东
申请(专利权)人:中生康元生物科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1