【技术实现步骤摘要】
一种基于深度学习模型的肿瘤新抗原预测方法及新生抗原预测系统
[0001]本专利技术属于生物医药领域,涉及一种肿瘤新抗原的预测方法,尤其涉及一种基于深 度学习网络的肿瘤新抗原预测方法、预测系统、装置及其应用。
技术介绍
[0002]当今,肿瘤免疫已经跻身最火热的赛道。然而,从临床疗效看,肿瘤免疫道阻且长。 以PD-1/PD-L1为例,仅20%-30%的肿瘤患者能够从中受益;而CAR-T则只对血液肿瘤, 尤其是B淋巴细胞瘤有效,并且副作用严重。大多数肿瘤患者尚无有效的治疗方案,肿 瘤免疫治疗还需要探索更多可能性,个性化肿瘤疫苗便是其中之一。个性化肿瘤疫苗的 研发是一项将基因精准检测和肿瘤免疫治疗相结合的整合型技术。与CAR-T疗法围绕现 存的少量靶点寻找治疗方案不同,个性化肿瘤疫苗会从肿瘤突变基因中预测出新抗原, 并将合成新抗原回输到患者血液中,激发自体免疫系统对肿瘤细胞的攻击,为解决临床 中对无法进行手术根治、放化疗均无效且无靶向用药的患者提供了一种新的治疗方式。
[0003]个性化肿瘤疫苗的技术方案包括1)采集肿瘤患者的外周血,癌组织样本,2)外周 血做全外显子测序,肿瘤组织一式两份,一份做全外显子测序,一份做转录组测序,3)根据测序结果,预测潜在的新生抗原多肽,4)新生抗原多肽合成,5)高效体外系统评 测抗原多肽安全性,6)临床患者皮下注射使用。
[0004]预测新生抗原是个性化疫苗治疗方案中最为关键的一步,如果无法准确预测新生抗 原,后续基于预测结果的治疗效果就会受到影响。肿瘤一般含有几百甚至几千 ...
【技术保护点】
【技术特征摘要】
1.一种预测新生抗原的方法,其特征在于,该方法包括以下步骤:采集待预测新生抗原的样本,所述的样本包括肿瘤样本和源自同一个体的正常样本;分别提取所述的肿瘤样本和正常样本的DNA,进行全外显子测序,并且根据正常样本的DNA的全外显子测序数据进行HLA分型分析;将所述的肿瘤样本和正常样本的全外显子测序数据与人类参考基因组进行比对拼接,分析肿瘤-正常成对样本的体细胞突变,获得突变肽链序列及其旁侧序列;提取所述的肿瘤样本的RNA,进行转录组测序,将测序结果转换为TPM值,获得RNA表达水平数据;将所获得的HLA分型、突变肽链序列及其旁侧序列、TPM值呈递给深度学习的神经网络训练的预测模型进行预测;所述的深度学习的神经网络包括共享神经网络和各型HLA的神经网络;对肽链序列根据其结合的HLA分型,构建各型HLA的神经网络,旁侧序列和TPM值呈递给共享神经网络;比对共享神经网络和各型HLA的神经网络,分别计算出肽链递呈到每种HLA分型的可能性,再综合计算肽链总的呈递的可能,获得预测的新生抗原。2.如权利要求1所述的方法,其特征在于,所述的训练数据中的肽链序列是对中国人群高频HLA亚型细胞系进行蛋白免疫沉淀和质谱联用,获得与特定HLA分子结合的肽链序列。3.如权利要求1所述的方法,其特征在于,所述的旁侧序列的获得方法为:在肽链序列中选取8-11个氨基酸长度的肽链,并将氨基酸长度小于11的肽链填充到11个,截取其左右各5个氨基酸作为旁侧序列。4.如权利要求1所述的方法,其特征在于,所述的深度学习模型构建方法为:利用训练数据导入构建的神经网络,采用深度学习的算法训练模型。5.如权利要求4所述的方法,其特征在于,所述的神经网络通过接收训练数据并不断优化,所述的训练数据的获得方法为:对中国人群高频HLA亚型细胞系进行转录组测序、蛋白免疫沉淀和质谱联用分析;将所述的HLA分型、突变肽链序列、旁侧序列和转录组测序获得的TPM值、从公共数据库中采集的质谱数据输入神经网络;对质谱获得的肽链做阳性标记,把在蛋白质公共数据库里的参考蛋白组中未在质谱数据中出现的肽链做阴性标记,并将数据分为训练数据、验证数据和测试数据。6.如权利要求1-5中任意一项所述的方法,其特征在于,所述的获得TPM值是对测序数据进行read counts计数,再转换TPM值;所述的TPM值转换方法如下:RPK=read_count/transcript_length*1000
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(I);TPM=RPK/sum(all_RPK)*1000000
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(II)。7.一种新生抗原预测系统,其特征在于,所述的系统包括样本收集装置、转录组测序数据分析模块、全外显子测序数据分析模块、新生抗原预测装置;样本收集装置与转录组测序数据分析模块...
【专利技术属性】
技术研发人员:李锐,雷俊卿,虞韩川枝,秦汉楠,苏小平,李伟迎,
申请(专利权)人:格源致善上海生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。