当前位置: 首页 > 专利查询>南开大学专利>正文

一种肿瘤新抗原免疫组库数据可视化分析方法和系统技术方案

技术编号:35485706 阅读:11 留言:0更新日期:2022-11-05 16:38
本发明专利技术涉及免疫组库数据分析技术领域,具体公开了一种肿瘤新抗原免疫组库数据可视化分析方法和系统,所述方法包括:获取肿瘤新抗原免疫组库测序数据;根据所述测序数据提取免疫组库信息,所述免疫组库信息包括CDR3序列;基于所述CDR3序列对现有数据库进行查询,确定肿瘤新抗原免疫组库中经验证的新抗原信息;针对所述免疫组库信息进行可视化分析。本发明专利技术针对肿瘤新抗原免疫组库数据,解决了复杂度高、具有特异性的问题,实现了新抗原信息的筛选和可视化分析。可视化分析。可视化分析。

【技术实现步骤摘要】
一种肿瘤新抗原免疫组库数据可视化分析方法和系统


[0001]本专利技术属于免疫组库数据分析
,尤其涉及一种肿瘤新抗原免疫组库数据可视化分析方法和系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,不必然构成在先技术。
[0003]肿瘤新抗原又称为肿瘤特异性抗原(Tumor

specific antigen,TSA),是指由于肿瘤细胞突变产生的,且只大量表达于肿瘤细胞中而在正常体细胞中几乎不表达的多肽,有比较强的肿瘤特异性和较高的免疫原性。能在激活体内特异性T细胞的杀伤作用的同时避免攻击正常细胞。因此,新抗原被认为是肿瘤治疗的新方向之一,主要运用于肿瘤疫苗和细胞疗法两个方向。
[0004]免疫组库分析结果被广泛用于预测和筛选新抗原的研究中,这些免疫组库分析结果的下游分析往往主要关注于VDJ基因使用情况、组合情况和clonotype的部分特征。
[0005]专利技术人发现,由于肿瘤新抗原组库具有较高多样性、数据信息复杂度高、特异性的特点,现有的免疫组库数据可视化方法应用于肿瘤新抗原相关免疫组库,会遇到下游分析中特异性体现及可视化的专业性较差,进而使得新抗原的预测和筛选时相关参考数据较散乱复杂的困难;因此不能直接应用到肿瘤新抗原免疫组库的分析。

技术实现思路

[0006]为克服上述现有技术的不足,本专利技术提供了一种肿瘤新抗原免疫组库数据可视化分析方法和系统。针对肿瘤新抗原免疫组库数据,解决了复杂度高、具有特异性的问题,实现了新抗原信息的筛选和可视化分析。
[0007]为实现上述目的,本专利技术的一个或多个实施例提供了如下技术方案:
[0008]一种肿瘤新抗原免疫组库数据可视化分析方法,包括以下步骤:
[0009]获取肿瘤新抗原免疫组库测序数据;
[0010]根据所述测序数据提取免疫组库信息,所述免疫组库信息包括CDR3序列;
[0011]基于所述CDR3序列对现有数据库进行查询,确定肿瘤新抗原免疫组库中经验证的新抗原信息;
[0012]针对所述免疫组库信息进行可视化分析。
[0013]进一步地,获取肿瘤新抗原免疫组库测序数据后,还对所述测序数据进行预处理:依次对所述测序数据进行数据过滤、质控分析和UMI分析。
[0014]进一步地,所述UMI分析包括:
[0015]基于UMI标签信息检索得到来自同一mRNA分子的序列;
[0016]对于每一组测序数据,对重复数据、序列数量不足、序列正反链碱基不一致现象进行识别,并进行校正。
[0017]进一步地,根据所述测序数据提取免疫组库信息包括:将测序序列比对到参考数据库中T细胞受体的V、D、J、C参考序列上,再将比对结果利用生物信息拼接得到免疫组库信息。
[0018]进一步地,所述可视化分析包括:VDJ基因使用频率分析、VDJ基因组合分析、CDR3序列长度分析及clonotype分布分析中的一种或多种。
[0019]一个或多个实施例提供了一种肿瘤新抗原免疫组库数据可视化分析系统,包括:
[0020]免疫组库构建模块,用于获取肿瘤新抗原免疫组库测序数据;
[0021]免疫组库信息提取模块,用于根据所述测序数据提取免疫组库信息,所述免疫组库信息包括CDR3序列;
[0022]新抗原信息标注模块,用于基于所述CDR3序列对现有数据库进行查询,确定肿瘤新抗原免疫组库中经验证的新抗原信息;
[0023]可视化分析模块,针对所述免疫组库信息进行可视化分析。
[0024]一个或多个实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述肿瘤新抗原免疫组库数据可视化分析方法。
[0025]一个或多个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述肿瘤新抗原免疫组库数据可视化分析方法。
[0026]以上一个或多个技术方案存在以下有益效果:
[0027]本申请提供了一种针对肿瘤新抗原组库的构建、处理和可视化分析方法,考虑到肿瘤新抗原免疫组库数据的特异性,为准确识别新抗原信息,基于CDR3序列和现有数据库比对来核实,算法复杂度低,准确性高;
[0028]依次通过数据过滤、质控分析和UMI分析,实现了对测序数据的去重和错误校正,保证了数据的正确性,为后续数据分析提供了数据基础。
附图说明
[0029]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0030]图1为本专利技术一个或多个实施例中肿瘤新抗原免疫组库数据可视化分析方法整体流程图;
[0031]图2为本专利技术一个或多个实施例中肿瘤新抗原免疫组库数据可视化分析系统框架图。
具体实施方式
[0032]应该指出,以下详细说明都是示例性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。
[0033]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包
括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0034]在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。
[0035]术语解释:
[0036]免疫组库(Immune Repertoire,IR)是指在指定时间,某个体循环系统中所有功能的多样性T细胞和B细胞的总和。在B细胞和T细胞中发现的受体分别被称为B细胞受体(B Cell Receptor,BCR)和T细胞受体(T Cell Receptor,TCR)。
[0037]BCR和TCR的基本结构和区别:TCR分为两类,多数T细胞的TCR由α和β链组成,少数TCR由γ和δ肽链组成,其肽链可分为V区、C区、跨膜区和胞质区。BCR由两条重链和两条轻链连接而成,其中重链分为可变区(V区)、恒定区(C区)、跨膜区及胞质区;轻链则只有V区和C区。BCR和TCR有三个高变区CDR1、CDR2、CDR3,其中以CDR3变异最大,直定了抗原结合特异性,对于B细胞和T细胞多样性的研究也就集中在CDR3区。
[0038]BCR的CDR3区包括轻链V、J基因片段和重链V、D、J基因片段,TCR的CDR3区包括α链V、J基因片段和和β链V、D、J基因片段。因此,称为VDJ片段。
[0039]每个TCR链包含三个高可变环区(hypervariable loops),称之为互补决定区CDR1

3。CDR1和CDR2由V基因编码,并且对TCR与MHC复合物互作至本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种肿瘤新抗原免疫组库数据可视化分析方法,其特征在于,包括以下步骤:获取肿瘤新抗原免疫组库测序数据;根据所述测序数据提取免疫组库信息,所述免疫组库信息包括CDR3序列;基于所述CDR3序列对现有数据库进行查询,确定肿瘤新抗原免疫组库中经验证的新抗原信息;针对所述免疫组库信息进行可视化分析。2.如权利要求1所述的一种肿瘤新抗原免疫组库数据可视化分析方法,其特征在于,获取肿瘤新抗原免疫组库测序数据后,还对所述测序数据进行预处理:依次对所述测序数据进行数据过滤、质控分析和UMI分析。3.如权利要求2所述的一种肿瘤新抗原免疫组库数据可视化分析方法,其特征在于,所述UMI分析包括:基于UMI标签信息检索得到来自同一mRNA分子的序列;对于每一组测序数据,对重复数据、序列数量不足、序列正反链碱基不一致现象进行识别,并进行校正。4.如权利要求2所述的一种肿瘤新抗原免疫组库数据可视化分析方法,其特征在于,根据所述测序数据提取免疫组库信息包括:将测序序列比对到参考数据库中T细胞受体的V、D、J、C参考序列上,再将比对结果利用生物信息拼接得到免疫组库信息。5.如权利要求2所述的一种肿瘤新抗原免疫组库数据可视化分析方法,其特征在于,所述可视化分析包括:VDJ基因使用频率分析、VDJ基因组合分析、CDR3序列长度分析及clonotype分布分析中的一种或多种。6.一种肿瘤新抗原免疫组...

【专利技术属性】
技术研发人员:刘健向文婷周炜均
申请(专利权)人:南开大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1