基于捕获测序技术的肿瘤突变负荷检测装置及方法制造方法及图纸

技术编号:26585933 阅读:34 留言:0更新日期:2020-12-04 21:05
本发明专利技术提供了一种基于捕获测序技术的肿瘤突变负荷检测装置及方法,其中,装置中包括:panel设计模块,用于在基因组中均匀增加人群SNP位点,筛选与WES一致性最高的基因区域;数据获取模块,用于获取目标对象的组织和血浆样本,获取其测序数据;比对模块,用于将测序数据与参考基因组比对,获取变异数据结果;体细胞突变分析模块,用于对变异数据结果进行体细胞分析得到体细胞突变结果;过滤模块,用于去除体细胞突变结果中的非真实突变位点;计算模块,用于计算肿瘤突变负荷TMB。其在充分提高设计panel与WES的TMB一致性的前提下,全面提高各个环节的准确性,尤其提高panel设计的针对性、准确性和可靠性;提高不同深度、不同纯度、不同肿瘤占比的特殊组织或血浆样本的检测准确性。

【技术实现步骤摘要】
基于捕获测序技术的肿瘤突变负荷检测装置及方法
本专利技术涉及生物医学
,尤其涉及一种肿瘤突变负荷检测装置及方法。
技术介绍
肿瘤突变负荷,英文全称TumorMutationBurden(TMB)或TumorMutationLoad(TML),是一种可定量的生物标志物,用来反映肿瘤细胞中含有的突变数目,通常用肿瘤细胞基因组编码区的每百万碱基突变数来衡量。现阶段对TMB检测主要依赖于NGS技术,金标准是通过WES测序(全外显子组测序技术)对≥30Mb的CDS区域(蛋白质编码区,外显子)序列中的突变数量进行统计分析与计算。然而全外显子检测存在价格昂贵、检测深度低、对于低覆盖的位点可能漏检等技术问题,因此研究者们积极探索基于捕获测序(panel)的方法对TMB进行检测,以有效降低测序成本,但是基于panel方法检测TMB时准确性和可靠性都存在较大挑战。目前,依然存在panel与全外显子测序一致性不够高、无对照样本检测结果时不准确、仅能单独检测肿瘤组织或者肿瘤患者血浆肿瘤突变负荷、对不同的测序深度的样本针对性差、对不同肿瘤占比的样本针对性差等缺点。
技术实现思路
针对上述问题,本专利技术提供了一种基于捕获测序技术的肿瘤突变负荷检测装置及方法,有效解决现有检测技术中存在的panel与全外显子测序一致性不够高、仅能单独检测肿瘤组织或者肿瘤患者血浆肿瘤突变负荷等缺点。本专利技术提供的技术方案如下:一种基于捕获测序技术的肿瘤突变负荷检测装置,包括:panel设计模块,用于在基因组中均匀增加人群SNP位点,并筛选与全外显子测序(WES)一致性最高的基因区域;数据获取模块,用于获取目标对象的组织和血浆样本,并基于所述panel设计模块筛选得到的基因区域获取所述组织和血浆样本的测序数据;比对模块,用于将所述数据获取模块获取的测序数据与参考基因组进行比对,获取变异数据结果;体细胞突变分析模块,用于对所述比对模块获取的变异数据结果进行体细胞分析得到体细胞突变结果;过滤模块,用于去除体细胞突变分析模块分析得到的体细胞突变结果中的非真实突变位点得到真实突变位点;及计算模块,用于根据所述过滤模块得到的体细胞真实突变位点数量计算肿瘤突变负荷TMB。本专利技术还提供了一种基于捕获测序技术的肿瘤突变负荷检测方法,包括:在基因组中均匀增加人群SNP位点,并筛选与全外显子测序一致性最高的基因区域;获取目标对象的组织和血浆样本,并基于筛选得到的基因区域获取所述组织和血浆样本的测序数据;将所述测序数据与参考基因组进行比对,获取变异数据结果;对所述变异数据结果进行体细胞分析得到体细胞突变结果;去除所述体细胞突变结果中的非真实突变位点得到真实突变位点;根据所述体细胞真实突变位点数量计算肿瘤突变负荷TMB。本专利技术还提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时实现上述基于捕获测序技术的肿瘤突变负荷检测方法的步骤。本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于捕获测序技术的肿瘤突变负荷检测方法的步骤。本专利技术提供的基于捕获测序技术的肿瘤突变负荷检测装置及方法,在充分提高设计panel与WES的TMB一致性的前提下,提高panel设计的针对性、准确性和可靠性,尤其提高对于无对照样本结果的检测准确性,且能够同时检测肿瘤组织和肿瘤患者血浆的肿瘤突变负荷。具体,在panel设计方面通过均匀增加足够的人群SNP位点来更准确地扣除胚系突变并使用基于机器学习新区间的筛选方法挑选与WES一致性最高的基因区域组合;另外,针对不同的深度测序、不同的样本类型和不同的肿瘤占比区间构建特异性基线,以此提高检测的适应性和准确性;再有,通过扣除序列特异性错误、测序或者实验背景噪音、突变黑名单和PoN位点等,得到可信度高的体细胞变异信息;最后,能够对组织样本和血浆样本的测序数据同时进行检测处理,实现了对目标对象的组织和血浆样本的肿瘤突变负荷的同时检测且准确性较高。附图说明下面将以明确易懂的方式,结合附图说明优选实施方式,对上述特性、技术特征、优点及其实现方式予以进一步说明。图1为本专利技术中基于捕获测序技术的肿瘤突变负荷检测装置结构示意图;图2为本专利技术中基于捕获测序技术的肿瘤突变负荷检测方法流程示意图;图3为本专利技术一实例中肿瘤突变负荷检测流程图;图4为本专利技术一实例中全外显子和panel捕获得到的肿瘤突变负荷一致性结果示意图;图5为本专利技术中终端设备结构示意图。附图标记:100-肿瘤突变负荷检测装置,110-panel设计模块,120-数据获取模块,130-比对模块,140-体细胞突变分析模块,150-过滤模块,160-计算模块。具体实施方式为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对照附图说明本专利技术的具体实施方式。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。本专利技术的第一实施例,如图1所示,一种基于捕获测序技术的肿瘤突变负荷检测装置100,包括:panel设计模块110,用于在基因组中均匀增加人群SNP位点,并筛选与全外显子测序一致性最高的基因区域;数据获取模块120,用于获取目标对象的组织和血浆样本,并基于panel设计模块110筛选得到的基因区域获取组织和血浆样本的测序数据;比对模块130,用于将数据获取模块120获取的测序数据与参考基因组进行比对,获取变异数据结果;体细胞突变分析模块140,用于对比对模块130获取的变异数据结果进行体细胞分析得到体细胞突变结果;过滤模块150,用于去除体细胞突变分析模块140分析得到的体细胞突变结果中的非真实突变位点得到真实突变位点;及计算模块160,用于根据过滤模块150得到的体细胞真实突变位点数量计算肿瘤突变负荷TMB。在本实施例中,panel设计模块110用于筛选与WES一致性最高的基因区域组成panel,包括均匀位点设计单元和区间筛选单元,其中,均匀位点设计单元用于根据第一预设规则对基因组设计探针的区域进行筛选后均匀增加由第二预设规则筛选后得到的人群SNP位点,以准确扣除胚系突变。区间筛选单元用于根据机器学习外显子exon的方法筛选得到与全外显子测序一致性最高的基因区域。由于现实情况,很多时候不能得到患者的血细胞数据,而TMB只考虑体细胞突变,所以多数TMB方法是在没有胚系对照数据的情况下,因此,为了提高使用insilico的算法去除可能的胚系突变过程中的准确度,本实施例在panel设计阶段均匀增加足够的人群SNP位点。具体来说,设计包括以下步骤:1.1对基因组设计探针的区域进行筛选,所筛选的条件包括:去掉基因组上的ga本文档来自技高网...

【技术保护点】
1.一种基于捕获测序技术的肿瘤突变负荷检测装置,其特征在于,包括:/npanel设计模块,用于在基因组中均匀增加人群SNP位点,并筛选与全外显子测序一致性最高的基因区域;/n数据获取模块,用于获取目标对象的组织和血浆样本,并基于所述panel设计模块筛选得到的基因区域获取所述组织和血浆样本的测序数据;/n比对模块,用于将所述数据获取模块获取的测序数据与参考基因组进行比对,获取变异数据结果;/n体细胞突变分析模块,用于对所述比对模块获取的变异数据结果进行体细胞分析得到体细胞突变结果;/n过滤模块,用于去除体细胞突变分析模块分析得到的体细胞突变结果中的非真实突变位点得到真实突变位点;及/n计算模块,用于根据所述过滤模块得到的体细胞真实突变位点数量计算肿瘤突变负荷TMB。/n

【技术特征摘要】
1.一种基于捕获测序技术的肿瘤突变负荷检测装置,其特征在于,包括:
panel设计模块,用于在基因组中均匀增加人群SNP位点,并筛选与全外显子测序一致性最高的基因区域;
数据获取模块,用于获取目标对象的组织和血浆样本,并基于所述panel设计模块筛选得到的基因区域获取所述组织和血浆样本的测序数据;
比对模块,用于将所述数据获取模块获取的测序数据与参考基因组进行比对,获取变异数据结果;
体细胞突变分析模块,用于对所述比对模块获取的变异数据结果进行体细胞分析得到体细胞突变结果;
过滤模块,用于去除体细胞突变分析模块分析得到的体细胞突变结果中的非真实突变位点得到真实突变位点;及
计算模块,用于根据所述过滤模块得到的体细胞真实突变位点数量计算肿瘤突变负荷TMB。


2.如权利要求1所述的肿瘤突变负荷检测装置,其特征在于,
所述panel设计模块包括均匀位点设计单元和区间筛选单元,其中,所述均匀位点设计单元用于根据第一预设规则对基因组设计探针的区域进行筛选后均匀增加由第二预设规则筛选后得到的人群SNP位点;所述区间筛选单元用于根据机器学习外显子exon的方法筛选得到与全外显子测序一致性最高的基因区域;
所述第一预设规则包括:去除基因组中gap及mappability质量低于40的区域;和/或将基因组按照预设大小的窗口和步长分割后,去除GC含量高于60%及低于30%的区域;和/或去除包含预设数量以上亚洲人群杂合率大于预设阈值的位点相应的预设长度区域;
所述第二预设规则包括:亚洲人群的杂合率大于预设阈值的SNP位点;和/或满足哈温平衡的SNP位点;和/或将SNP位点左右延长预设大小后的区域与参考基因组比对,并统计每个区域可比对到基因组位置的数量,将数量大于预设阈值的区域去除。


3.如权利要求1所述的肿瘤突变负荷检测装置,其特征在于,
所述数据获取模块包括获取单元和质控单元,其中,获取单元用于获取目标对象的组织和血浆样本的原始数据;质控单元用于分别对所述组织和血浆样本的原始数据进行质控处理,得到所述测序数据;和/或
所述比对模块包括第一比对单元和第二比对单元,其中,所述第一比对单元用于将所述测序数据与参考基因组进行比对,得到比对结果文件;所述第二比对单元,用于对所述比对结果文件进行去冗余及针对InDel区域进行重新比对,得到所述变异数据结果。


4.如权利要求1或2或3所述的肿瘤突变负荷检测装置,其特征在于,所述肿瘤突变负荷检测装置还包括特异性基线构建模块,用于针对不同的测序深度区间、样本类型和肿瘤占比区间分别构建不同的测序深度基线和肿瘤占比基线。


5.如权利要求4所述的肿瘤突变负荷检测装置,其特征在于,
所述体细胞突变分析模块使用VarDict或MuTect2对所述比对模块获取的变异数据结果进行体细胞分析得到体细胞突变结果;或
所述体细胞突变分析模块根据所述组织和血浆样本的测序深度与样本类型,选择相应的测序深度基线,基于insilico胚系扣除算法得到体细胞突变结果。


6.如权利要求4所述的肿瘤突变负荷检测装置,其特征在于,
所述过滤模块用于针对体细胞突变分析模块分析得到的体细胞突变结果的注释结果进行过滤去除其中的非真实突变位点得到真实突变位点;
过滤规则包括:根据样本类型去除insilico胚系突变;和/或过滤注释频率小于5%且在人群数据库中出现频率大于0.2%的位点;和/或过滤已知的肿瘤驱动基因突变;和/或过滤突变位点表现为人群频率高的非胚系位点;和/或根据预先构建的FFPE样本特征SSE的噪音基线过滤repeat区间或是同源区间比对产生的假阳性位点;和/或过滤频率小于PoN位点均值加5倍标准差的PoN位点;和/或过滤预设黑名单位点,人群出现频率大于30%或者在FFPE样本、血浆样本和血细胞样本中的两个组织类型里面人群频率大于20%的位点;和/或根据测序深度基线筛选符合深度要求的突变,根据肿瘤占比基线得到符合肿瘤占比的突变。


7.一种基于捕获测序技术的肿瘤突变负荷检测方法,其特征在于,包括:
在基因组中均匀增加人群SNP位点,并筛选与全外显子测序一致性最高的基因区域;
获取目标对象的组织和血浆样本,并基于筛选得到的基因区域获取所述组织和血浆样本的测序数据;
将所述测序数据与参考基因组进行比对,获取变异数据结果;
对所述变异数据结果进行体细胞分析得到体细胞突变结果;
去除所述体细胞突变结果中的非真实突变位点得到真...

【专利技术属性】
技术研发人员:石贺欣于佳宁洪媛媛陈敏浚杨滢侯军艳吕红陈维之郑杉何骥杜波
申请(专利权)人:臻悦生物科技江苏有限公司臻和北京生物科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1