一种基于NGS平台的单样本肿瘤体细胞突变判别及TMB检测方法技术

技术编号:33993583 阅读:79 留言:0更新日期:2022-07-02 10:19
本申请涉及生信分析技术领域,具体提供一种基于NGS平台的单样本肿瘤体细胞突变判别方法及相应TMB检测方法,本方法基于NGS平台数据得到的变异检测结果,通过公共数据库和自建国人突变数据库比对,并基于单样本计算的等位基因拷贝数构建统计分布模型的方法,进行单样本肿瘤体细胞突变的判别,以此实现TMB计算。以此实现TMB计算。以此实现TMB计算。

【技术实现步骤摘要】
一种基于NGS平台的单样本肿瘤体细胞突变判别及TMB检测方法


[0001]本申请属于生信分析领域,具体涉及一种基于NGS平台的单样本肿瘤体细胞突变判别方法及其相应的TMB检测方法。

技术介绍

[0002]肿瘤样本的下一代测序(Next Generation Sequencing, NGS)被广泛用于发现生物学上重要的突变,并指导临床进行靶向治疗和用药。这些突变分为体细胞突变(Somatic mutation)和种系突变(Germline mutation),体细胞突变一般仅存在于肿瘤细胞中,不遗传给后代,而种系突变发生在受精卵中,同时存在于肿瘤细胞和正常细胞中,可以遗传给后代。细胞的癌变和肿瘤的发生发展通常与体细胞中基因突变长期积累的结果有关,但不是所有的体细胞突变都会导致细胞癌变。通常每位患者都会检测到大量的突变结果,其中只有少量突变是潜在的肿瘤驱动突变(Driver mutation)或与临床治疗相关的突变,而其余的则是乘客突变(Passenger mutation)或在功能上是良性的种系突变。这些驱动突变通过细胞信号通路和一系列复杂的生物本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于NGS平台的单样本肿瘤体细胞突变判别模型的构建方法,其特征在于,所述方法包括如下步骤:1)肿瘤相关基因捕获:单样本DNA提取后通过杂交捕获肿瘤相关基因区域;2)基因测序:NSG对肿瘤相关基因进行测序;3)数据比对:将NGS测序数据比对到人参考基因组;4)突变检测:基于人参考基因组比对数据分析并获取SNV与INDEL,并计算得到突变的等位基因频率AF;5)拷贝数区段构建:基于正常拷贝数基线和单样本Bin区域测序深度数据划分区段,并计算区段的拷贝数;6)国人种系突变数据库构建:基于中国人群对照样本测序数据进行种系突变检测并计算每个种系突变的等位基因频率及其突变发生频率,完成种系突变数据库构建;7)基因突变注释:使用公共数据库和6)国人种系突变数据库对4)获得的SNV和INDEL突变进行数据库注释,分别确定先验体细胞突变和先验种系突变及其突变等位基因频率AF;8)拷贝数拟合模型构建:基于5)获取的区段的拷贝数及7)获取的先验种系突变和先验体细胞突变构建拷贝数拟合模型,获得肿瘤纯度、倍性以及矫正后的区段拷贝数和次等位基因拷贝数;9)体细胞突变判别模型构建:基于8)获得的肿瘤纯度、倍性以及区段拷贝数和次等位基因拷贝数构建体细胞突变判别模型,获得体细胞突变判别结果;10)体细胞突变过滤:基于7)基因突变注释的结果和9)获得的体细胞突变判别结果,过滤得到可靠的体细胞突变结果。2.根据权利要求1所述的构建方法,其特征在于,所述步骤3)中,所述人参考基因组为hg19基因组。3.根据权利要求1

2任一所述的构建方法,其特征在于,所述步骤5)中,所述拷贝数区段构建具体步骤如下:5a、构建Bin区域:将杂交捕获的目标区域Bed划分成Bin;5b、基线构建:选用正常对照样本获得每个样本的每个Bin的测序深度,建立正常拷贝数基线;5c、区段划分:基于基线数据和肿瘤组织单样本Bin区域测序深度数据,使用循环二元分割CBS算法将每条染色体臂上拷贝数CN相近的Bin区域合并成区段Segment,并取Bin区域CN的中位值作为Segment的CN。4.根据权利要求1

2任一所述的构建方法,其特征在于,所述步骤6)中,所述中国人群种系突变数据库的具体构建步骤如下:6a、基于中国人群正常对照样本的NGS测序数据,进行种系突变的检测;6b、基于上述6a中获得的种系突变,过滤低覆盖深度和低支持数的位点,获得自建中国人群种系突变集;6c、基于上述6b种系突变集计算每个种系突变的等位基因频率及其在该人群中突变发生频率,完成自建种系突变数据库构建。5.根据权利要求1

2任一所述的构建方法,其特征在于,所述步骤7)中,所述突变注释的具体步骤包括:
7a、使用COSMIC数据库对所述4)获得的SNV和INDEL突变进行注释,获得COSMIC突变计数,通过COSMIC突变计数来确定先验体细胞突变;7b、使用dbSNP、gnomAD、ExAC和1000G数据库对所述4)获得的SNV和INDEL突变进行注释,获得公共人群数据库中突变的人群频率,通过公共人群数据库突变的人群频率来确定先验种系突变;7c、使用所述6)构建的中国人群突变数据库对所述4)获得的SNV和INDEL突变进一步注释得到中国人群特有的先验种系突变。6.根据权利要求5所述的构建方法,其特征在于,所述步骤8)中,所述拷贝数拟合模型的具体构建步骤如下:8a、基于所述5)获取的Segment的CN值以及所述7)获取的先验种系突变和先验体细胞突变及其突变等位基因频率AF,对CN和AF作二维聚类得到CN和AF均相近的多个Segment;8b、通过Grid

Search拟合所有可能的拷贝数CN、肿瘤纯度Purity、肿瘤倍性Ploidy和次等位基因拷贝...

【专利技术属性】
技术研发人员:叶雷邓望龙雷燕萍秦勇卜范峰李诗濛任用
申请(专利权)人:江苏先声医疗器械有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1