一种用于区分体细胞突变和种系突变的方法技术

技术编号:29749926 阅读:28 留言:0更新日期:2021-08-20 21:02
本申请涉及用于区分体细胞突变和种系突变的方法:获取源自受试者样本的至少一个突变位点;获取野生型支持片段和突变型支持片段;所述野生型支持片段为包含野生型碱基序列的cfDNA片段,所述突变型支持片段为包含突变型碱基序列的cfDNA片段,所述野生型碱基序列与人类参考基因组在所述突变位点的对应位置处的核苷酸序列相比序列相同,所述突变型碱基序列则不同;获取至少一个长度的所述野生型支持片段的数量,获取对应的相同长度的所述突变型支持片段的数量,计算相同长度的两者与对应支持片段的总数的比值的差值;将该差值作为区分的指标。提供用以从cfDNA中识别ctDNA的方法及装置。该方法用于肿瘤家系管理、TMB检测。

【技术实现步骤摘要】
一种用于区分体细胞突变和种系突变的方法
本申请涉及生物信息领域,具体的涉及一种用于区分体细胞突变和种系突变的方法。
技术介绍
在肿瘤患者的血浆中,广泛存在cfDNA,其中包含少量肿瘤特异性ctDNA存在。这些ctDNA在细胞衰老和凋亡过程中与其他正常的cfDNA在剪切方式上存在差异。换言之,血浆中游离DNA中ctDNA和其他常规cfDNA片段化分布模式的不同。因此,这种分布模式的差异可以作为ctDNA识别的标志物。体细胞突变是在人类生命周期中逐渐累积的一种区别于种系突变(也称为:胚系突变)的非遗传变异。体细胞突变由于与肿瘤发生的分子信号通路密切相关,而作为肿瘤形成的重要标志。种系突变是发生在生殖细胞可遗传的突变,对研究遗传性疾病和基因组进化具有重要意义。在《肿瘤突变负荷检测及临床应用中国专家共识(2020年版)》中提到:在肿瘤突变负荷(TMB)算法的标准化要求中,核心要素是对能影响蛋白质编码的体细胞突变的探测及计算。由于目前公开的人群数据库均已欧美人群为主,不适用于中国人群TMB检测,因此建议TMB的体细胞突变确定应使用对照样本(外周血或癌旁组织)去除患者的胚系变异,或使用中国人群大样本遗传性突变数据库构建背景库过滤胚系变异。因此,正确区分细胞中的突变类型和来源对肿瘤的分类,治疗,预后等具有重要作用。然而,当前进行体细胞突变判别方法主要依赖于对配对样本的检测,配对样本平行测序可以很准确地判断出突变的来源,但是对于初次没有收取配对材料的样本,重新收取配对样本往往非常困难。另外,与肿瘤样本进行同深度的高通量测序会造成经费和计算资源的大量消耗。同时该方法对样本收集的完整性和计算存储资源有很高的要求,并且会显著增加突变检测成本。另外,突变频率过滤和突变注释数据库比对的方法在准确性上仍然无法满足要求。
技术实现思路
本申请提供了一种用于区分体细胞突变和种系突变的方法,一种用于在cfDNA中识别ctDNA的方法,以及所述方法对应的装置以及应用。本申请所述的方法和/或装置,具有以下特征中的至少一种:(1)仅需要使用单一样本,即来源于受试者的样本;(2)适用范围广,可以适用于不同癌症种类中体细胞突变的识别,和/或ctDNA的识别;(3)高灵敏度;(4)高准确性,例如可以同时在突变数据库、人群频率、突变丰度的基础上,使多个因素共同参与本申请所述的方法而提高区分结果的可靠性;(5)易于实施,对突变位点的数量没有限制;(6)操作快捷,例如可以以受试者的血浆作为样本;(7)引入了新的区分维度。一方面,本申请提供了一种用于区分体细胞突变和种系突变的方法,其包括以下步骤:(1)获取源自受试者样本的至少一个突变位点;其中,所述突变位点通过基因测序的方法获得,(2)针对每一个所述突变位点,获取野生型支持片段和突变型支持片段;其中,所述野生型支持片段为包含野生型碱基序列的cfDNA片段,所述突变型支持片段为包含突变型碱基序列的cfDNA片段,其中,所述野生型碱基序列为,与参考基因组在所述突变位点的对应位置处的核苷酸序列相比,相同的序列,其中,所述突变型碱基序列为,与参考基因组在所述突变位点的对应位置处的核苷酸序列相比,不同的序列,其中所述参考基因组为所述基因测序中的人类参考基因组;(3)针对每一个突变位点,获取至少一个长度的所述野生型支持片段的数量,获取对应的相同长度的所述突变型支持片段的数量,计算该长度的所述野生型支持片段的数量与所述野生型支持片段的总数量的比值WC;计算相同长度的所述突变型支持片段的数量与所述突变型支持片段的总数量的比值MC;计算相同长度下所述比值WC与所述比值MC的差值;(4)将所述差值作为区分所述突变位点为体细胞突变还是种系突变的指标。一方面,本申请提供了一种用于在cfDNA中识别ctDNA的方法,其包括以下步骤:(1)获取源自受试者样本的至少一个突变位点;其中,所述突变位点通过基因测序的方法获得,(2)针对每一个所述突变位点,获取野生型支持片段和突变型支持片段;其中,所述野生型支持片段为包含野生型碱基序列的cfDNA片段,所述突变型支持片段为包含突变型碱基序列的cfDNA片段,其中,所述野生型碱基序列为,与参考基因组在所述突变位点的对应位置处的核苷酸序列相比,相同的序列,其中,所述突变型碱基序列为,与参考基因组在所述突变位点的对应位置处的核苷酸序列相比,不同的序列,其中所述参考基因组为所述基因测序中的人类参考基因组;(3)针对每一个突变位点,获取至少一个长度的所述野生型支持片段的数量,获取对应的相同长度的所述突变型支持片段的数量,计算该长度的所述野生型支持片段的数量与所述野生型支持片段的总数量的比值WC;计算相同长度的所述突变型支持片段的数量与所述突变型支持片段的总数量的比值MC;计算相同长度下所述比值WC与所述比值MC的差值;(4)将所述差值作为识别所述突变位点是否位于ctDNA的指标。一方面,本申请提供了一种机器学习模型的训练方法,其包括以下步骤:(1)获取源自受试者样本的至少一个突变位点;其中,所述突变位点通过基因测序的方法获得,(2)针对每一个所述突变位点,获取野生型支持片段和突变型支持片段;其中,所述野生型支持片段为包含野生型碱基序列的cfDNA片段,所述突变型支持片段为包含突变型碱基序列的cfDNA片段,其中,所述野生型碱基序列为,与参考基因组在所述突变位点的对应位置处的核苷酸序列相比,相同的序列,其中,所述突变型碱基序列为,与参考基因组在所述突变位点的对应位置处的核苷酸序列相比,不同的序列,其中所述参考基因组为所述基因测序中的人类参考基因组;(3)针对每一个突变位点,获取至少一个长度的所述野生型支持片段的数量,获取对应的相同长度的所述突变型支持片段的数量,计算该长度的所述野生型支持片段的数量与所述野生型支持片段的总数量的比值WC;计算相同长度的所述突变型支持片段的数量与所述突变型支持片段的总数量的比值MC;计算相同长度下所述比值WC与所述比值MC的差值;(4)将所述差值作为训练的指标输入至所述机器学习模型以进行机器学习训练。一方面,本申请提供了一种数据库建立方法,其包括以下步骤:(1)获取源自受试者样本的至少一个突变位点;其中,所述突变位点通过基因测序的方法获得,(2)针对每一个所述突变位点,获取野生型支持片段和突变型支持片段;其中,所述野生型支持片段为包含野生型碱基序列的cfDNA片段,所述突变型支持片段为包含突变型碱基序列的cfDNA片段,其中,所述野生型碱基序列为,与参考基因组在所述突变位点的对应位置处的核苷酸序列相比,相同的序列,其中,所述突变型碱基序列为,与参考基因组在所述突变位点的对应位置处的核苷酸序列相比,不同的序列,其中所述参考基因组为所述基因测序中的人类参考基因组;(3)针对每一个突变位点,获取至少一个长度的所述野生型支持片段的数量,获取对应的相同长度的所述突变型支持片段的数量,计算该长度的所述野生型支持片段的数量与所述野生型支持片段的总数量的比值WC;计算相同长度的所述突变型支持片段的数量与所述突变型支持片段的总数量的比值M本文档来自技高网
...

【技术保护点】
1.一种用于区分体细胞突变和种系突变的方法,其特征在于,包括以下步骤:/n步骤一:获取源自受试者样本的至少一个突变位点;/n步骤二:针对每一个所述突变位点,获取野生型支持片段和突变型支持片段;/n步骤三:针对每一个突变位点,获取至少一个长度的所述野生型支持片段的数量,获取对应的相同长度的所述突变型支持片段的数量,/n计算该长度的所述野生型支持片段的数量与所述野生型支持片段的总数量的比值WC;/n计算相同长度的所述突变型支持片段的数量与所述突变型支持片段的总数量的比值MC;/n计算相同长度下所述比值WC与所述比值MC的差值;/n步骤四:将所述差值或差值的集合作为区分所述突变位点为体细胞突变还是种系突变的指标。/n

【技术特征摘要】
1.一种用于区分体细胞突变和种系突变的方法,其特征在于,包括以下步骤:
步骤一:获取源自受试者样本的至少一个突变位点;
步骤二:针对每一个所述突变位点,获取野生型支持片段和突变型支持片段;
步骤三:针对每一个突变位点,获取至少一个长度的所述野生型支持片段的数量,获取对应的相同长度的所述突变型支持片段的数量,
计算该长度的所述野生型支持片段的数量与所述野生型支持片段的总数量的比值WC;
计算相同长度的所述突变型支持片段的数量与所述突变型支持片段的总数量的比值MC;
计算相同长度下所述比值WC与所述比值MC的差值;
步骤四:将所述差值或差值的集合作为区分所述突变位点为体细胞突变还是种系突变的指标。


2.一种用于在cfDNA中识别ctDNA的方法,其特征在于,包括以下步骤:
步骤一:获取源自受试者样本的至少一个突变位点;
步骤二:针对每一个所述突变位点,获取野生型支持片段和突变型支持片段;
步骤三:针对每一个突变位点,获取至少一个长度的所述野生型支持片段的数量,获取对应的相同长度的所述突变型支持片段的数量,
计算该长度的所述野生型支持片段的数量与所述野生型支持片段的总数量的比值WC;
计算相同长度的所述突变型支持片段的数量与所述突变型支持片段的总数量的比值MC;
计算相同长度下所述比值WC与所述比值MC的差值;
步骤四:将所述差值或差值的集合作为识别所述突变位点是否是ctDNA的指标。


3.根据权利要求1-2中任一项所述的方法,其中所述突变位点通过基因测序的方法获得。


4.根据权利要求1-2中任一项所述的方法,其中所述野生型支持片段为包含野生型碱基序列的cfDNA片段,所述突变型支持片段为包含突变型碱基序列的cfDNA片段;所述野生型碱基序列为,与参考基因组在所述突变位点的对应位置处的核苷酸序列相比,相同的序列;所述突变型碱基序列为,与参考基因组在所述突变位点的对应位置处的核苷酸序列相比,不同的序列。


5.根据权利要求1-2中任一项所述的方法,其包括以下的步骤:
在步骤四中,获得步骤三所述差值的第一分布,选择所述第一分布中的最大值作为Dev_Max,将所述Dev_Max作为所述区分所述突变位点为体细胞突变还是种系突变的指标或作为所述识别所述突变位点是否是ctDNA的指标;
步骤五:在一有效片段区间的长度范围内,将所述第...

【专利技术属性】
技术研发人员:刘成林王俊张周揣少坤汉雨生
申请(专利权)人:广州燃石医学检验所有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1