基于二代测序的肿瘤克隆变异检测方法、装置和存储介质制造方法及图纸

技术编号:19320909 阅读:35 留言:0更新日期:2018-11-03 11:08
本申请公开了一种基于二代测序的肿瘤克隆变异检测方法、装置和存储介质。本申请的方法包括,利用变异检测软件对成对的肿瘤和正常样本的比对文件进行变异检测,计算突变频率,选取测序质量高的片段作为统计结果;利用纯度检测软件对成对的肿瘤和正常样本,进行拷贝数和纯度检测;将小片段合并成大片段,对突变区域拷贝数进行注释;根据肿瘤样本纯度和拷贝数检测结果,利用beta分布模型计算突变在所测肿瘤组织中的比例,由此判断肿瘤克隆变异类型。本申请的方法,避免了样本纯度和倍型对检测的影响,使变异类型检测更准确,能识别有临床意义的亚克隆突变;为准确、深入研究肿瘤克隆进化过程,研究肿瘤治疗分子机理奠定了基础。

Tumor clone variation detection method, device and storage medium based on two generation sequencing

This application discloses a method, device and storage medium for detecting clonal mutation of tumors based on second generation sequencing. The methods of this application include: using mutation detection software to detect the mutation of a pair of contrast files between tumors and normal samples, calculating mutation frequency, selecting high-quality sequences as statistical results; using purity detection software to detect the number of copies and purity of pairs of tumors and normal samples; and using small fragments to detect the number of copies and purity of pairs of tumors and normal samples. The number of copies of the mutation region was annotated by merging into large fragments. According to the results of purity and number of copies of tumor samples, the proportion of mutations in the detected tumor tissues was calculated by beta distribution model, and the type of clonal mutations was judged. The method of this application avoids the influence of sample purity and polymorphism on detection, makes the detection of mutation types more accurate, and can identify subclonal mutations with clinical significance. It lays a foundation for accurate and in-depth study of the evolution process of cancer cloning and the molecular mechanism of cancer treatment.

【技术实现步骤摘要】
基于二代测序的肿瘤克隆变异检测方法、装置和存储介质
本申请涉及肿瘤检测领域,特别是涉及一种基于二代测序的肿瘤克隆变异检测方法、装置和存储介质。
技术介绍
肿瘤是由基因组变异引起的疾病。肿瘤的发生伴随着大量的基因组变异,这些基因组变异根据发生的时期不同分为两种肿瘤克隆变异类型,即克隆性突变和亚克隆性突变。克隆性的突变,发生在肿瘤早期,存在于大部分的肿瘤细胞中;亚克隆性的突变,发生在肿瘤后来的进化过程中,存在于小部分的肿瘤细胞亚群中。这些克隆性突变和亚克隆性突变组成了肿瘤内部的异质性,与肿瘤的进化,转移,复发,耐药相关。目前肿瘤克隆性研究可以使用的技术有:二代测序技术、SNP芯片、微阵列比较基因组杂交技术等。单细胞测序技术可以直接观察到单个细胞水平的异质性,但是单细胞技术仍然面临很大的挑战,比如等位基因脱扣(alleledropout,ADO)、扩增失败和偏性扩增等现象的存在,导致单细胞测序研究肿瘤异质性不成熟。因此,利用混在一起的细胞群仍然是研究肿瘤克隆性变异的有效方法。大部分的实体瘤和血液肿瘤都存在不同程度的异质性,基本都是由一个主克隆和几个亚克隆组成。很多研究都显示肿瘤内部的异质性和克隆组成具有临床意义,并且促进了肿瘤治疗的耐药发生。一些研究发现肿瘤中的亚克隆细胞的出现与慢性淋巴细胞白血病的不良预后相关,与食管癌和黑色素瘤的恶性进展相关。亚克隆突变还与耐药相关,例如在非小细胞肺癌中经常发生EGFR的亚克隆突变。针对亚克隆突变也有靶向药物的开发,例如奥西替尼就是针对EGFRT790M的亚克隆突变。因此,要开发二线治疗的靶向药物就必须了解肿瘤的克隆进化过程,了解肿瘤克隆变异类型,以及与肿瘤治疗的分子机理。目前研究肿瘤克隆性一般是取一个患者身上多个时间点或多处肿瘤组织进行研究,一次的样本数在6~20个左右,这样就限制了克隆研究的样本。因此利用二代测序技术和生物信息学方法,能够推测一个时间节点的样本,这样就使克隆研究的适用范围变广。针对单个时间节点的肿瘤样本进行克隆性研究,一般采取的方法是根据变异在测序数据中的信号的频率来判断是属于克隆还是亚克隆,即根据变异信号的频率来判断肿瘤克隆变异类型。但是,这些方法并不能很准确的检测出肿瘤克隆变异类型,很难直接用于二线治疗的靶向药物开发或临床用药指导。
技术实现思路
本申请的目的是提供一种新的基于二代测序的肿瘤克隆变异检测方法、装置和存储介质。为了实现上述目的,本申请采用了以下技术方案:本申请的第一方面公开了一种基于二代测序的肿瘤克隆变异检测方法,包括以下步骤,肿瘤突变频率鉴定步骤,包括对成对的肿瘤和正常样本的测序结果的比对文件进行突变检测,获取突变的测序片段支持数、正常的测序片段支持数和总的测序片段支持数;并计算肿瘤突变频率,即突变的测序片段支持数除以总的测序片段支持数,获得肿瘤突变频率;肿瘤样本纯度鉴定步骤,包括获取肿瘤和正常样本中的每个SNP位点两种碱基的测序片段支持数,将碱基频率小于或大于设定阈值的SNP位点定义为纯合位点,将剔除纯合位点的SNP的信息,转化为纯度检测软件的输入数据集,得到肿瘤样本纯度鉴定结果和拷贝数信息;肿瘤拷贝数鉴定步骤,包括对经过纯度矫正的拷贝数信息及相应区域进行过滤筛选,并将小片段合并成大片段,对突变区域的拷贝数进行注释,获得肿瘤拷贝数鉴定结果;肿瘤突变频率校正步骤,包括根据肿瘤样本纯度鉴定步骤和肿瘤拷贝数鉴定步骤的结果,利用beta分布模型计算突变细胞在所测肿瘤组织中的比例,获得校正后的肿瘤突变频率;肿瘤克隆变异类型鉴定步骤,包括根据所述校正后的肿瘤突变频率判断突变类型的克隆属性,获得肿瘤克隆变异结果。需要说明的是,本申请针对现有的肿瘤克隆变异类型检测不够准确的问题,创造性的在肿瘤克隆变异类型的检测过程中,引入肿瘤样本纯度鉴定和肿瘤拷贝数鉴定,通过突变的样本纯度和拷贝数对突变频率进行校正,从而可以获得更准确的突变细胞比例计算结果,进而获得更准确的肿瘤克隆变异类型检测结果;本申请的检测方法避免了样本纯度问题和倍型问题对肿瘤克隆变异类型检测结果的影响,使得肿瘤克隆变异类型检测结果更加准确,从而可以直接用于二线治疗的靶向药物开发或临床用药指导。优选的,肿瘤突变频率鉴定步骤中,突变检测包括点突变、短片段的插入缺失和/或杂合性缺失。并且优先选取测序质量高的片段作为最终的统计结果。优选的,肿瘤突变频率鉴定步骤中,还包括矫正的步骤,所述矫正的步骤包括,若两条成对序列在重叠区域里碱基类型一致,则只保留区域里质量值较高的一条序列;若碱基类型不一致,并且其中一条序列质量高,另一条质量低,则保留质量高的序列,否则两条都舍弃。需要说明的是,因为二代测序的片段都是成对的,一对片段之间的插入片段区域如果较小,则两条片段都会覆盖到突变位置,这样的两条片段实际上为一条片段,因此需要矫正,需要对成对序列重叠区域的进行处理;所以,本申请的优选方案中进一步引入了矫正的步骤。优选的,肿瘤样本纯度鉴定步骤中,将碱基频率小于30%或大于70%的SNP位点定义为纯合位点,去掉纯合位点后,将剩下的SNP位点两种碱基的测序片段支持数通过公式转化为纯度检测软件输入需要的两种信号,进行纯度鉴定,具体采用公式(2-1)和公式(2-2);其中,i表示SNP位点,nA,i表示i位点的A碱基的深度,nB,i表i位点的B碱基的深度,D表示肿瘤的平均深度,BAF表示B碱基的频率。优选的,肿瘤突变频率校正步骤中,计算突变细胞在所测肿瘤组织中的比例,具体采用公式(4-1)或公式(4-2),其中,pdf(CCF,m)表示突变肿瘤细胞比例的密度分布函数,βpdf表示beta密度分布函数,CCF表示突变细胞在所测肿瘤组织中的比例,α为纯度,q(m)表示肿瘤的拷贝数,alt(m)是突变的测序片段支持数,ref(m)是正常的测序片段支持数。需要说明的是,一般的肿瘤克隆变异采用公式(4-1)即可,如果需要考虑杂合型缺失(LOH)的情况,则采用公式(4-2)。优选的,肿瘤克隆变异类型鉴定步骤中,根据校正后的肿瘤突变频率判断突变类型的克隆属性,具体包括,突变细胞在所测肿瘤组织中的比例等于1的概率大于0.5,判断突变类型是克隆性突变,反之则为亚克隆性突变。本申请的第二方面公开了一种基于二代测序的肿瘤克隆变异检测装置,包括,肿瘤突变频率鉴定模块,用于对成对的肿瘤和正常样本的测序结果的比对文件进行突变检测,获取突变的测序片段支持数、正常的测序片段支持数和总的测序片段支持数;并计算肿瘤突变频率,即突变的测序片段支持数除以总的测序片段支持数,获得肿瘤突变频率;肿瘤样本纯度鉴定模块,用于获取肿瘤和正常样本中的每个SNP位点两种碱基的测序片段支持数,将碱基频率小于或大于设定阈值的SNP位点定义为纯合位点,将剔除纯合位点的SNP的信息,转化为纯度检测软件的输入数据集,得到肿瘤样本纯度鉴定结果和拷贝数信息;肿瘤拷贝数鉴定模块,用于对经过纯度矫正的拷贝数信息及相应区域进行过滤筛选,并将小片段合并成大片段,对突变区域的拷贝数进行注释,获得肿瘤拷贝数鉴定结果;肿瘤突变频率校正模块,用于根据肿瘤样本纯度鉴定步骤和肿瘤拷贝数鉴定步骤的结果,利用beta分布模型计算突变细胞在所测肿瘤组织中的比例,获得校正后的肿瘤突变频率;肿瘤克隆变异类型本文档来自技高网
...

【技术保护点】
1.一种基于二代测序的肿瘤克隆变异检测方法,其特征在于:包括以下步骤,肿瘤突变频率鉴定步骤,包括对成对的肿瘤和正常样本的测序结果的比对文件进行突变检测,获取突变的测序片段支持数、正常的测序片段支持数和总的测序片段支持数;并计算肿瘤突变频率,即突变的测序片段支持数除以总的测序片段支持数,获得肿瘤突变频率;肿瘤样本纯度鉴定步骤,包括获取肿瘤和正常样本中的每个SNP位点两种碱基的测序片段支持数,将碱基频率小于或大于设定阈值的SNP位点定义为纯合位点,将剔除纯合位点的SNP的信息,转化为纯度检测软件的输入数据集,得到肿瘤样本纯度鉴定结果和拷贝数信息;肿瘤拷贝数鉴定步骤,包括对经过纯度矫正的拷贝数信息及相应区域进行过滤筛选,并将小片段合并成大片段,对突变区域的拷贝数进行注释,获得肿瘤拷贝数鉴定结果;肿瘤突变频率校正步骤,包括根据肿瘤样本纯度鉴定步骤和肿瘤拷贝数鉴定步骤的结果,利用beta分布模型计算突变细胞在所测肿瘤组织中的比例,获得校正后的肿瘤突变频率;肿瘤克隆变异类型鉴定步骤,包括根据所述校正后的肿瘤突变频率判断突变类型的克隆属性,获得肿瘤克隆变异结果。

【技术特征摘要】
1.一种基于二代测序的肿瘤克隆变异检测方法,其特征在于:包括以下步骤,肿瘤突变频率鉴定步骤,包括对成对的肿瘤和正常样本的测序结果的比对文件进行突变检测,获取突变的测序片段支持数、正常的测序片段支持数和总的测序片段支持数;并计算肿瘤突变频率,即突变的测序片段支持数除以总的测序片段支持数,获得肿瘤突变频率;肿瘤样本纯度鉴定步骤,包括获取肿瘤和正常样本中的每个SNP位点两种碱基的测序片段支持数,将碱基频率小于或大于设定阈值的SNP位点定义为纯合位点,将剔除纯合位点的SNP的信息,转化为纯度检测软件的输入数据集,得到肿瘤样本纯度鉴定结果和拷贝数信息;肿瘤拷贝数鉴定步骤,包括对经过纯度矫正的拷贝数信息及相应区域进行过滤筛选,并将小片段合并成大片段,对突变区域的拷贝数进行注释,获得肿瘤拷贝数鉴定结果;肿瘤突变频率校正步骤,包括根据肿瘤样本纯度鉴定步骤和肿瘤拷贝数鉴定步骤的结果,利用beta分布模型计算突变细胞在所测肿瘤组织中的比例,获得校正后的肿瘤突变频率;肿瘤克隆变异类型鉴定步骤,包括根据所述校正后的肿瘤突变频率判断突变类型的克隆属性,获得肿瘤克隆变异结果。2.根据权利要求1所述的肿瘤克隆变异检测方法,其特征在于:所述肿瘤突变频率鉴定步骤中,所述突变检测包括点突变、短片段的插入缺失和/或杂合性缺失。3.根据权利要求1所述的肿瘤克隆变异检测方法,其特征在于:所述肿瘤突变频率鉴定步骤中,还包括矫正的步骤,所述矫正的步骤包括,若两条成对序列在重叠区域里碱基类型一致,则只保留区域里质量值较高的一条序列;若碱基类型不一致,并且其中一条序列质量高,另一条质量低,则保留质量高的序列,否则两条都舍弃。4.根据权利要求1所述的肿瘤克隆变异检测方法,其特征在于:所述肿瘤样本纯度鉴定步骤中,将碱基频率小于30%或大于70%的SNP位点定义为纯合位点,去掉纯合位点后,将剩下的SNP位点两种碱基的测序片段支持数通过公式转化为纯度检测软件输入需要的两种信号,进行纯度鉴定,具体采用公式(2-1)和公式(2-2),其中,i表示SNP位点,nA,i表示i位点的A碱基的深度,nB,i表i位点的B碱基的深度,D表示肿瘤的平均深度,BAF表示B碱基的频率。5.根据权利要求1所述的肿瘤克隆变异检测方法,其特征在于:所述肿瘤突变频率校正步骤中,所述计算突变细胞在所测肿瘤组织...

【专利技术属性】
技术研发人员:王佳茜高志博陈超李淼杨洁
申请(专利权)人:深圳裕策生物科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1