一种用于利用肿瘤FFPE样本检测体细胞突变的装置制造方法及图纸

技术编号:15691303 阅读:322 留言:0更新日期:2017-06-24 04:24
本发明专利技术涉及一种用于利用肿瘤FFPE样本检测体细胞突变的装置,其包括数据获取模块、突变频率统计模块、对比模块、判定模块以及检测结果输出模块。本发明专利技术的用于利用肿瘤FFPE样本检测体细胞突变的装置能够更准确地将系统错误与真实的体细胞突变进行区分,不仅提高了灵敏度,而且降低了假阳性与假阴性。

A device for detecting somatic cell mutations using tumor FFPE samples

The invention relates to a device for detecting somatic cell mutation using a tumor FFPE sample, which comprises a data acquisition module, a mutation frequency statistic module, a comparison module, a decision module and a detection result output module. The present invention for device using somatic mutation detection of tumor FFPE samples to more accurately the system error and true somatic mutations were distinguished, not only improve the sensitivity and reduce the false positive and false negative.

【技术实现步骤摘要】
一种用于利用肿瘤FFPE样本检测体细胞突变的装置
本专利技术涉及低频突变检测领域,具体涉及一种用于利用肿瘤FFPE样本检测体细胞突变的装置及方法。
技术介绍
福尔马林固定石蜡包埋(Formalin-fixedandParaffin-embedded,FFPE)方法制备的组织标本称为福尔马林固定石蜡包埋组织样本,简称FFPE样本。FFPE样本能够长时间保存,其常用于临床病理检验、肿瘤基因检测和医学科学研究,是一个可靠的分子生物学研究的材料来源。在世界范围内,大约有数十亿份组织样品保存在医院或者组织样品库中。其中绝大多数是FFPE样本。FFPE样本通常代表了珍贵且来源广泛的生物医学研究材料,数量巨大的归档FFPE样本为回顾性研究、阐明疾病机制、发现治疗靶标和指示预后等方面提供了宝贵的资源。特别是,有大量的肿瘤组织切片被以FFPE样本的形式保存。另一方面,大量研究表明,癌症的产生是与体细胞突变(SNV)密切相关,并且这种突变往往仅出现在某一种肿瘤的亚克隆之中。亚克隆突变的研究为癌症病程发展及预后分层提供了新的方向。当前,二代测序技术已经广泛应用于肿瘤基因检测,高深度的二代测序可以检测亚克隆变异。但是,通过二代测序检测亚克隆变异在文库构建、上机测序及序列比对的过程中将不可避免地发生PCR错误、测序假阳性及比对不准确的情况,如何区分真正的亚克隆变异与以上噪音是当前面临的一大难题。特别是在使用肿瘤FFPE样本进行检测的情况下,因为FFPE样本特殊的制作方法和保存过程都会使样本中的核酸受到损伤,所以这一问题尤为突出。
技术实现思路
本专利技术所要解决的技术问题正如前述,基于现有的平台,使用肿瘤FFPE样本进行SNV预测的难点在于将测序错误与真实的SNV进行准确的区分。因此,本专利技术的目的在于提供一种能够更准确地区分测序错误与真实SNV、从而更准确地利用肿瘤FFPE样本检测SNV的装置及方法。本专利技术人经过深入研究发现,通过收集大量的健康人样本进行平行试验,能够确定基因组每一个位置的错误率,从而更准确地区分测序错误与SNV,同时降低假阳性与假阴性。即,本专利技术包括:一种用于利用肿瘤FFPE样本检测体细胞突变(SNV)的装置,其包括:数据获取模块,用于获取肿瘤FFPE样本DNA的测序数据及健康人群DNA的测序数据,所述测序数据包括所述肿瘤FFPE样本DNA各位点的突变频率、以及与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率;通常,所述肿瘤FFPE样本DNA的测序数据可以来自对待测肿瘤FFPE样本DNA进行测序而获得的数据;所述健康人群DNA的测序数据可以来自已经建立的健康人群DNA数据库,或者来自对健康人群生物样本DNA进行测序(测序方法应与针对所述待测肿瘤FFPE样本DNA的测序方法相同,即平行测序)而获得的数据;突变频率统计模块,其与所述数据获取模块相连接,用于统计所述健康人群群体的所述DNA各位点中的每一个位点的突变频率分布情况,得到健康人群突变频率统计模型;对比模块,其与所述数据获取模块及所述突变频率统计模块相连接,用于将所述肿瘤FFPE样本DNA各位点的突变频率与所述健康人群突变频率统计模型进行对比,获得对比结果;判定模块,其与所述对比模块相连接,用于判定所述肿瘤FFPE样本DNA各位点的突变是否为真实的体细胞突变,获得判定结果;其中,当所述对比结果为无显著差异时,判定结果为非体细胞突变(包括系统错误及一部分胚系突变);当所述对比结果为有显著差异、且突变频率小于设定值时,判定结果为真实的体细胞突变;当所述对比结果为有显著差异、且突变频率大于或等于设定值时,判定结果为胚系突变;所述设定值可以根据测序的实际情况进行合理设定,例如,在测序深度在100×时,优选的设定值可以为35%;以及检测结果输出模块,其与所述判定模块相连接,用于输出所述判定模块的所述判定结果。优选地,所述数据获取模块包括肿瘤FFPE样本DNA各位点的突变频率获取模块,该模块进一步包括下述子模块:过滤子模块,其与所述数据获取模块相连接,用于对测序数据进行质检,过滤去除低质量的测序数据;比对子模块,其与所述过滤子模块相连接,用于将过滤后的测序数据与参考序列进行比对,获取测序片段在基因组中对应的位置;预处理子模块,其与所述比对子模块相连接,用于去除重复的测序片段;以及统计子模块,其与所述预处理子模块相连接,用于统计肿瘤FFPE样本DNA各位点的突变频率。优选地,所述统计子模块筛选出肿瘤FFPE样本DNA各位点中的可信度值(LOD值)大于设定值(例如100)的位点并进行突变频率统计。针对每一个样本的每一个位点i,i∈{人类基因组},待测样本的针对该位点的检测LOD的计算公式如下:公式中的各个部分又是由下列公式获得:以下面两种模式来描述数据:modelM0表示在该位点没有变异,任何的非参考位点的碱基都被认为是测序噪音;model表示在该位点有真实的m突变,并且等位基因频率为f。M0就相当于是f=0时的参考位点为r∈{A,T,C,G},而对于每条readi(i=1…d),覆盖这个位点的碱基为bi,这个碱基的错误概率为ei(此错误概率由每个碱基的质量值ei获得,)。优选地,所述数据获取模块包括与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率获取模块,该模块进一步包括下述子模块:过滤子模块,其与所述数据获取模块相连接,用于对测序数据进行质检,过滤去除低质量的测序数据;比对子模块,其与所述过滤子模块相连接,用于将过滤后的测序数据与参考序列进行比对,获取测序片段在基因组中对应的位置;预处理子模块,其与所述比对子模块相连接,用于去除重复的测序片段;以及统计子模块,其与所述预处理子模块相连接,用于统计与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率。优选地,所述突变频率统计模块包括模型校正子模块,所述模型校正子模块用于利用得到的健康人群突变频率统计模型,对与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点进行评估而舍去明显偏离的位点,并统计余下的各位点中的每一个位点的突变频率的分布情况,得到新的健康人群突变频率统计模型。优选地,所述判定模块包括下述子模块:突变显著性判定子模块,其与所述对比模块相连接,用于判定所述肿瘤FFPE样本DNA各位点的突变的显著性;以及突变类型判定子模块,其与所述突变显著性判定子模块相连接,用于判定所述肿瘤FFPE样本DNA各位点的具有显著性的突变的类型是体细胞突变还是胚系突变。优选地,所述突变显著性判定子模块判定所述FFPE样本DNA各位点的突变频率是否与健康人群突变频率统计模型中对应位点的突变频率存在显著差异(例如判据为正态分布,P<0.05),有显著差异则为真实突变,无显著差异则为假阳性突变。优选地,检测结果输出模块输出肿瘤FFPE样本DNA各位点的具有显著性的突变的位置和突变类型。此外,本专利技术还提供:一种用于利用肿瘤FFPE样本检测体细胞突变(SNV)的方法,其包括:数据获取步骤,获取肿瘤FFPE样本DNA的测序数据及健康人群DNA的测序数据,所述测序数据包括所述肿瘤FFPE样本DNA各位点的突变频率、以本文档来自技高网...
一种用于利用肿瘤FFPE样本检测体细胞突变的装置

【技术保护点】
一种用于利用肿瘤FFPE样本检测体细胞突变的装置,其包括:数据获取模块,用于获取肿瘤FFPE样本DNA的测序数据及健康人群DNA的测序数据,所述测序数据包括所述肿瘤FFPE样本DNA各位点的突变频率、以及与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率;突变频率统计模块,其与所述数据获取模块相连接,用于统计所述健康人群群体的所述DNA各位点中的每一个位点的突变频率分布情况,得到健康人群突变频率统计模型;对比模块,其与所述数据获取模块及所述突变频率统计模块相连接,用于将所述肿瘤FFPE样本DNA各位点的突变频率与所述健康人群突变频率统计模型进行对比,获得对比结果;判定模块,其与所述对比模块相连接,用于判定所述肿瘤FFPE样本DNA各位点的突变是否为真实的体细胞突变,获得判定结果;其中,当所述对比结果为有显著差异、且突变频率小于设定值时,判定结果为真实的体细胞突变;以及检测结果输出模块,其与所述判定模块相连接,用于输出所述判定模块的所述判定结果。

【技术特征摘要】
2016.12.29 CN 20161124621191.一种用于利用肿瘤FFPE样本检测体细胞突变的装置,其包括:数据获取模块,用于获取肿瘤FFPE样本DNA的测序数据及健康人群DNA的测序数据,所述测序数据包括所述肿瘤FFPE样本DNA各位点的突变频率、以及与所述肿瘤FFPE样本DNA各位点对应的健康人群中的每个个体的DNA各位点的突变频率;突变频率统计模块,其与所述数据获取模块相连接,用于统计所述健康人群群体的所述DNA各位点中的每一个位点的突变频率分布情况,得到健康人群突变频率统计模型;对比模块,其与所述数据获取模块及所述突变频率统计模块相连接,用于将所述肿瘤FFPE样本DNA各位点的突变频率与所述健康人群突变频率统计模型进行对比,获得对比结果;判定模块,其与所述对比模块相连接,用于判定所述肿瘤FFPE样本DNA各位点的突变是否为真实的体细胞突变,获得判定结果;其中,当所述对比结果为有显著差异、且突变频率小于设定值时,判定结果为真实的体细胞突变;以及检测结果输出模块,其与所述判定模块相连接,用于输出所述判定模块的所述判定结果。2.根据权利要求1所述的装置,其中,所述数据获取模块包括肿瘤FFPE样本DNA各位点的突变频率获取模块,该肿瘤FFPE样本DNA各位点的突变频率获取模块进一步包括下述子模块:过滤子模块,其与所述数据获取模块相连接,用于对测序数据进行质检,过滤去除低质量的测序数据;比对子模块,其与所述过滤子模块相连接,用于将过滤后的测序数据与参考序列进行比...

【专利技术属性】
技术研发人员:陈玥茏侯光远刘卉陈玉洁王旺玄兆伶李大为梁峻彬陈重建
申请(专利权)人:安诺优达基因科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1