【技术实现步骤摘要】
一种用于高通量测序体细胞突变检测性能评估的数据集和方法
本专利技术属于生物
,具体涉及一种用于高通量测序体细胞突变检测性能评估的数据集和方法。
技术介绍
癌症是威胁人类健康的主要疾病之一。由于癌症的异质性,相同疗法对同种癌症类型的不同个体的疗效可能存在很大差异。因此,目前还没有一种疗法可以普遍适用于所有癌症,更精确的疗法亟待开发。近年来,癌症治疗手段特别是靶向治疗方面取得了巨大进步。目前大多数靶向疗法都基于检测基因突变,例如,酪氨酸激酶抑制剂阿法替尼(Afatinib)和厄洛替尼(Erlotinib)用于靶向非小细胞肺癌中表皮生长因子受体(EGFR)的突变;丝氨酸/苏氨酸激酶(BRAF)抑制剂索拉非尼(Sorafenib),靶向BRAF基因发生V600E突变的黑素瘤;聚ADP-核糖聚合酶(PARP)抑制剂奥拉帕尼(Olaparib)用于治疗具有BRCA基因突变的晚期卵巢癌。因此,研究基因组突变是揭示癌症发病机制并指导开发更具针对性的药物的重要手段之一。全外显子组测序(WES)是检测基因组突变的有 ...
【技术保护点】
1.人类参考基因组hg19突变集,其特征在于:染色体和位置、碱基突变信息如表2所示。/n
【技术特征摘要】
1.人类参考基因组hg19突变集,其特征在于:染色体和位置、碱基突变信息如表2所示。
2.权利要求1所述的人类参考基因组hg19突变集的制作方法,其特征在于包括以下步骤:
(1)取待测DNA样品和阳性对照样品,纯化后,将其打断为100-500bp的DNA片段,捕获其中的外显子,将Illumina接头连接至外显子片段的两端,扩增后,得到Illumina外显子组测序文库;
(2)得到的Illumina外显子组测序文库进行全外显子组测序;测序后,过滤低质量的reads并去除接头,使用BWA-MEM软件将测序结果与hg19参考基因组比对,将比对得到的SAM文件转换为BAM文件;
(3)使用Strelka2和GATKHaplotypeCaller软件对得到的BAM文件做突变检测;以在待测DNA样品中纯合、但在阳性对照中不存在或为另一纯合型的单核苷酸变异(SNV)位点作为真实突变;取在Strelka2和GATKHaplotypeCaller的检测结果中都存在的真实突变的集合,即为人类参考基因组hg19突变集。
3.根据权利要求2所述的制作方法,其特征在于:步骤(1)所述的阳性对照为NA12878。
4.权利要求1所述的人类参考基因组hg19突变集在评估高通量测序体细胞突变检测方法的性能中的应用。
5.根据权利要求4所述的应用,其特征在于包括以下步骤:
(1)使用Picard工具将权利要求2步骤(2)所得的BAM文件抽样至不同的测序深度,随后使用Samtools将抽样后的待测DNA样品和阳性对照的BAM文件合并,不同的待测DNA样品比例即代表不同的突变频率;
(2)使用Strelka2和Mutect2软件对上述混合数据进行突变检测,获得检测结果后,使用som.py工具将其与人类参考基因组hg19突变集进行比对;
用来评估检测性能的指标及其定义如下:
真阳性(TP):出现在检测结果和真集中的突变;
假阳性(FP):出现在检...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。