一种基于二代测序结果的POLE突变判别模型的构建方法及其应用技术

技术编号:38099404 阅读:37 留言:0更新日期:2023-07-06 09:16
本发明专利技术涉及生物信息分析技术领域,尤其涉及一种基于二代测序结果的POLE突变判别模型的构建方法及其应用,所述构建方法包括S1、二代测序数据的预处理,S2、序列比对、变异判读及突变过滤,S3、突变过滤数据的分析及POLE突变判别。利用本发明专利技术的构建方法构建的POLE突变判别模型不需要明确POLE突变作为超扩增标志物,通过设置一定的突变数和最大突变丰度阈值,过滤突变位点过少导致的假阳性,并结合POLE突变判别得分标准,辅助POLE突变的确定,提高真阳性的检出率。同时,本发明专利技术的突变检测范围涵盖680个癌症相关基因,较大的检测覆盖度使得给出的得分标准更加接近预估假设,因此较为可靠。靠。靠。

【技术实现步骤摘要】
一种基于二代测序结果的POLE突变判别模型的构建方法及其应用


[0001]本专利技术涉及生物信息分析
,尤其涉及一种基于二代测序结果的POLE突变判别模型的构建方法及其应用。

技术介绍

[0002]子宫内膜癌(endometrial carcinoma,EC)是一种常见的妇科癌症,是发生于子宫内膜的一组上皮性恶性肿瘤。其中,POLE超突变子宫内膜癌分型定义为DNA聚合酶ε(POLE)外切核酸酶结构域的体细胞突变引起的肿瘤。POLE分型的子宫内膜癌通常对于化学疗法与免疫疗法较敏感,临床治疗效果好。
[0003]高肿瘤负荷(TMB>100)与COSMIC特征POLE体细胞突变可以作为一种重要的生物标记物,用于POLE超扩增(突变)肿瘤的诊断。同时,根据文献报道,不同种类碱基替换的分布、点突变和插入缺失的比值也都与POLE超扩增肿瘤的发生存在关联。然而,目前的主流判定方法都基于已知阳性POLE突变位点(P286R,V411L,S297F,A456P,S459F,M444K),已有的方法在临床诊断上存在缺陷,即在缺少明确PO本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于二代测序结果的POLE突变判别模型的构建方法,其特征在于,包括如下步骤:S1、二代测序数据的预处理对获得的待测样本和对照样本的二代测序数据进行预过滤,分别获得pileup文件;所述预过滤包括质控、比对、去重;所述待测样本为肿瘤患者待测组织DNA或血液游离DNA,所述对照样本为肿瘤患者唾液DNA或血液基因组DNA;S2、序列比对、变异判读及突变过滤利用突变检测工具对步骤S1获得pileup文件进行分析,分析数据中存在的与癌症相关基因的突变信息,注释点突变、插入/缺失突变的位点位置与具体碱基变化,标注POLE突变,获取样本所有突变的突变数、最大突变丰度;根据突变数,过滤假阳性,过滤掉突变数小于等于50的测序数据对应的DNA样本;S3、突变过滤数据的分析及POLE突变判别根据步骤S2过滤后的突变数据及设定的阈值,判断POLE突变的致病性。2.如权利要求1所述的构建方法,其特征在于,所述突变过滤数据的分析具体为:对步骤S2过滤后的数据进行分析,获取碱基C突变为碱基A突变数、碱基T突变为碱基G突变数、碱基C突变为碱基G突变数、点突变总数、插入/缺失突变总数和总突变数;根据步骤S2注释的POLE突变,获取COSMIC数据库中POLE突变在样本对应肿瘤中的出现次数;根据癌症相关基因的测序区域BED文件大小,获取肿瘤负荷数据;肿瘤负荷=总突变数/测序区域BED文件大小。3.如权利要求1所述的构建方法,其特征在于,所述POLE突变判别具体为:根据权利要求2中突变过滤数据的分析的结果,设置6个整数型计分标准:碱基C突变为碱基A突变数占点突变总数的百分比大于20%,记1分,反之...

【专利技术属性】
技术研发人员:陈实富耿宇涵杨博曹慧雅锁培苏
申请(专利权)人:深圳市海普洛斯生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1