一种基于二代测序技术检测KMT2A基因部分串联重复的方法和系统技术方案

技术编号:44034792 阅读:22 留言:0更新日期:2025-01-15 01:14
本发明专利技术公开了一种基于二代测序技术检测KMT2A基因部分串联重复的方法和系统,该方法包括以下步骤:S1:待测样本经NGS实验流程测序完成后得到fastq格式的测序数据,对测序数据进行QC和比对,得到bam格式的比对数据;S2:对数据进行深度计算,使用loess回归对深度进行GC校正,使用PCA方法以预先建立的正常样本基线去除待测样本中的噪音得到最终log‑ratio;S3:使用CBS方法对log‑ratio分段;S4:使用基于MCMC的吉布斯采样对数据进行拟合,计算出KMT2A基因是否存在PTD突变。本发明专利技术方法检测灵敏度高,能够在一次panel数据中检测KMT2A‑PTD,联合高通量测序的优势,全方面地评估待测样本诊疗相关基因的变异状态。

【技术实现步骤摘要】

本专利技术属于基因工程,尤其涉及一种基于二代测序技术检测kmt2a基因部分串联重复的方法和系统。


技术介绍

1、mll(mixed lineage leukaemia gene)基因也称为赖氨酸甲基转移酶2a(lysinemethyltransferase 2a,kmt2a)基因。它位于11号染色体长臂2区3带(11q23),编码组蛋白h3赖氨酸4甲基转移酶,通过调节hox基因的表达从而在胚胎发育和造血过程中发挥重要作用。kmt2a基因重排是导致部分急性淋巴细胞白血病和急性髓系白血病发生的原因。

2、ptd(partial tandem duplication)是kmt2a基因重排常见的变异形式,是指基因的部分串联重复。kmt2a-ptd的特征是跨越6-8个外显子的大量内部重复,最为常见的重复序列包括外显子3~9、外显子3~10以及外显子3~11。

3、kmt2a-ptd可见于约10%核型正常的急性髓系白血病(aml)和骨髓增生异常综合征(mds)患者,在仅有第11号染色体三体异常的aml患者中发生率近90%,是aml和mds患者的本文档来自技高网...

【技术保护点】

1.一种基于二代测序技术检测KMT2A基因部分串联重复的方法,其特征在于:包括以下步骤:

2.根据权利要求1所述方法,其特征在于:S2中对数据进行深度计算的具体方法为:获取bam中reads在各目标基因组区域的总覆盖度,除以各目标基因组区域的宽度得到各区域的平均深度。

3.根据权利要求1所述方法,其特征在于:S2中使用PCA方法以预先建立的正常样本基线去除待测样本中的噪音的具体方法为:预先选择一些高质量的、处理过程与待测样本高度匹配的正常样本构建基线,通过PCA降维和寻找最小距离,从正常样本基线中获取与待测样本在深度偏差上最为相似的正常样本,根据它去除待测样本中的...

【技术特征摘要】

1.一种基于二代测序技术检测kmt2a基因部分串联重复的方法,其特征在于:包括以下步骤:

2.根据权利要求1所述方法,其特征在于:s2中对数据进行深度计算的具体方法为:获取bam中reads在各目标基因组区域的总覆盖度,除以各目标基因组区域的宽度得到各区域的平均深度。

3.根据权利要求1所述方法,其特征在于:s2中使用pca方法以预先建立的正常样本基线去除待测样本中的噪音的具体方法为:预先选择一些高质量的、处理过程与待测样本高度匹配的正常样本构建基线,通过pca降维和寻找最小距离,从正常样本基线中获取与待测样本在深度偏差上最为相似的正常样本,根据它去除待测样本中的噪音并标准化,得到最终log-ratio。

4.根据权利要求1所述方法,其特征在于:s3中使用cbs方法对log-ratio分段的具体方法为:对于每个可能的分割点,计算前后数据的方差比,选择使得方差比最大的分割点作为最佳分割点,在选定的分割点处将数据分成两部分,并对每部分递归地重复上述分割过程,直到满足停止条件。

5.根据权利要求1所述方法,其特征在于:s4中使用基于mcmc的吉布斯采样对数据进行拟合的具体方法为:通过2d网格搜索找到与log-ratio拟合良好的多个肿瘤纯度和倍性组合;在各肿瘤纯度和倍性组合条件下,使用吉布斯采样对每段的拷贝数进行后验概率计算,通过似然性为每段确定拷贝数状态的初始估计,之后通过模拟退火算法为所有段分配拷贝数,同时优化纯度估计。

6.一种基于二代测序技术检测kmt2a基因部分串联重...

【专利技术属性】
技术研发人员:肖敏向杨张美兰沈克锋吴三云周涛张义成
申请(专利权)人:华中科技大学同济医学院附属同济医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1