【技术实现步骤摘要】
本专利技术属于基因工程,尤其涉及一种基于二代测序技术检测kmt2a基因部分串联重复的方法和系统。
技术介绍
1、mll(mixed lineage leukaemia gene)基因也称为赖氨酸甲基转移酶2a(lysinemethyltransferase 2a,kmt2a)基因。它位于11号染色体长臂2区3带(11q23),编码组蛋白h3赖氨酸4甲基转移酶,通过调节hox基因的表达从而在胚胎发育和造血过程中发挥重要作用。kmt2a基因重排是导致部分急性淋巴细胞白血病和急性髓系白血病发生的原因。
2、ptd(partial tandem duplication)是kmt2a基因重排常见的变异形式,是指基因的部分串联重复。kmt2a-ptd的特征是跨越6-8个外显子的大量内部重复,最为常见的重复序列包括外显子3~9、外显子3~10以及外显子3~11。
3、kmt2a-ptd可见于约10%核型正常的急性髓系白血病(aml)和骨髓增生异常综合征(mds)患者,在仅有第11号染色体三体异常的aml患者中发生率近90%,是
...【技术保护点】
1.一种基于二代测序技术检测KMT2A基因部分串联重复的方法,其特征在于:包括以下步骤:
2.根据权利要求1所述方法,其特征在于:S2中对数据进行深度计算的具体方法为:获取bam中reads在各目标基因组区域的总覆盖度,除以各目标基因组区域的宽度得到各区域的平均深度。
3.根据权利要求1所述方法,其特征在于:S2中使用PCA方法以预先建立的正常样本基线去除待测样本中的噪音的具体方法为:预先选择一些高质量的、处理过程与待测样本高度匹配的正常样本构建基线,通过PCA降维和寻找最小距离,从正常样本基线中获取与待测样本在深度偏差上最为相似的正常样本,根
...【技术特征摘要】
1.一种基于二代测序技术检测kmt2a基因部分串联重复的方法,其特征在于:包括以下步骤:
2.根据权利要求1所述方法,其特征在于:s2中对数据进行深度计算的具体方法为:获取bam中reads在各目标基因组区域的总覆盖度,除以各目标基因组区域的宽度得到各区域的平均深度。
3.根据权利要求1所述方法,其特征在于:s2中使用pca方法以预先建立的正常样本基线去除待测样本中的噪音的具体方法为:预先选择一些高质量的、处理过程与待测样本高度匹配的正常样本构建基线,通过pca降维和寻找最小距离,从正常样本基线中获取与待测样本在深度偏差上最为相似的正常样本,根据它去除待测样本中的噪音并标准化,得到最终log-ratio。
4.根据权利要求1所述方法,其特征在于:s3中使用cbs方法对log-ratio分段的具体方法为:对于每个可能的分割点,计算前后数据的方差比,选择使得方差比最大的分割点作为最佳分割点,在选定的分割点处将数据分成两部分,并对每部分递归地重复上述分割过程,直到满足停止条件。
5.根据权利要求1所述方法,其特征在于:s4中使用基于mcmc的吉布斯采样对数据进行拟合的具体方法为:通过2d网格搜索找到与log-ratio拟合良好的多个肿瘤纯度和倍性组合;在各肿瘤纯度和倍性组合条件下,使用吉布斯采样对每段的拷贝数进行后验概率计算,通过似然性为每段确定拷贝数状态的初始估计,之后通过模拟退火算法为所有段分配拷贝数,同时优化纯度估计。
6.一种基于二代测序技术检测kmt2a基因部分串联重...
【专利技术属性】
技术研发人员:肖敏,向杨,张美兰,沈克锋,吴三云,周涛,张义成,
申请(专利权)人:华中科技大学同济医学院附属同济医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。