基于全基因组测序完成待测样本的核型分析的方法、系统和计算机可读介质技术方案

技术编号:32773123 阅读:28 留言:0更新日期:2022-03-23 19:28
本发明专利技术涉及生物信息领域,具体地,本发明专利技术涉及基于全基因组测序完成待测样本的核型分析的方法、系统和计算机可读介质。本发明专利技术提供一种确定待测样本预定染色体变异的方法代替传统的核型分析,采用二代测序和动态cutoff相结合,能够快速、准确地检测CNV大片段,同时根据结果基于染色体核型分析,能够检测与染色体拷贝数变异相关的疾病(如急性髓系白血病、骨髓增生异常综合症),指导治疗和预后。本发明专利技术提供的检测方法灵敏度高,检测限更低,检测结果更准确,通过与预后相关的基因的位置和变异在染色体上的位置注释,能够用于与染色体拷贝数变异相关的疾病的预后。变异相关的疾病的预后。变异相关的疾病的预后。

【技术实现步骤摘要】
基于全基因组测序完成待测样本的核型分析的方法、系统和计算机可读介质


[0001]本专利技术涉及生物信息领域,具体地,本专利技术涉及确定待测样本预定大片段拷贝数(CNA)变异的方法、系统和计算机可读介质。

技术介绍

[0002]急性髓系白血病(AML)也称急性非淋巴细胞白血病(急非淋),是骨髓祖细胞不受控的增殖引起的血液系统恶性肿瘤,其临床发病率较高,复发率高,治愈率低。AML是由获得性髓系定向祖细胞变异引起,以造血干细胞分化受阻、细胞克隆性增值异常以及凋亡抵抗为主要特征。近年来其发病率呈逐年上升趋势,严重威胁着人类的健康,我国已将其列入十大恶性肿瘤之一、由于AML起病急,发病重,病情进展迅速,若延误治疗病人常在半年内死亡,因此对AML的早期诊断和预后监测是提高AML患者生存率的最佳途径。
[0003]骨髓增生异常综合症(myelodysplastic syndrome,MDS)是一组起源于造血髓系定向干细胞或多能干细胞的异质性克隆性疾患,主要特征是无效造血和高危演变为急性髓系白血病,临床表现为贫血,可伴有感染或出血,部分病人可无症状。血本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种确定待测样本预定染色体变异的方法,其特征在于,包括:(1)将所述预定染色体的参考序列进行划分,以便获得窗口序列bins;(2)将来自所述待测样本的测序数据与所述参考序列进行比对,所述测序数据由多个测序读段reads构成,以便确定每个测序读段的位置;(3)基于步骤(2)的比对结果和所述测序读段的位置,分别统计所述多个窗口序列中的每一个窗口中匹配上的读段数目;(4)基于步骤(3)的统计结果,对每个窗口的所述匹配测序读段数目进行过滤和校正,以便获得待测样本的过滤和校正后的测序读段;(5)对步骤(4)所获得的待测样本的过滤和校正后的每个窗口中的测序读段数目进行取对数处理,并减去多个正常样本在同一bins下的测序读段数目的平均值的对数值,以便获得所述窗口的测序读段数目的对数值log R ratio;(6)基于所述待测样本的每个bins的log R ratio,将相邻的且log R ratio值接近或相等的bins连接起来,以便获得多个基因组片段,基于每一个所述基因组片段,获取所述待测样本中每个基因组片段的平均log R ratio值和对应的bins数目;(7)利用所述待测样本中基因组片段的平均log R ratio值和对应的bins数目,获取所述待测样本中所述基因组片段的对应cutoff值;(8)针对所述基因组片段中的每一个,获取所述平均log R ratio值的绝对值与所述cutoff值的绝对值的差值,以便获取待测样本中每一个基因组片段的substract值,其中,所述substract值大于0,是所述待测样本预定染色体具有CNV变异的指示。2.根据权利要求1所述的方法,其特征在于,在步骤(4)中,对每个窗口的所述匹配测序读段数目进行过滤包括保留1%

99%分位数的bins;任选地,所述过滤和校正包括:过滤低质量测序读段和校正测序深度、GC含量、比对率,N比例校正。3.根据权利要求1所述的方法,其特征在于,在步骤(4)中,对每个窗口的所述匹配测序读段数目进行校正进一步包括构建正常对照参考集,所述正常对照参考集通过以下方法获得:采用(1)

(4)相同步骤,获得多个正常样本过滤和校正后的测序读段,以便获得多个正常样本的在每个bins的测序读段数目的平均值的对数值;任选地,所述正常样本的数目不少于20个,且各个正常样本来自于不同的个体;任选地,所述正常样本为没有CNV变异的样本。4.根据权利要求1所述的方法,其特征在于,所述cutoff值为动态cutoff值。5.根据权利要求3所述的方法,其特征在于,在步骤(7)中,利用所述待测样本中基因组片段的平均log R ratio值和对应的bins数目,基于最小二乘法进行曲线拟合,以便获取所述待测样本中所述基因组片段的平均log R ratio值的cutoff值。6.根据权利要求3所述的方法,其特征在于,选取每个基因组片段中深度>4x的已知SNP位点,计算纯合与杂合的数目和比例;并与所述正常对照参考集对比,计算Z

score,其中,杂合位点数目的zscore<

3和杂合/纯合的占比Zscore<

3,则该样本存在获得性杂合性缺失(LOH)。7.根据权利要求1所述的方法,其特征在于,所述待测样本来源于疑似癌症患者。
8.根据权利要求1所述的方法,其特征在于,所述待测样本为血液、脑脊液、体液、尿液、唾液或皮肤。9.根据权利要求1所述的方法,其特征在于,测序数据是通过对血浆游离的DNA进行全基因组建库后,使用二代测序仪测序获得的,平均测序深度为小于0.1X、0.3X、0.5X、1X、2X、3X、4X或5X。10.一种确定待测样本预定染色体变异的系统,其特征在于,包括:窗口划分装置,所述窗口划分装置被配置为适于将所述预定染色体的参考序列进行划分,以便获得窗口序列bins;比对装置,所述比对装置与所述窗口划分装置相连,所述比对装置被配置为适于将来自所述待测样本的测序数据与所述参考序列进行比对,所述测序数据由多个测序读段reads构成,以便确定每个测序读段的位置;统计装置,所述统计装置与所述比对装置相连,所述统计装置被配置为适于基于所述比对装置的比对结果和所述测序读段的位置,分别统计所述多个窗口序列中的每一个窗口中匹配上的读段数目;校正装置,所述校正装置与所述统计装置相连,所述校正装置被配置为适于对每个窗口的所述匹配测序读段数目进行过滤和校正,以便获得待测样本的过滤和校正后的测序读段;取对数装置,所述取对数装置与所述校正装置相连,所述取对数装置被配置为适于对所述校正装...

【专利技术属性】
技术研发人员:李世勇贺翔翔朱丹丹耿帅鹏茅矛李京帅
申请(专利权)人:郑州思勤生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1