System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于高通量测序的CNV检测方法、系统、设备及存储介质技术方案_技高网

基于高通量测序的CNV检测方法、系统、设备及存储介质技术方案

技术编号:41289299 阅读:7 留言:0更新日期:2024-05-11 09:38
本发明专利技术公开了基于高通量测序的CNV检测方法、系统、设备及存储介质,其技术方案要点是,获取基因样本的目标区域数据、比对结果数据和SNV变异数据;对目标区域数据进行划分得到多个窗口,根据比对结果数据对窗口进行各个窗口覆盖度计算得到对应的窗口覆盖度,根据窗口覆盖度和预设覆盖度基线得到窗口比值;对窗口进行多次合并分割得到多个目标片段,根据窗口比值对判断是否发生拷贝数变异得到CNV变异结果;根据测序数据的类型判断是否对窗口进行断点检测得到断点CNV结果;根据各个目标片段的窗口比值计算对应的拷贝数,根据SNV变异数据对拷贝数不小于预设阈值的目标片段进行LOH检测得到LOH结果。本发明专利技术能够在降低假阳性的同时保证检出率,避免漏检。

【技术实现步骤摘要】

本专利技术属于生物医学领域,具体涉及一种基于高通量测序的cnv检测方法、系统、设备及存储介质。


技术介绍

1、随着近年来分子检测技术水平的不断发展,高通量测序技术(next-generationsequencing,ngs)作为一种快速、高效、高通量的dna测序技术已广泛应用于临床基因检测领域,为疾病的诊断、治疗和预防提供了更为准确和精细的分子水平的信息。例如在癌症诊断中,高通量测序可以快速、全面地分析肿瘤基因组,包括肿瘤样本中的突变、染色体重排、基因拷贝数变异等,并为肿瘤的诊断、治疗和预后提供依据;在遗传病诊断中,高通量测序技术可以检测单基因遗传病和多基因遗传病等多种遗传疾病,并为遗传咨询、家族规划等提供信息。高通量测序技术可以为个体化医学提供基因组信息,如药物代谢能力、疾病易感性等,为医生制定更加精准的治疗方案提供依据,同时也为研究人员深入了解疾病的发生机制提供了强有力的工具。

2、高通量测序所检测变异类型包括单核苷酸变异(single nucleotide variation,snv)、插入缺失(insertion-deletion,indel)、拷贝数变异(copy number variation,cnv)和结构变异(structural variation,sv)等。其中,cnv是指某一段基因组区域的dna序列重复或缺失,涉及上百万个碱基的缺失或重复,一旦检出致病危害极大。

3、高通量测序数据的基于高通量测序的cnv检测方法通常基于两种基本策略:窗口法和断点法。窗口法将基因组分割成大小相等的连续窗口,并对每个窗口内的测序深度进行平均计算,然后,计算待检测样本的每个窗口与对照样本组的测序深度比值(ratio),若比值高于或低于特定阈值,则该区域被认为是存在cnv的区域。断点法是分析测序数据中序列断点(soft-clipped reads),通过将序列断点重新比对到参考基因组上,然后通过序列重新比对后的位置和方向来确定cnv类型。但是,对于覆盖度低和分布不均衡的数据,窗口法容易产生大量的假阳性变异,断点法的检出率较低,易产生漏检。


技术实现思路

1、本专利技术的目的在于提供一种基于高通量测序的cnv检测方法、系统、设备及存储介质,能够在降低假阳性的同时保证检出率,避免漏检。

2、本专利技术第一方面提供了一种基于高通量测序的cnv检测方法,包括:

3、获取基因样本的测序数据,其中,所述待测序数据包括:目标区域数据、比对结果数据和snv变异数据;

4、根据预设窗口尺寸对所述目标区域数据进行划分得到多个窗口,根据所述比对结果数据对窗口进行各个窗口覆盖度计算得到对应的窗口覆盖度,根据所述窗口覆盖度和预设覆盖度基线得到窗口比值;

5、对所述窗口进行多次合并分割得到多个目标片段,根据所述窗口比值对判断对应的目标片段是否发生拷贝数变异得到cnv变异结果;

6、根据所述测序数据的类型判断是否对所述窗口进行断点检测得到断点cnv结果;

7、根据各个所述目标片段的窗口比值计算对应的拷贝数,根据snv变异数据对拷贝数不小于预设阈值的目标片段进行loh检测得到loh结果。

8、在其中一些实施例中,所述测序数据的类型包括:wgs测序数据、wes测序数据和panel测序数据;所述根据预设窗口尺寸对所述目标区域数据进行划分得到多个窗口,根据所述比对结果数据对各个窗口进行窗口覆盖度计算得到对应的窗口覆盖度,根据所述窗口覆盖度和预设覆盖度基线得到窗口比值,包括:

9、在所述测序数据的类型为wgs测序数据的情况下,对所述目标区域数据采用第一预设窗口尺寸进行划分得到多个窗口;

10、在所述测序数据的类型为wes测序数据的情况下,对所述目标区域数据采用第二预设窗口尺寸进行划分得到多个窗口;

11、在所述测序数据的类型为panel测序数据的情况下,对所述目标区域数据采用第三预设窗口尺寸进行划分得到多个窗口;

12、根据所述比对结果数据统计各个窗口上的读段数量,得到对应的原始覆盖度,在各个所述原始覆盖度上加预设固定值得到窗口覆盖度;

13、将所述测序数据的窗口覆盖度与预设覆盖度基线按中值对齐,将对齐后的窗口覆盖度除以预设覆盖度基线得到对应的比值,对各个比值取log2得到对应的窗口比值。

14、在其中一些实施例中,所述预设覆盖度基线的构建方法,包括:

15、根据所述测序数据的类型选取对应的多例非先证者样本的非先证测序数据,所述先证者样本的非先证测序数据包括:非先证目标区域、非先证比对结果数据和非先证snv变异数据;

16、根据预设窗口尺寸对所述非先证目标区域数据进行划分得到多个非先证窗口,根据所述非先证比对结果数据对各个非先证窗口进行窗口覆盖度计算得到对应的非先证覆盖度;

17、计算所述测序数据对应的窗口覆盖度与各个非先证者样本对应的非先证覆盖度的相关性,选择与所述测序数据相关性最高的预设数量的非先证者样本作为构建预设覆盖度基线的基线样本;

18、将所有基线样本的非先证覆盖度按其中值对齐,将各个非先证窗口对应的对齐后的非先证覆盖度取平均值得到对应的预设覆盖度基线。

19、在其中一些实施例中,所述对所述窗口进行多次合并分割得到多个目标片段,根据所述窗口比值对判断对应的目标片段是否发生拷贝数变异得到cnv变异结果,包括:

20、在所述基因样本的类型为非肿瘤样本的情况下,利用隐马尔可夫模型将所有窗口进行合并,得到多个目标片段组成的全集;

21、对所述全集内的各个目标片段根据其对应的窗口比值判断对应的目标片段是否为重复/缺失的目标片段,所有的重复/缺失的目标片段组成集合ⅰ;

22、对所述集合ⅰ补集内的各个目标片段重新分割得到至少一区间,根据所述区间对应的窗口比值判断对应的区间是否为候选cnv区间,合并重叠的候选cnv区间,得到补充cnv片段,对所述补充cnv片段根据其对应的窗口比值判断对应的补充cnv片段是否为重复/缺失的补充cnv片段,所有的重复/缺失的补充cnv片段和集合ⅰ的并集组成集合ⅱ;

23、对所述集合ⅱ补集内的各个目标片段重新分割得到至少一目标窗口,根据所述目标窗口对应的窗口比值判断是否为候选cnv窗口,根据所述候选cnv窗口及其相邻窗口判断是否合并形成高分辨率cnv片段,所有的高分辨率cnv片段组成集合iii;

24、将所述集合ⅱ内同染色体的相邻目标片段进行合并得到合并片段,对所述合并片段的末端进行修剪得到修剪片段,将所述修剪片段与集合iii中的片段进行合并得到cnv变异片段,也就是得到cnv变异结果。

25、在其中一些实施例中,所述对所述窗口进行多次合并分割得到多个目标片段,根据所述窗口比值对判断对应的目标片段是否发生拷贝数变异得到cnv变异结果,包括:

26、在所述基因样本的类型为肿瘤全外样本的情况下,利用隐马尔可夫模型将所有窗口本文档来自技高网...

【技术保护点】

1.基于高通量测序的CNV检测方法,其特征在于,包括:

2.如权利要求1所述的基于高通量测序的CNV检测方法,其特征在于,所述测序数据的类型包括:WGS测序数据、WES测序数据和Panel测序数据;所述根据预设窗口尺寸对所述目标区域数据进行划分得到多个窗口,根据所述比对结果数据对各个窗口进行窗口覆盖度计算得到对应的窗口覆盖度,根据所述窗口覆盖度和预设覆盖度基线得到窗口比值,包括:

3.如权利要求1所述的基于高通量测序的CNV检测方法,其特征在于,所述预设覆盖度基线的构建方法,包括:

4.如权利要求1所述的基于高通量测序的CNV检测方法,其特征在于,所述对所述窗口进行多次合并分割得到多个目标片段,根据所述窗口比值对判断对应的目标片段是否发生拷贝数变异得到CNV变异结果,包括:

5.如权利要求1所述的基于高通量测序的CNV检测方法,其特征在于,所述对所述窗口进行多次合并分割得到多个目标片段,根据所述窗口比值对判断对应的目标片段是否发生拷贝数变异得到CNV变异结果,包括:

6.如权利要求1所述的基于高通量测序的CNV检测方法,其特征在于,所述对所述窗口进行多次合并分割得到多个目标片段,根据所述窗口比值对判断对应的目标片段是否发生拷贝数变异得到CNV变异结果,包括:

7.如权利要求1所述的基于高通量测序的CNV检测方法,其特征在于,在所述基因样本为肿瘤样本的情况下,在根据各个所述目标片段的窗口比值计算对应的拷贝数之后,还包括:对各个所述目标片段进行窗口比值矫正和拷贝数矫正,所述拷贝数矫正的方法包括:

8.基于高通量测序的CNV检测系统,其特征在于,包括:

9.计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-7中任一项所述的方法的步骤。

10.计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法的步骤。

...

【技术特征摘要】

1.基于高通量测序的cnv检测方法,其特征在于,包括:

2.如权利要求1所述的基于高通量测序的cnv检测方法,其特征在于,所述测序数据的类型包括:wgs测序数据、wes测序数据和panel测序数据;所述根据预设窗口尺寸对所述目标区域数据进行划分得到多个窗口,根据所述比对结果数据对各个窗口进行窗口覆盖度计算得到对应的窗口覆盖度,根据所述窗口覆盖度和预设覆盖度基线得到窗口比值,包括:

3.如权利要求1所述的基于高通量测序的cnv检测方法,其特征在于,所述预设覆盖度基线的构建方法,包括:

4.如权利要求1所述的基于高通量测序的cnv检测方法,其特征在于,所述对所述窗口进行多次合并分割得到多个目标片段,根据所述窗口比值对判断对应的目标片段是否发生拷贝数变异得到cnv变异结果,包括:

5.如权利要求1所述的基于高通量测序的cnv检测方法,其特征在于,所述对所述窗口进行多次合并分割得到多个目标片段,根据所述窗口比值对判断对应的目标片段...

【专利技术属性】
技术研发人员:周洁牟文博方萍汤莎姜轲冉
申请(专利权)人:广州金域医学检验中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1