基于平滑模型的基因组拷贝数变异断点识别方法及系统技术方案

技术编号:43437331 阅读:21 留言:0更新日期:2024-11-27 12:44
本发明专利技术涉及基因测序技术领域,一种基于平滑模型的基因组拷贝数变异断点识别方法及系统,包括:计算待测DNA中每一个待测碱基的碱基测序深度,得到测序深度序列,根据测序深度序列构建测序深度曲线,根据切分位点序列对所测序深度曲线进行切分,得到测序深度曲线序列,利用平滑模型计算测序深度曲线序列的切分平滑值,得到切分平滑值集,识别最佳切分位点序列,根据最佳切分位点序列对所述待测DNA进行切分,得到目标待测DNA集,识别目标待测DNA的目标测序深度,根据目标测序深度对所述目标待测DNA进行基因组拷贝数变异断点识别。本发明专利技术可解决当前对DNA进行测序进而识别基因组拷贝数变异断点的过程存在测序效率低的问题。

【技术实现步骤摘要】

本专利技术涉及基因测序,尤其涉及一种基于平滑模型的基因组拷贝数变异断点识别方法及系统


技术介绍

1、基因组拷贝数变异(copy number variation,简称cnv)是染色体重排的结果,可能会导致一些遗传性疾病,基因组拷贝数变异断点的确切位置能够反映出基因组拷贝数变异断点的长度以及基因组拷贝数变异断点处的基因,这对于研究由基因组拷贝数变异断点导致的疾病的病因很重要。

2、在dna测序过程中,将dna打断成多个dna片段(即reads)进行测序是常见的做法,这主要是为了适应测序仪器的读长限制以及提高测序效率。然而,如何确定适合每个dna片段(reads)的测序深度,从而提高测序效率、节约测序资源显得尤为重要。测序深度(sequencing depth)通常指的是测序得到的碱基总量与基因组大小的比值,它反映的是整个基因组或特定区域被测序的平均次数。由于不同dna片段的碱基类型及碱基顺序不同,因此适合不同dna片段的测序深度也不尽相同,过大的测序深度会导致测序资源的浪费,过小的测序深度会导致测序准确度下降,当前对不同dna片段进行测序时,并本文档来自技高网...

【技术保护点】

1.一种基于平滑模型的基因组拷贝数变异断点识别方法,其特征在于,所述方法包括:

2.如权利要求1所述的基于平滑模型的基因组拷贝数变异断点识别方法,其特征在于,所述根据测序深度序列构建测序深度曲线,包括:

3.如权利要求1所述的基于平滑模型的基因组拷贝数变异断点识别方法,其特征在于,所述根据测序深度指标序列,利用预构建的碱基测序深度公式计算所述待测DNA中每一个待测碱基的碱基测序深度之前,所述方法还包括:

4.如权利要求1所述的基于平滑模型的基因组拷贝数变异断点识别方法,其特征在于,所述在所述切分位点集中选取多组切分位点序列,包括:</p>

5.如权...

【技术特征摘要】

1.一种基于平滑模型的基因组拷贝数变异断点识别方法,其特征在于,所述方法包括:

2.如权利要求1所述的基于平滑模型的基因组拷贝数变异断点识别方法,其特征在于,所述根据测序深度序列构建测序深度曲线,包括:

3.如权利要求1所述的基于平滑模型的基因组拷贝数变异断点识别方法,其特征在于,所述根据测序深度指标序列,利用预构建的碱基测序深度公式计算所述待测dna中每一个待测碱基的碱基测序深度之前,所述方法还包括:

4.如权利要求1所述的基于平滑模型的基因组拷贝数变异断点识别方法,其特征在于,所述在所述切分位点集中选取多组切分位点序列,包括:

5.如权利要求4所述的基于平滑模型的基因组拷贝数变异断点识别方法,其特征在于,所述根据序列位点数在所述原始切分位点序列中选取目标...

【专利技术属性】
技术研发人员:蒋宇林郝娜李萌萌张晗喆阴凯丽
申请(专利权)人:中国医学科学院北京协和医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1