一种基于探针叠加检测基因拷贝数变异的方法及装置制造方法及图纸

技术编号:33251014 阅读:17 留言:0更新日期:2022-04-27 18:13
一种基于探针叠加检测基因拷贝数变异的方法及装置,该方法包括:叠加步骤,包括将至少两种探针集的捕获区域叠加,获得叠加区文件、非叠加区文件;有效深度比计算步骤,包括根据待测样本测序数据比对文件、叠加区文件、非叠加区文件,获得有效深度比;基线构建步骤,包括根据有效深度比及其对应的比对文件,获得多种有效深度比的基线库;基因拷贝数变异分析步骤,包括根据比对得到的比对文件,分析待测样本的有效深度比,在基线库中选择最近的基线,分析得到待测样本的基因拷贝数变异信息。本发明专利技术基于叠加探针捕获数据,分析叠加区/非叠加区的测序有效深度比,利用有效深度比构建基线,达到基于叠加探针分析基因拷贝数变异的目的。的。

【技术实现步骤摘要】
一种基于探针叠加检测基因拷贝数变异的方法及装置


[0001]本专利技术涉及生物信息学领域,具体涉及一种基于探针叠加检测基因拷贝数变异的方法及装置。

技术介绍

[0002]拷贝数变异(Copy Number Variations,CNVs)泛指DNA拷贝数的变化,根据大小可分为两个层次:显微水平和亚显微水平,显微水平的基因组结构变异主要是指显微镜下可见的染色体畸形,包括整倍体和非整倍体的缺失、插入等;亚显微水平的基因组结构变异指DNA片段长度在1kb~3kb的基因组结构变异,包括缺失、重复、DNA拷贝数变化等,这些统称为CNVs,也称为拷贝数多态性(Copy Number Polymorphisms,CNPs)。经大量研究表明,CN V位点的突变率远高于SNP(Single nucleotide polymorphism,单核苷酸多态性),是人类疾病的重要致病因素之一。CNV的分析对疾病的分类、用药、预后等临床管理提供指导,对研究疾病发生机制的过程中具有重要的意义。
[0003]目前检测CNV的方法主要包括芯片技术(Panel)、PCR、荧光原位杂交(FISH)等,其中Panel的检测方法最为常见突出。其中FISH的检测范围较小,只能检测已知位点,价格也偏高;而Panel覆盖全面,具备快速准确的高性价比。对CNV的分析,也存在多种分析策略,经典策略包括:Read

pair、split

read、read

depth和assembly;Read

pair是较早出现的分析算法,利用双端测序插入片段长度分布来检测CNV,当插入片段长度过长或过短时,说明相对参考基因组来说,发生了插入或缺失,该方法存在的显著缺陷是会受到测序读长的影响;read

depth的原理是基于检测区域拷贝数和测序深度的相关性分析,该方法需要与基线进行比较分析,以确保对CNV的判断更为合理准确。同时,针对最为常见的Panel的检测方法,主流的分析策略是read

depth的方法。
[0004]然而,当应用多种Panel共同用于捕获DNA时,现有技术中没有有效的分析CNV的方法可参考使用,对多探针捕获的共有区域和非共有区域的CNV检测如何更准确的判断,是目前分析策略的缺失。

技术实现思路

[0005]根据第一方面,在一实施例中,提供一种基于探针叠加检测基因拷贝数变异的方法,包括:
[0006]叠加步骤,包括将至少两种探针集的捕获区域叠加,获得叠加区文件以及非叠加区文件;
[0007]有效深度比计算步骤,包括根据所述至少两种探针集捕获测序得到的待测样本测序数据比对文件、所述叠加区文件、非叠加区文件,进行分析计算,获得叠加区与非叠加区的有效深度比;
[0008]基线构建步骤,包括根据所述有效深度比及其对应的比对文件,获得多种有效深度比的基线库;
[0009]基因拷贝数变异分析步骤,包括根据比对得到的比对文件,分析得到待测样本的有效深度比,根据所述待测样本的有效深度比,在所述基线库中选择最近的基线,分析得到所述待测样本的基因拷贝数变异信息。
[0010]根据第二方面,在一实施例中,提供一种基于探针叠加检测基因拷贝数变异的装置,包括:
[0011]叠加模块,用于将至少两种探针集的捕获区域叠加,获得叠加区文件以及非叠加区文件;
[0012]有效深度比计算模块,用于根据所述至少两种探针集捕获测序得到的待测样本测序数据比对文件、所述叠加区、非叠加区,进行分析计算,获得叠加区、非叠加区的有效深度比;
[0013]基线构建模块,用于根据所述有效深度比及其对应的比对文件,获得多种有效深度比的基线库;
[0014]基因拷贝数变异分析模块,用于根据比对得到的比对文件,分析待测样本的有效深度比,根据所述待测样本的深度比,在所述基线库中选择最近的基线,分析得到所述待测样本的基因拷贝数变异信息。
[0015]根据第三方面,在一实施例中,提供一种装置,包括:
[0016]存储器,用于存储程序;
[0017]处理器,用于通过执行所述存储器存储的程序以实现如第一方面所述的方法。
[0018]根据第四方面,在一实施例中,提供一种计算机可读存储介质,所述介质上存储有程序,所述程序能够被处理器执行以实现如第一方面所述的方法。
[0019]依据上述实施例的一种基于探针叠加检测基因拷贝数变异的方法及装置,本专利技术基于叠加探针捕获数据,分析叠加区/非叠加区的测序有效深度比,利用有效深度比构建基线,达到基于叠加探针分析基因拷贝数变异的目的。
具体实施方式
[0020]下面通过具体实施方式对本专利技术作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
[0021]另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
[0022]本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。
[0023]如本文所用,“CNV”是指基因拷贝数变异。基因拷贝数变异是由基因组发生重排而
导致的,一般指长度为1kb以上的基因组大片段的拷贝数增加或者减少。
[0024]根据第一方面,在一实施例中,提供一种基于探针叠加检测基因拷贝数变异的方法,包括:
[0025]叠加步骤,包括将至少两种探针集的捕获区域叠加,获得叠加区文件以及非叠加区文件;
[0026]有效深度比计算步骤,包括根据所述至少两种探针集捕获测序得到的待测样本测序数据比对文件、所述叠加区文件、非叠加区文件,进行分析计算,获得叠加区与非叠加区的有效深度比;
[0027]基线构建步骤,包括根据所述有效深度比及其对应的比对文件,获得多种有效深度比的基线库;
[0028]基因拷贝数变异分析步骤,包括根据比对得到的比对文件,分析得到待测样本的有效深度比,根据所述待测样本的有效深度比,在所述基线库中选择最近的基线,分析得到所述待测样本的基因拷贝数变异信息。
[0029]在一实施例中,本专利技术基于叠加探针捕获数据,分析叠加区/非叠加区的测序有效深度比,利本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于探针叠加检测基因拷贝数变异的方法,其特征在于,包括:叠加步骤,包括将至少两种探针集的捕获区域叠加,获得叠加区文件以及非叠加区文件;有效深度比计算步骤,包括根据所述至少两种探针集捕获测序得到的待测样本测序数据比对文件、所述叠加区文件、非叠加区文件,进行分析计算,获得叠加区与非叠加区的有效深度比;基线构建步骤,包括根据所述有效深度比及其对应的比对文件,获得多种有效深度比的基线库;基因拷贝数变异分析步骤,包括根据比对得到的比对文件,分析得到待测样本的有效深度比,根据所述待测样本的有效深度比,在所述基线库中选择最近的基线,分析得到所述待测样本的基因拷贝数变异信息。2.如权利要求1所述的方法,其特征在于,有效深度比计算步骤中,有效深度比=叠加区有效深度/非叠加区有效深度。3.如权利要求1所述的方法,其特征在于,有效深度比计算步骤中,步长为0.1。4.如权利要求1所述的方法,其特征在于,有效深度比计算步骤中,所述比对文件是比对到参考基因组的文件。5.如权利要求4所述的方法,其特征在于,所述参考基因组包含hs37d5基因组、GRCh37基因组、b37基因组、hg18基因组、hg17基因组、hg16基因组或hg38基因组的至少一部分。6.如权利要求1所述的方法,其特征在于,所述基因拷贝数变异信息包括如下信息中的至少一种:发生基因拷贝数变异的状态、发生基因拷贝数变异的区间所在基因、发生基因拷贝数变异的区间在所述基因...

【专利技术属性】
技术研发人员:程海楠邢云方欢张妍刘涛管彦芳
申请(专利权)人:北京吉因加医学检验实验室有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1