基于液相捕获技术判定单基因病相关拷贝数缺失的方法技术

技术编号:17265537 阅读:71 留言:0更新日期:2018-02-14 13:05
本发明专利技术公开了一种基于液相捕获技术判定单基因病相关拷贝数缺失的方法,该方法首先通过归一化测序深度的方法查看捕获的随机性情况,对于归一化后平均深度均值偏离1,且标准差>0.5的文库通过重复建库的方法来排除随机性,然后对于随机性良好的测序文库利用bootstrap重复取样算法,通过对control区域的归一化之后的深度进行多次放回抽样,得到无缺失情况下和缺失情况下的概率密度函数。进一步利用贝叶斯原理计算该片段是否是缺失。本发明专利技术提出的方法可精确检测单基因病中相关的拷贝数缺失,并可确定具体的缺失类型;除了常规的缺失型突变类型,本方法还可以精确判定相关数据库中的所有缺失类型。

Method of determining the missing copy number of mono gene disease based on liquid phase capture

The invention discloses a method based on liquid phase capture technique to determine the single gene disease related method of copy number loss, the method begins by random sequencing methods normalized depth of view capture, for the average depth of the normalized mean deviation of 1, and the standard deviation of 0.5 > the library excluded randomness through repeated construction then, the sequencing library good randomness using bootstrap resampling algorithm, multiple sampling by the control normalized depth, the probability density function obtained by the missing case and the absence of. The Bayesian principle was further used to calculate whether the fragment was missing. The method proposed in this invention can accurately detect the copy number missing in monogenic disease and determine the specific deletion type. In addition to the conventional deletion mutation type, this method can also accurately determine all the missing types in the relevant database.

【技术实现步骤摘要】
基于液相捕获技术判定单基因病相关拷贝数缺失的方法
本专利技术涉及基因组学和分子生物
,尤其涉及一种基于液相捕获技术判定单基因病相关拷贝数缺失的方法。
技术介绍
拷贝数变异(copynumbervariation,CNV)一般是指长度>1kb的基因组大片段拷贝数增加或者减少,主要表现为亚显微水平的缺失、重复或倒位。CNV在遗传病中的作用越来越受到重视,除了与多基因疾病有关外,单基因病相关CNV的遗传效应也更加显著。现有的拷贝数缺失的分析方法中有一种情况是通过对照文库来判定拷贝数缺失的情况,这种方案的问题在于两个不同文库之间的波动性不一致,从DNA样品提取,到PCR扩增,再到上级测序两次实验平行进行,每个过程中的随机性因素的影响都不确定,对于液相芯片,每个探针抓取的DNA片段的丰度也有一定的随机性,现在基于液相捕获芯片的技术多是用于判定SNP的变化,拷贝数缺失的研究一般还是采用gap-PCR的方法,但是这样操作就会导致两次提取DNA的操作,不方便用于临床大规模应用,而且由于PCR只是针对特定基因,其某次实验本身的随机性影响也无法排除。另外,判定拷贝数缺失的试剂盒,如地中海贫血中有广本文档来自技高网...
基于液相捕获技术判定单基因病相关拷贝数缺失的方法

【技术保护点】
一种基于液相捕获技术判定单基因病相关拷贝数缺失的方法,其特征在于,利用bootstrap重复取样算法,通过对control区域多次放回抽样,模拟概率密度函数,并利用贝叶斯原理计算该片段是否是缺失。

【技术特征摘要】
1.一种基于液相捕获技术判定单基因病相关拷贝数缺失的方法,其特征在于,利用bootstrap重复取样算法,通过对control区域多次放回抽样,模拟概率密度函数,并利用贝叶斯原理计算该片段是否是缺失。2.根据权利要求1所述的一种基于液相捕获技术判定单基因病相关拷贝数缺失的方法,其特征在于,方法步骤如下:S1:设计并确定单基因病control区域;S2:提取DNA并进行二代测序;S3:对测序原始下机数据进行数据清洗,去除测序质量低的片段;S4:利用uniquemappedreads确定探针区域内的单个碱基位点的深度;S5:建立样品富集的概率密度函数f(x)和数据量减半的概率密度函数f1/2(x);S6:判别函数的确定:S7:根据S6确定纯合函数为Hom(x),杂合则函数为Het(x),将计算结果累积求和即为样品的判定类型S(x):S(xi)=Hom(xi)+Het(xi)。3.根据权利要求2所述的一种基于液相捕获技术判定单基因病相关拷贝数缺失的方法,其特征在于,所述S1中的探针区域为500-1000个,每个样品的测序深度>100X。4.根据权利要求2所述的一种基于液相捕获技术判定单基因病相关拷贝数缺失的方法,其特征在于,所述S2中每个样品的测序原始数据平均在300X以上。5.根据权利要求2所述的一种基于液相捕获技术判定单基因病相关拷贝数缺失的方法,其特征在于,所述S3中每条测序的reads测序...

【专利技术属性】
技术研发人员:吉冠玉李旭超王君文高飞谢正媛叶汉风吉红玉
申请(专利权)人:深圳市易基因科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1