一种基于片段分析技术的拷贝数变异通用验证方法技术

技术编号:24325424 阅读:30 留言:0更新日期:2020-05-29 17:57
本发明专利技术涉及生物技术领域,公开了一种基于片段分析技术的拷贝数变异(CNV)通用验证方法:包括用于构建多重内标测量系统(MISS)的多态性遗传标记筛选原则;设计用于扩增多态性遗传标记的PCR引物和CNV区域内的PCR引物;对样本进行扩增并对扩增产物进行毛细管电泳片段分析,得到各个位点的基因型、各扩增产物峰的峰高或峰面积;通过MISS和z检验对CNV拷贝数进行验证。本发明专利技术提供的这种基于片段分析技术的拷贝数变异的验证方法适用于人基因组任意位置CNV的拷贝数验证;用于构建MISS系统的遗传标记与待验证CNV可以连锁也可以不连锁;不受CNV拷贝数是增加还是减少的影响;拷贝数结果基于严格的统计学检验,可靠性更高。

A general verification method of copy number variation based on fragment analysis

【技术实现步骤摘要】
一种基于片段分析技术的拷贝数变异通用验证方法
本专利技术涉及生物
,尤其涉及一种基于片段分析技术的人基因组中拷贝数变异的拷贝数验证方法。
技术介绍
基因组DNA水平的变异研究是人的分子遗传研究的核心问题之一。依据基因变异所涉及人基因组DNA片段的大小,可分为(1)微小变异:通常涉及单个或多个核苷酸的变化;(2)拷贝数变异(CopyNumberVariations,CNVs):通常指长度涉及1kb或以上的DNA片段的缺失(拷贝数减少)、重复(拷贝增加)等;(2)染色体倍型变化:指至少1条或多条染色体数目的变化,如游离型的21三体综合征即是由于21号染色体完整增加了1条所致。其中,CNVs的研究是目前相关研究中的热点之一。在全基因组范围内,传统的高分辨率核型分析技术(Yunis,1978;Trask,2002)可分辨约5Mb以上的拷贝数变化。随着分子生物学技术手段的发展,已出现一些更高通量的基于分子手段的CNVs检测方法,如比较基因组杂交(aCGH)技术、基于单核苷酸多态性的基因芯片技术(ManningandHudgins,2010),以及基于二代测序的CNVs检测方案(CN201680067423.2)。理论上,对于基于高通量分子检测方案所发现的特定区域的CNVs都需要采用不同的技术方案进行验证。用于特定区域的CNVs的验证方案已有多种,包括多重连接探针扩增技术(multiplexligation-dependentprobeamplification,MLPA,Schouten等,2002)以及更为常用的实时荧光定量技术(qPCR)。qPCR需要在CNV区域设计引物与荧光探针,并采用单拷贝的内参基因通过相对定量的方式实现对特定CNV区域拷贝数计数(如申请号为201810096023.5的专利技术)。该方案操作相对简单,但所需要的引物与探针的设计要求较高,尤其是当CNVs区域存在高度同源序列时常导致相应的引物探针无法设计,而无法采用该技术方案。同时,采用实时荧光定量进行CNV拷贝数变异检测时也通常需要制备标准曲线。MLPA是在CNV区域的高度保守区设计两条相邻的探针,在探针杂交后通过连接酶反应进行探针连接,然后通过两条探针末端的公用PCR引物进行扩增,依据信号强度对拷贝数进行相对定量。为了实现相对定量,在MLPA中需要依据其它单拷贝基因的保守区域设计多条参考探针。虽然不同的连接后探针使用公用引物进行扩增,以提供相对一致的扩增效率,但连接效率的差异仍然导致同一个反应内不同连接后探针的PCR扩增峰高存在显著差异,校准CNVs计数的标准差较大,对结果判断造成一定的干扰。同时MLPA的实验操作复杂,需要通过探针杂交、连接酶反应、PCR扩增、毛细管电泳才能实现对特定CNVs拷贝数的检验。近年,也有人提出了利用与CNV区域紧邻的单个多态性位点、通过一代基因测序的方法进行特定区域CNV的验证方案,当基因测序发现该杂合性位点只有一个等位基因时,可提示相应的CNV区域存在拷贝数的丢失(如申请号为201811492690.1的专利技术)。该方法较好地解决了部分CNVs无法采用实时荧光定量PCR方案的问题,同时通过一代基因测序的定性判断可对缺失型CNVs的进行准确判断;但这一方案存在的问题是,一是需要在CNVs与临近区域(小于800bp)要找到合适的多态性位点且该位点在该样本中为杂合状态,二是对于拷贝数增加型的CNVs(重复)则无法采用这一技术方案进行验证。
技术实现思路
本专利技术为解决现有技术中的上述问题提出的一种基于片段分析技术的拷贝数变异通用验证方法。为实现上述目的,本专利技术采用以下技术方案:本专利技术提供了一种基于片段分析技术的拷贝数变异通用验证方法,包括如下步骤:步骤一,在人基因组范围的单拷贝区域筛选n个具有高度多态性的长度多态性遗传标记;并选择特定的已知拷贝数的单拷贝内参基因作为质控位点;步骤二,针对CNV区域和步骤一所筛选的长度多态性遗传标记及质控位点按引物设计基本原则要求设计PCR引物;步骤三,提取基因组DNA,然后对提取的基因组DNA进行PCR扩增;步骤四,对步骤三扩增得到的产物进行毛细管电泳片段分析,得到各个位点的基因型、各扩增产物峰的峰高或峰面积;步骤五,将步骤四测得的峰高通过下式计算待测样本中目标CNV区域拷贝数和质控位点的拷贝数:N=mRR=mRs/Rc(式-1)其中:m为已知的对照样本中目标CNV区域拷贝数;RR为Rs与Rc的比值;下标s指待测样本,下标c指对照样本;h指目标CNV扩增片段的峰高;tH指n个遗传标记全部扩增片段的峰高和;计算质控位点的拷贝数时,上述参数替换为质控位点相应的参数。在这一方案中,R为目标CNV区域扩增片段峰高h与n个遗传标记全部扩增片段峰高和tH的比值,这一比值即为目标CNV区域拷贝数在这一特定多重扩增系统内的一个度量值,这一方案称之为多重内标测量系统(Multipleinternalscalesystem,MISS);在待测样本(sample,s)中这一比值称为Rs,在对照样本(control,c)中这一比值称为Rc,m为已知对照样本中与待测CNV区域同一区域的拷贝数;步骤六,当目标CNV区域拷贝数N不为0时,对步骤五中的待测样本中目标CNV区域拷贝数和质控位点的拷贝数N进行z检验:当N=0时,可依据目标CNV区域扩增片段的峰高h=0(即未出现CNV区域的扩增产物峰)进行定性判断,对这一定性判断结果不需要进行z检验;当N不为0时,采用下述方法构建统计量z进行检验:在n个遗传标记中,设第i个遗传标记全部扩增片段(每一遗传标记的扩增片段只有1个或2个,仅有1个扩增峰时为纯合型,有2个长度不等的扩增峰时为杂合型)的峰高和为Hi,n个遗传标记全部扩增片段的峰高和记为tH,计算二者之比,记为Ri,此比值即依据MISS系统对各个已知拷贝数(拷贝数为2)的遗传标记峰高值的度量值:计算待测样本s与对照样本c中对应Ri值之比RRi:由于无论是待测样本还是对照样本,n个遗传标记中每一个遗传标记所在区域的拷贝数均为2,在相同的多重PCR扩增体系内,依据相同的MISS系统对各遗传标记的度量值理论上就相等,故n个遗传标记的RR值的理论值均为1。计算n个遗传标记的RRi值的标准差sd:以式-1中的RR值、n个遗传标记的RRi的均值及其标准差sd,以及已知的对照样本中目标CNV区域拷贝数m,构建统计量z:其中,步骤五和步骤六中所出现的峰高可以替换为步骤四中测得的对应峰面积来计算和验证拷贝数变异;在对质控位点的拷贝数进行检验时,相应参数替换为质控位点对应的参数。进一步地,步骤一中长度态性遗传标记的筛选标准如下:(1)长度多态性遗传标记为插入/缺失标记(Insertion/Deletion,InDel)或复等位基因的短串联重复序列(Shorttandemrepeat,本文档来自技高网
...

【技术保护点】
1.一种基于片段分析技术的拷贝数变异的通用验证方法,其特征在于,包括如下步骤:/n步骤一,在人基因组范围的单拷贝区域筛选n个具有高度多态性的长度多态性遗传标记;并选择特定的已知拷贝数的单拷贝内参基因作为质控位点;/n步骤二,针对CNV区域和步骤一所筛选的所述长度多态性遗传标记及质控位点按引物设计基本原则要求设计PCR引物;/n步骤三,提取基因组DNA,然后对提取的所述基因组DNA进行PCR扩增;/n步骤四,对步骤三扩增得到的产物进行毛细管电泳片段分析,得到各个位点的基因型、各扩增产物峰的峰高或峰面积;/n步骤五,将步骤四测得的所述峰高通过下式计算待测样本中目标CNV区域拷贝数和质控位点的拷贝数:/nN=mRR=mR

【技术特征摘要】
1.一种基于片段分析技术的拷贝数变异的通用验证方法,其特征在于,包括如下步骤:
步骤一,在人基因组范围的单拷贝区域筛选n个具有高度多态性的长度多态性遗传标记;并选择特定的已知拷贝数的单拷贝内参基因作为质控位点;
步骤二,针对CNV区域和步骤一所筛选的所述长度多态性遗传标记及质控位点按引物设计基本原则要求设计PCR引物;
步骤三,提取基因组DNA,然后对提取的所述基因组DNA进行PCR扩增;
步骤四,对步骤三扩增得到的产物进行毛细管电泳片段分析,得到各个位点的基因型、各扩增产物峰的峰高或峰面积;
步骤五,将步骤四测得的所述峰高通过下式计算待测样本中目标CNV区域拷贝数和质控位点的拷贝数:
N=mRR=mRs/Rc(式-1)
其中:
m为已知的对照样本中目标CNV区域拷贝数;RR为Rs与Rc的比值;下标s指待测样本,下标c指对照样本;






h指目标CNV扩增片段的峰高;tH指n个遗传标记全部扩增片段的峰高和;
计算质控位点的拷贝数时,上述参数替换为质控位点相应的参数;
步骤六,对步骤五中的待测样本中目标CNV区域拷贝数和质控位点的拷贝数N进行z检验:
当N=0时,可依据目标CNV区域扩增片段的峰高h=0,即未出现CNV区域的扩增产物峰,进行定性判断,对这一定性判断结果不需要进行z检验;当N不为0时,采用下述方法构建统计量z进行检验:
在n个遗传标记中,设第i个遗传标记全部扩增片段的峰高和为Hi,n个遗传标记全部扩增片段的峰高和记为tH,计算二者之比,记为Ri,即:



计算待测样本s与对照样本c中对应Ri值之比RRi:



式-2中下标s与下标c分别指待测样本与对照样本;
计算n个遗传标记的RRi值的标准差sd:



以式-1中的RR值、n个遗传标记的RRi的均值及其标准差sd,以及已知对照样本中目标CNV区域的拷贝数m,构建统计量z:



其中,步骤五和步骤六中所出现的峰高可以替换为步骤四中测得的对应峰面积来计算和验证拷贝数变异;
在对质控位点的拷贝数进行检验时,相应参数替换为质控位点对应的参数。


2.根据权利要求1所述的基于片段分析技术的拷贝数变异的验证方法,其特征在于,步骤一中所述长度态性遗传标记的筛选标准如下:
(1)所述长度多态性遗传标记为插入/缺失标记或复等位基因的短串联重复序列;其中...

【专利技术属性】
技术研发人员:赵书民
申请(专利权)人:上海晶准生物医药有限公司赵书民
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1