一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒及方法技术

技术编号:15629440 阅读:185 留言:0更新日期:2017-06-14 13:34
本发明专利技术公开了一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒和方法。该试剂盒包括捕获探针,捕获探针由4个主要探针和相关对照探针组成。4个主要探针为:捕获SMN2基因外显子7的探针,如SEQ ID NO:1所示;捕获SMN2基因外显子7的探针,如SEQ ID NO:2所示;捕获SMN1基因外显子7的探针,如SEQ ID NO:3所示;捕获SMN1基因外显子7的探针,如SEQ ID NO:4所示;捕获探针对目标区域进行捕获,测序,通过本发明专利技术数据分析方法进一步估算SMN1和SMN2基因外显子7的拷贝数。本发明专利技术解决了现有方法测序深度不均一、错误率较高、稳定性不好、通量较小等问题。

【技术实现步骤摘要】
一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒及方法
本专利技术涉及生物医药领域,具体涉及一种检测试剂盒,尤其涉及一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数的检测试剂盒。此外,本专利技术还涉及一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数的检测方法。该方法采用目标区域捕获和二代测序,并涉及数据统计分析用于估算脊髓性肌萎缩症相关基因的拷贝数。
技术介绍
脊髓型肌肉萎缩症(Spinalmuscularatrophy,SMA)是一类由脊髓前角运动神经元退化导致肌萎缩的疾病。根据患者的发病率和临床表现,SMA可分为四类:I型(严重型)、II型(中间型)、III型(轻型)和IV型(成人型)。SMA为常染色体隐性遗传病,发病率为1/5000-1/10000,高居致死性常染色体遗传病的第二位,携带者频率为1/35-1/80。一般正常人的第五号染色体有两个高度同源的运动神经元存活基因(survivalmotorneurongene,SMN),即靠近染色体末端的SMN1基因和靠近着丝粒的SMN2基因。SMN1和SMN2包括9个外显子:1,2a,2b,3~8,但只有外显子7和8上的两个核苷酸(外显子7:c.840C>T,外显子8:c.*239G>A)可以区分SMN1和SMN2。此外,外显子7上下游还各有一个碱基(c.835-44G>A,c.*3+100A>G)可以区分SMN1和SMN2。外显子7上单个碱基的差异影响SMN2基因的RNA剪切,使得转录出来的mRNA缺少外显子7,进而导致翻译出来的蛋白质不稳定。SMN2的主要功能就是对SMN1的有限补偿。95%~98%的患者可以检测出SMN1基因的外显子7发生纯合性缺失(homozygousdeletion),而另外约2.5%的患者是由点突变所导致。SMA携带者只有一个拷贝的SMN1外显子7,虽然自己不会发病,但如果父母双方均为携带者,那么其子代有25%可能性发病。所以,对人SMN1的外显子7拷贝数进行定量检测,有助于临床相关疾病的诊断以及新生儿SMA出生缺陷预防;而SMN2外显子7拷贝数的检测,则有助于判断SMA患者的严重程度,例如SMN2拷贝数大于2的患者的病情相对较轻。目前针对SMN1/2点突变导致脊髓型肌肉萎缩症或其携带者,有专利(专利号CN105112541A)在IonTorrent平台上采用二代测序技术检测SMN1/2上的点突变,但该二代测序方法(扩增子测序)由于PCR的偏好性会导致目标区域的测序深度不均一,且对于碱基多聚体(homopolyer)和插入缺失有较高的测序错误率,因而不能有效地用来检测SMN1/2的拷贝数变异。而针对SMN1外显子缺失的基因检测技术则包括:PCR限制性片段长度多态性(PCR-RFLP,比如文献vanderSteegeG.etc.Lancet.1995,345:985-986)、变性高效液相色谱分析(DHPLC,专利号CN1769486A)、多重连接依赖性探针扩增(MLPA)、定量PCR技术(专利号CN103789440A、CN104480206A)和三代测序(专利号CN104762398A)等。但是,PCR-RFLP只能检测纯合性缺失,而MLPA和定量PCR技术对于存在点突变的样本会造成假阳性结果。而基于三代测序检测SMA拷贝数方法,目前费用较高且通量较小。另外,用于区分SMN1和SMN2外显子7的位点相隔较近(小于200bp),二代测序技术的读长足以用于涵盖这些位点以检测SMN1和SMN2拷贝数变化。2017年,FengYM等人基于杂交捕获和二代测序技术开发了一种SMN1/2拷贝数检测方法(Genet.Med.,2017,doi:10.1038/gim.2016.215)。该方法基于SMN1/2的测序深度和同一批次样本的归一化处理,根据外显子7上的单个碱基(c.840C>T)区分SMN1和SMN2,检测两个基因的拷贝数变异。由于FengYM的方法仅利用一个外显子区域的差异位点,且只使用同一批次的数据对新样本进行结果预测,对于小样本批次的检测准确度会有较大的波动,且不能有效地利用历史累积数据提高检测方法的精确度。本专利技术充分利用基因捕获(genecapture-basedsequencing)的技术克服扩增子测序(AmpliconSequencing)所带来的测序不均一问题,且采用错误率更低、稳定性更好、通量更大的Illumina二代测序平台获取目标基因的序列信息,并结合自己开发的针对脊髓型肌肉萎缩症(SMA)高度同源的两个基因(SMN1和SMN2)的独特算法流程,可有效的检测出SMN1/2的7号外显子的纯合性缺失、杂合性缺失和拷贝数的增多。同时,本专利技术对于SMN1/2的7号外显子拷贝数变化检测,有较高的健壮性、敏感性和特异性。
技术实现思路
本专利技术要解决的技术问题是提供一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒,用于解决现有方法测序深度不均一、错误率较高、稳定性不好、通量较小等问题。为此,本专利技术还提供该基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测方法,用于解决SMN1和SMN2基因高度同源性以及外显子拷贝数变化多样性问题。为解决上述技术问题,本专利技术采用如下技术方案:在本专利技术的一方面,提供本专利技术公开了一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒,包括捕获探针,所述捕获探针由以下4个主要探针和相关对照探针组成;4个主要探针为:用于捕获SMN2基因外显子7的探针一,其序列如SEQIDNO:1所示;用于捕获SMN2基因外显子7的探针二,其序列如SEQIDNO:2所示;用于捕获SMN1基因外显子7的探针三,其序列如SEQIDNO:3所示;用于捕获SMN1基因外显子7的探针四,其序列如SEQIDNO:4所示;所述捕获探针对目标区域进行捕获,测序,通过数据分析估算SMN1基因和SMN2基因外显子7的拷贝数。所述相关对照探针可以为安捷伦ClearSeq探针组(一种捕获试剂)或定制化的探针组等本领域常用对照探针。作为本专利技术优选的技术方案,所述数据分析包括将测序读段使用比对软件比对到人参考基因组、去除重复序列、去除比对结果不可信的读段,计算Z-score,根据Z-score值来估算SMN1基因和SMN2基因外显子7的拷贝数。作为本专利技术优选的技术方案,所述去除重复序列具体使用Picard去除PCR扩增过程产生的重复序列。作为本专利技术优选的技术方案,所述比对结果不可信的读段为不涵盖任何一个如下所述用于区分分配到SMN1和SMN2外显子7的位点的读段:染色体chr5,坐标69372304,SMN2基因,外显子7上游44bp,核苷酸A;染色体chr5,坐标69372353,SMN2基因,外显子7,核苷酸T;染色体chr5,坐标69372501,SMN2基因,外显子7下游100bp,核苷酸G;染色体chr5,坐标70247724,SMN1基因,外显子7上游44bp,核苷酸G;染色体chr5,坐标70247773,SMN1基因,外显子7,核苷酸C;染色体chr5,坐标70247921,SMN1基因,外显子7下游1本文档来自技高网
...
一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒及方法

【技术保护点】
一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒,其特征在于:包括捕获探针,所述捕获探针由以下4个主要探针和相关对照探针组成;4个主要探针为:用于捕获SMN2基因外显子7的探针一,其序列如SEQ ID NO:1所示;用于捕获SMN2基因外显子7的探针二,其序列如SEQ ID NO:2所示;用于捕获SMN1基因外显子7的探针三,其序列如SEQ ID NO:3所示;用于捕获SMN1基因外显子7的探针四,其序列如SEQ ID NO:4所示;所述捕获探针对目标区域进行捕获,测序,通过数据分析估算SMN1基因和SMN2基因外显子7的拷贝数。

【技术特征摘要】
1.一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒,其特征在于:包括捕获探针,所述捕获探针由以下4个主要探针和相关对照探针组成;4个主要探针为:用于捕获SMN2基因外显子7的探针一,其序列如SEQIDNO:1所示;用于捕获SMN2基因外显子7的探针二,其序列如SEQIDNO:2所示;用于捕获SMN1基因外显子7的探针三,其序列如SEQIDNO:3所示;用于捕获SMN1基因外显子7的探针四,其序列如SEQIDNO:4所示;所述捕获探针对目标区域进行捕获,测序,通过数据分析估算SMN1基因和SMN2基因外显子7的拷贝数。2.如权利要求1所述的试剂盒,其特征在于,所述数据分析包括将测序读段使用比对软件比对到人参考基因组、去除重复序列、去除比对结果不可信的读段,计算标准分数Z-score,根据Z-score值来估算SMN1基因和SMN2基因外显子7的拷贝数。3.如权利要求2所述的试剂盒,其特征在于,所述去除重复序列具体使用Picard去除PCR扩增过程产生的重复序列。4.如权利要求2所述的试剂盒,其特征在于,所述比对结果不可信的读段为不涵盖任何一个如下所述用于区分分配到SMN1和SMN2外显子7的位点的读段:染色体chr5,坐标69372304,SMN2基因,外显子7上游44bp,碱基A;染色体chr5,坐标69372353,SMN2基因,外显子7,碱基T;染色体chr5,坐标69372501,SMN2基因,外显子7下游100bp,碱基G;染色体chr5,坐标70247724,SMN1基因,外显子7上游44bp,碱基G;染色体chr5,坐标70247773,SMN1基因,外显子7,碱基C;染色体chr5,坐标70247921,SMN1基因,外显子7下游100bp,碱基A。5.如权利要求2所述的试剂盒,其特征在于,所述计算标准分数Z-score具体包括如下步骤:步骤1,计算覆盖深度:将目标捕获区域划分为固定长度的区间,并计算每个区间的平均覆盖深度;所述覆盖深度是指分配至所述区间的读段数目与该区间大小的比值;步骤2,标准化覆盖深度:标准化是相对于同一个样本所有捕获区间包括SMN1和SMN2外显子7和其它相关对照探针所捕获的区间进行计算的,公式如下:

【专利技术属性】
技术研发人员:孟鑫彭建龙戴珩
申请(专利权)人:明码上海生物科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1