一种单倍型的构建方法技术

技术编号:32850454 阅读:11 留言:0更新日期:2022-03-30 19:04
本发明专利技术涉及分子生物学技术领域,特别是涉及一种单倍型的构建方法,所述构建方法包括以下步骤:针对目的基因设计多对PCR引物,以使扩增后相邻两条PCR产物具有重叠区域,且所有PCR产物能完全覆盖目的基因;利用设计的PCR引物扩增目的基因;以扩增得到的所有PCR产物为模板进行长读长二代测序文库构建并上机测序;数据分析:通过组装获得目的基因的单倍型信息。可以利用现有的长读长二代测序技术实现目标区域的靶向单倍型检测,极大地提高现有的长读长二代测序技术的应用范围;此外,也在靶向测序领域实现了单倍型检测的可能;以更低的成本实现靶向基因组单倍型检测,且准确率达到了100%。100%。

【技术实现步骤摘要】
一种单倍型的构建方法


[0001]本专利技术涉及分子生物学
,特别是涉及一种单倍型的构建方法。

技术介绍

[0002]人是二倍体生物,即含有两组染色体,单组染色体即为单倍体。在单倍体中,紧密连锁的多个等位基因的线性组合,每种组合方式即为一种单倍型。单倍型可以由多个SNP位点构成,包含丰富的遗传信息,研究单倍型比单个SNP位点具有更好的分析效果,更能有效反映出疾病的遗传机制,其在遗传病检测领域有着广泛的需求。
[0003]遗传信息的变异是所有基因组的共同特征,而单碱基对的差异,也称单核苷酸多态性(SNP)是变异中最常见的一种形式,占所有已知多态性的90%以上。SNP位点并不是独立遗传的,而是在染色体上成组地遗传。一般来说,一个SNP位点只有两种等位基因,因此又叫双等位基因。单核苷酸多态性是研究人类家族和动植物品系遗传变异的重要依据,因此被广泛用于群体遗传学研究和疾病相关基因的研究,在药物基因组学、诊断学和生物医学研究中起重要作用。
[0004]基因分型(Phasing)还称为基因定相、单倍体分型或单倍体构建。基因分型是指把二倍体(甚至是多倍体)基因组上的等位基因(包括杂合位点,例如SNP),按照其亲本正确地定位到父亲或者母亲的染色体上,最终使得所有来自同一个亲本的等位基因都能够排列在同一条染色体里。现有的NGS测序技术都是把序列打乱混在一起测序。这种方法无法直接区分这些序列中哪一个是父源,哪一个是母源的。通常只能检测出基因组上有哪些变异,以及这些变异的碱基组成(纯合、杂合),也就是平时所说的基因型。只有经过基因分型,才能够实现这个基因型的区分。
[0005]目前已有成熟的长读长二代测序技术应用于基因分型(或称单倍型构建),如TELL-Seq、stLFR、10
×
genomics等。通过将来自同一长片段模板具有相同标签的reads进行连接,输出长的linked-reads,颠覆了二代测序短读长的限制,最终数据中拼接出的原始模板长度可达几百kbp甚至几Mbp,可以实现单倍型构建。
[0006]stLFR技术和TELL-Seq技术一样,都是利用了特殊的手段利用高通量测序来实现“长读长”。解决了高通量测序读长短的缺陷,相对于三代测序有更低的成本和更高的测序准确率。然而,这些技术目前都只针对全基因组或者较大基因组的检测,并不适用于对较小基因组进行靶向检测,且对目标DNA的完整性有比较高的要求,特别是长度的要求至少在20KB以上,适用范围非常有限。而常规的靶向测序方法,包括多重PCR法和探针捕获法,因其本身技术原理和测序平台限制,都无法提供长距离的单倍型信息。

技术实现思路

[0007]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种单倍型的构建方法,用于解决现有技术中的问题。
[0008]为实现上述目的及其他相关目的,本专利技术提供一种单倍型的构建方法,所述构建
方法包括以下步骤:
[0009]1)针对目的基因设计多对PCR引物,以使扩增后相邻两条PCR产物具有重叠区域,且所有PCR产物能完全覆盖目的基因;
[0010]2)利用步骤1)的PCR引物扩增目的基因;
[0011]3)以扩增得到的所有PCR产物为模板进行长读长二代测序文库构建并上机测序;
[0012]4)数据分析:通过组装获得目的基因的单倍型信息。
[0013]如上所述,本专利技术的单倍型的构建方法,具有以下有益效果:可以利用现有的长读长二代测序技术实现目标区域的靶向单倍型检测,极大地提高现有的长读长二代测序技术的应用范围;此外,也在靶向测序领域实现了单倍型检测的可能;以更低的成本实现靶向基因组单倍型检测,且准确率达到了100%。
附图说明
[0014]图1显示为本专利技术的PCR产物电泳图。
[0015]图2显示为本专利技术的HBB-ZK-pool1质控PCR产物电泳结果。
[0016]图3显示为本专利技术的HBB-ZK-pool2质控PCR产物电泳结果。
[0017]图4显示为本专利技术的F1文库片段分析图。
[0018]图5显示为本专利技术的M1文库片段分析图。
[0019]图6显示为本专利技术的F2文库片段分析图。
[0020]图7显示为本专利技术的M2文库片段分析图。
[0021]图8显示为本专利技术的NA12878文库片段分析图。
[0022]图9显示为本专利技术的单倍型构建方法的流程图。
具体实施方式
[0023]靶向测序是检测特定基因集或基因组区域内已知或新型变异的方法。根据具体的规模,可采用不同DNA测序方法进行基因测序。例如,高度靶向单基因的测序方法精确、快速,Sanger测序即可实现。
[0024]本专利技术提供一种单倍型的构建方法,所述构建方法包括以下步骤:
[0025]1)针对目的基因设计多对PCR引物,以使扩增后相邻两条PCR产物具有重叠区域,且所有PCR产物能完全覆盖目的基因;
[0026]2)利用步骤1)的PCR引物扩增目的基因;
[0027]3)以扩增得到的所有PCR产物为模板进行长读长二代测序文库构建并上机测序;
[0028]4)数据分析:通过组装获得目的基因的单倍型信息。
[0029]在一种实施例中,设计PCR引物所针对的目的基因包括:目的基因的基因组区域及基因组上下游区域。
[0030]在一种实施例中,设计PCR引物所针对的目的基因包括:基因组区域及基因组上下游各10~200kb的区域。例如,可以选自以下任一范围:10~60kb、60~110kb、110~160kb、160~200kb。
[0031]具体的,各PCR产物长度可以一致也可以不一致。较佳的,各PCR产物长度一致。一致的PCR产物长度不仅可以统一PCR扩增的条件;而且在建库阶段一致的起始DNA长度更有
利于产生均一的文库长度,也有利于数据分析阶段单倍型的拼接。
[0032]在一种实施例中,每一对引物的扩增长度至少为17kb。
[0033]在一较佳实施例中,PCR产物长度为18~22kb。较长的PCR产物可提高后续的建库质量和最终的实验效果。
[0034]由于较小的基因组不在长读长二代测序建库试剂盒的检测范围内,而且长读长二代测序技术本身也不能实现靶向建库。另外,SNP位点少或太短的基因组不能满足单倍型构建的要求,所以要用长读长二代测序技术实现单基因的靶向单倍型构建,需要有足够的SNP位点以及满足长读长二代测序建库的起始DNA长度要求。为此,设计引物时需要覆盖基因组及其上下游区域,每一对引物的扩增长度至少为17kb。
[0035]具体的,引物的对数取决于目标基因的大小。
[0036]在一种实施例中,相邻两个PCR产物有1-10kb的重叠区域。例如1-3kb,3-5kb,5-8kb,8-10kb的重叠区域。相邻两个PCR产物的重叠区域用于单倍型组装。
[0037]本专利技术中的PCR引物的设计方法为本领域技术人员均了本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种单倍型的构建方法,其特征在于,所述构建方法包括以下步骤:1)针对目的基因设计多对PCR引物,以使扩增后相邻两条PCR产物具有重叠区域,且所有PCR产物能完全覆盖目的基因;2)利用步骤1)的PCR引物扩增目的基因;3)以扩增得到的所有PCR产物为模板进行长读长二代测序文库构建并上机测序;4)数据分析获得目的基因的单倍型信息。2.根据权利要求1所述的构建方法,其特征在于,步骤1)中设计PCR引物所针对的目的基因包括:目的基因的基因组区域及基因组上下游区域。3.根据权利要求1所述的构建方法,其特征在于,步骤1)中设计PCR引物所针对的目的基因包括:目的基因的基因组区域及基因组上下游各10~200kb的区域。4.根据权利要求1所述的构建方法,其特征在于,步骤1)中每一对引物扩增的PCR产物的理论长度至少为17kb;优选的,PCR产物的理论...

【专利技术属性】
技术研发人员:杨敬敏唐嘉婕徐辉卢大儒高鹏飞徐张蓝
申请(专利权)人:上海韦翰斯生物医药科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1