基于SLAFseq技术的大规模样品基因分型方法技术

技术编号:8678000 阅读:558 留言:0更新日期:2013-05-08 22:31
本发明专利技术提供一种基于SLAF-seq技术进行大规模样品基因分型的方法,其是利用SLAF-seq技术降低基因组的复杂度,并对大规模样品进行基因分型。利用该技术对基因组进行高通量测序,对样品进行标记开发、遗传图谱绘制及全基因组关联分析。该方法与传统的方法相比优点在于通量大幅度提高,成本大幅度降低。该方法主要应用于标记开发、遗传图谱绘制及全基因组关联分析。

【技术实现步骤摘要】

本专利技术提供一种基于SLAF-seq技术的大规模样品基因分型方法,其核心技术是利用SLAF-seq技术降低基因组复杂度并进行高通量测序,进行标记开发、遗传图谱绘制及全基因组关联分析。
技术介绍
随着具有高通量、低成本、测序错误率低、测序读长短特点的新一代测序技术和生物信息学的发展,使得该测序技术进行高通量标记开发成为可能。SLAF-seq (SpecificLength Amplified Fragments sequencing)是一种简化基因组深度测序技术,在高通量测序技术的基础上,利用生物信息学方法对目标物种的参考基因组或已知BAC序列进行系统分析,根据基因组的GC含量、重复序列情况和基因组特点等信息,设计标记开发方案,以保证SLAF标签密度、均匀性、效率和分析的准确性。根据基因组特性,利用SLAF-seq技术对大规模样品进行研究,通过数学算法解决传统方法通量低和准确性不高的问题,提高生物学分析的准确性,降低成本,提高效率。目前还未见利用SLAF-seq技术对大规模样品进行基因分型的报道。
技术实现思路
本专利技术的目的是利用SLAF-seq技术降低基因组复杂度并进行高通量测序的方法,对大规模样品进行研究,通过数学算法解决传统方法通量低和准确性不高的问题,提高生物学分析的准确性,降低成本,提高效率。为了实现本专利技术目的,本专利技术提供基于测序和SLAFseq技术的大规模样品基因分型方法,其基于SLAFseq技术降低基因组复杂度并进行高通量测序,对大规模样品进行标记开发、遗传图谱图谱、单体型图谱绘制及性状关联分析,包括如下步骤:I)对经性状鉴定的各样品的DNA进行检测;2)对样品基因组的复杂性进行降低处理,获得复杂性降低的DNA样品;3 )利用二级引物库中的引物对复杂性降低后的样品DNA进行PCR扩增,使特异性长度片段扩增前后丰度一致;4)将扩增后的特异性长度片段连接标准测序接头,利用高通量测序技术进行测序;5)对于各样品的测序结果进行比较分析,获得SLAF标记,获得各样品的有效序列;进行遗传图谱绘制或全基因组关联 分析。其中步骤I)通过琼脂糖电泳检测各样品DNA主带是否清晰,有无降解和污染,通过微量分光光度计如Nanodrop 2000检测DNA的浓度及纯度。其中步骤5)是对上述SLAF标签进行多态性分析,对存在多态性的标签中的所有样品进行基因分型,并使用自主研发打分体系进行打分,设置阈值,最终获得SLAF标记;通过上述步骤获得的SLAF标记,可用于遗传图谱绘制、全基因组关联分析。前述的基于测序和SLAFseq技术的大规模样品基因分型方法,其中所述大规模样品是植物、动物或微生物。前述的基于测序和SLAFseq技术的大规模样品基因分型方法,其中所述大规模样品为自然群体、遗传分离群体;所述遗传分离群体为经鉴定的性状分离群体,包括F2、BCUDH等目标性状分离的群体。DNA复杂性降低方法是任何有选择性的减少基因组复杂度的方法,包括限制性内切酶酶切产物PCR扩增或酶切产物选择性吸附。其中最佳酶切方案需满足以下条件:a)保证序列标签在基因组上分布尽可能均匀山)选择特定长度的酶切片段能够保证序列标签的数量;c)选择特定长度的酶切片段避免落在基因组高度重复区。其中最佳酶切方案确定需进行预实验,步骤及满足条件如下:1)通过生物信息学模拟,获得广3套候选方案;2)对样品进行酶切连接、PCR扩增及琼脂糖凝胶电泳;3)电泳结果各样品目标范围内无特异条带,且通过BMP图片解析软件如bmp2txt获得电泳胶图上各位点灰度值,利用灰度值模拟模板量进行扩增倍率分析,模板范围扩增倍率一致性高者即为最佳方案。前述的基于测序和SLAFseq技术的大规模样品基因分型方法,其中所述步骤3)二级引物库是为了利用高通量测序特点,节约测序成本,特为大样本量项目设计的扩增引物,后文中称二级引物,所述二级引物差异序列长度为:T7bp,通过生物信息学方法对ATCG组合进行相似性评估,剔除相似度高序列,保 障组合内序列完全识别。所述的二级引物库中的引物序列如SEQ ID NO 4 112所示。前述的基于测序和SLAFseq技术的大规模样品基因分型方法,其中所述二级引物结合Solexa高通量测序标准引物,测序样品数量将以乘积形式增加,如=Solexa引物用12个,二级引物用96个,即可实现I次1152个样品的测序和数据分类需求;前述的基于测序和SLAFseq技术的大规模样品基因分型方法,其中所述步骤4)中Solexa技术是一种基于边合成边测序技术(Sequencing-By-Synthesis, SBS)的新型测序方法。通过利用单分子阵列实现在小型芯片(FlowCell)上进行桥式PCR反应。由于新的可逆阻断技术可以实现每次只合成一个碱基,并标记荧光基团,再利用相应的激光激发荧光基团,捕获激发光,从而读取碱基信息。前述的基于测序和SLAFseq技术的大规模样品基因分型方法,其中所述步骤4)中双端测序的优势如下:a)相对于单端测序,双端测序序列有效长度增倍,标记比对、定位更为准确;b) _■级引物序列测序重复I次,提闻喊基准确性,喊基错误率由0.01降低到0.0001。前述步骤4)的标准测序接头为:5,-GATCGGAAGAGCACACGTCT-3,5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’ 前述的基于测序和 SLAFseq 技术的大规模样品基因分型方法,其中打分体系对SLAF标记分型结果给出基于SNP和深度观测的条件错误率,错误率的计算使用贝叶斯公式,具体方法如下:1)假设某一标记位点有m个等位基因,记为{Al,A2,…Am},则对特定个体而言,在该位点所有可能的分型种类有mX (m+1)/2种,每种基因型的先验概率为该基因型出现的理论频率,因此纯合基因型先验概率为1/πΓ2,杂合基因型先验概率为2/πΓ2;对于二倍体物种,单次测序杂合基因型两个等位基因Ai,Aj间因测序错误产生交换的概率计算如下:本文档来自技高网...

【技术保护点】
基于SLAFseq的大规模样品基因分型方法,其基于SLAFseq技术降低基因组复杂度并进行高通量测序,对大规模样品进行标记开发及遗传图谱绘制、全基因组关联分析,包括如下步骤:1)对经性状鉴定的各样品的DNA进行检测;2)对样品基因组的复杂性进行降低处理,获得复杂性降低的DNA样品;3)利用二级引物库中的引物对复杂性降低后的样品DNA进行PCR扩增,使特异性长度片段扩增前后丰度一致;4)将扩增后的特异性长度片段连接标准测序接头,利用高通量测序方式进行测序;5)比较测序结果,获得SLAF标记,进行遗传图谱绘制或全基因组关联分析。

【技术特征摘要】
1.于SLAFseq的大规模样品基因分型方法,其基于SLAFseq技术降低基因组复杂度并进行高通量测序,对大规模样品进行标记开发及遗传图谱绘制、全基因组关联分析,包括如下步骤: 1)对经性状鉴定的各样品的DNA进行检测; 2)对样品基因组的复杂性进行降低处理,获得复杂性降低的DNA样品; 3)利用二级引物库中的引物对复杂性降低后的样品DNA进行PCR扩增,使特异性长度片段扩增前后丰度一致; 4)将扩增后的特异性长度片段连接标准测序接头,利用高通量测序方式进行测序; 5)比较测序结果,获得SLAF标记,进行遗传图谱绘制或全基因组关联分析。2.权利要求1所述的方法,其特征在于,大规模样品来自动物、植物或微生物。3.权利要求1所述的方法,其特征在于,所述样品为自然群体或遗传分离群体;所述遗传分离群体为经鉴定的性状分离群体,包括F2、BCl、DH等目标性状分离的群体。4.权利要求1所述的方法,其特征在于,步骤2)中DNA复杂性降低方法是任何有选择性的减少基因组复杂度的方法,包括限制性内切酶酶切产物PCR扩增或酶切产物选择性吸附。5.权利要...

【专利技术属性】
技术研发人员:郑洪坤
申请(专利权)人:北京百迈客生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1