基于高通量全基因组测序的多亲本作物基因型鉴定制造技术

技术编号:34377496 阅读:19 留言:0更新日期:2022-08-03 20:48
本发明专利技术提供了基于高通量全基因组测序的多亲本作物基因型鉴定。具体地,包括:(a)对于n个亲本及其子代,提供待鉴定的子代作物的测序数据Df,以及与所述子代作物相应的亲本作物的测序数据Dp,其中n为≥3的正整数;(b)基于所述测序数据Df和所述测序数据Dp,确定亲代和子代的SNP位点信息;(c)基于所述的SNP位点信息,对子代的基因型进行判断,从而获得所述子代的各个SNP的评定结果以及所述子代的全基因组的各染色体上的重组断裂点的分布信息;(d)构建和/或绘制所述子代的基因型图谱,从而获得所述多亲本作物的基因型鉴定结果。本发明专利技术的方法可高通量、快速、准确的对多亲本作物基因型进行鉴定。定。

Genotyping of multi parent crops based on high-throughput whole genome sequencing

【技术实现步骤摘要】
基于高通量全基因组测序的多亲本作物基因型鉴定


[0001]本专利技术涉及生物信息处理
,具体地涉及基于高通量全基因组测序的多亲本作物基因型鉴定。更具体地,本专利技术提供了基于高通量全基因组测序数据对多亲本作物的基因型进行鉴定的方法及装置。

技术介绍

[0002]上世纪末,DNA分子标记的使用极大地促进了反向遗传学的发展。随着分子生物学技术的进步,标记的种类以及构建遗传图谱的方法也在逐步发展和完善。聚合酶链式反应(PCR)的出现,引发了一个分子标记爆炸性应用的时代,因为PCR可以大大简化标记设计和结果分析的实验步骤。这些DNA分子标记依旧在被广泛应用,但是也显示出了在基因组覆盖、时耗以及费用方面的越来越多的局限性。当前,基因组学的发展和相关技术方法的逐渐成熟,为基于基因组的高通量策略替代基于标记的作图方法提供了基础。
[0003]基因组序列打开了高通量基因型鉴定(high

throughput genotyping)的大门。最初这是利用了微阵列芯片技术来完成的,即通过将基因组DNA与基因芯片上的寡聚核苷酸杂交,来检测单核苷酸多态(single nucleotide polymorphisms SNPs)。由于一次杂交就可以检测到数百至数千的标记,这种基因型鉴定的方法充分地提高了效率
[1]。此方法被应用到了一些模式生物系统比如人类、拟南芥与水稻
[2

4]。虽然高通量的目标已经实现了,但是基于微阵列的方法还是具有严重的局限性,例如费力、费时,以及设计、生产和使用微阵列过程中的高昂费用。
[0004]第二代测序技术的出现为基因型鉴定和遗传作图带来了方法学上的跨越式进展。新的测序技术不仅增加了几个数量级的测序通量,还可以允许进行许多个样本的并行测序
[5

6]。这些技术的进步,为以测序为基础的高通量基因型鉴定方法的发展铺平了道路。新的基因型鉴定方法结合了以下优点:快速价廉、高密度标记覆盖、高精确度和高分辨率,同时还适用于更多的作图群体和物种之间的比较基因组和遗传图谱构建。
[0005]虽然已经有一些方法可进行2个亲本植物的基因型鉴定,然而对于涉及3个或更多亲本的多亲本植物基因型鉴定,目前的方法存在明显不足,例如,精确性较低、分析耗时长等。
[0006]因此,本领域急需提供一种分析快速、结果准确地对涉及3个以上亲本的多亲本植物基因型进行鉴定的方法及装置。

技术实现思路

[0007]本专利技术的目的是提供一种分析快速、结果准确的对多亲本植物基因型进行鉴定的方法及装置,从而可以快速准确可靠地分析多亲本构建的群体基因型。
[0008]在本专利技术第一方面,提供了一种对多亲本植物(如作物)的基因型进行鉴定的方法,其特征在于,所述方法包括:
[0009](a)对于n个亲本及其子代,提供待鉴定的子代植物的测序数据Df,以及与所述子
代植物相应的亲本植物的测序数据Dp,其中n为≥3的正整数;
[0010](b)基于所述测序数据Df和所述测序数据Dp,确定亲代和子代的SNP位点信息;
[0011](c)基于所述的SNP位点信息,对子代的基因型进行判断,从而获得所述子代的各个SNP的评定结果以及所述子代的全基因组的各染色体上的重组断裂点的分布信息;
[0012](d)基于所述子代的SNP评定结果信息和全基因组重组断裂点的位置信息,构建和/或绘制所述子代的基因型图谱,从而获得所述多亲本植物的基因型鉴定结果。
[0013]在另一优选例中,在步骤(c)中,基于SNP“字串”进行重组断裂位点的分析。
[0014]在另一优选例中,步骤(c)中包括对重组断裂位点进行分析,从而获得重组断裂位点的分析结果,
[0015]并且所述的重组断裂位点分析包括:
[0016](s1)构建SNP“字串”,其中将亲本和子代的各条染色体上所有的SNP的基因型按顺序压缩成一个字串;
[0017](s2)按照预定的窗口大小,确定对应于所述SNP字符串的各个滑动窗口,并对每个窗口中的SNP位点进行打分,从而获得所述窗口内对各个亲本的各自得分值P;
[0018](s3)基于(s2)步骤中获得的得分值P,确定对应于子代的各染色体区域的基因型。
[0019]在另一优选例中,在步骤(s1)中,不管相邻两个SNP之间的实际距离有多大,把SNP之间的间隙全部都去除。
[0020]在另一优选例中,在步骤(s1)中,构成字串的SNP为亲本纯合的SNP位点。
[0021]在另一优选例中,在步骤(s1)中,还包括:对纳入分析的SNP位点先进行了初筛,从而排除了任一亲本为杂合的SNP位点。
[0022]在另一优选例中,在步骤(s2)中,按照表A的打分规则进行打分。
[0023]在另一优选例中,在步骤(s3)中,对于子代的各染色体区域,基于各亲本得分值或得分值曲线,确定对应于子代的各染色体区域的基因型。
[0024]在另一优选例中,在步骤(s3)中,基于得分值和标准差,确定各染色体区域的基因型。
[0025]在另一优选例中,对于待判断基因型的染色体区域,如果某一亲本A有接近满分的高得分值(≥80%满分,较佳地≥80%满分),并且该亲本在这一段区域的得分值相当稳定,没有太大的数值波动,而其余亲本的得分值低(≤50%满分,较佳地≤30%满分)或存在大的数值波动,则将该染色体区域的基因型确定为所述亲本A的基因型。
[0026]在另一优选例中,在步骤(s3)中,包括:通过滑动窗口在全基因组SNP位点上的滑动,就可以得到每一条染色体上各个亲本的得分值,并将该分值为纵坐标,以每个滑动窗在染色体上的位置为横坐标,绘制每个亲本的得分曲线。
[0027]在另一优选例中,在步骤(s3)中,包括对评定杂合区域子步骤:
[0028](s3a)对于多亲本的杂交子代,仍设定在某一段染色体区域的亲本来源最多是两个亲本,并基于两个亲本在这段区域的得分曲线来判断出这一段区域是否是杂合区域。
[0029]在另一优选例中,在步骤(s3)中,对子代与各个亲本在这一区段的相似程度进行量化值,根据各个亲本的得分曲线的数值特征(数值高低和标准差),判断各个区段的基因型。
[0030]在另一优选例中,在步骤(s3)中,采用以下方式进行基因型评定:
[0031](Z1)若某一亲本在该区段得分值较高且其分值较为稳定(得分曲线接近平台期),同时其余亲本在该区段的得分曲线有较大的波动,标准差较大(得分曲线为波峰形上下起伏),就判断这一区段为该亲本的纯合基因型;
[0032](Z2)当判断亲本个数为两个时,可以根据两个亲本在某一区段二者都有较大的数值波动,标准差较大,就可以推断该区域为两个亲本的杂合基因型;
[0033]在多亲本判断时候,很可能只能发现到可能的杂合区段,即在某一区段找不到一个高分值且稳定的亲本;因为各个亲本的得分在该区段都有较大的波动,只能根据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对多亲本植物的基因型进行鉴定的方法,其特征在于,所述方法包括:(a)对于n个亲本及其子代,提供待鉴定的子代植物的测序数据Df,以及与所述子代植物相应的亲本植物的测序数据Dp,其中n为≥3的正整数;(b)基于所述测序数据Df和所述测序数据Dp,确定亲代和子代的SNP位点信息;(c)基于所述的SNP位点信息,对子代的基因型进行判断,从而获得所述子代的各个SNP的评定结果以及所述子代的全基因组的各染色体上的重组断裂点的分布信息;(d)基于所述子代的SNP评定结果信息和全基因组重组断裂点的位置信息,构建和/或绘制所述子代的基因型图谱,从而获得所述多亲本植物的基因型鉴定结果。2.如权利要求1所述的方法,其特征在于,在步骤(c)中,基于SNP“字串”进行重组断裂位点的分析。3.如权利要求1所述的方法,其特征在于,步骤(c)中包括对重组断裂位点进行分析,从而获得重组断裂位点的分析结果,并且所述的重组断裂位点分析包括:(s1)构建SNP“字串”,其中将亲本和子代的各条染色体上所有的SNP的基因型按顺序压缩成一个字串;(s2)按照预定的窗口大小,确定对应于所述SNP字符串的各个滑动窗口,并对每个窗口中的SNP位点进行打分,从而获得所述窗口内对各个亲本的各自得分值P;(s3)基于(s2)步骤中获得的得分值P,确定对应于子代的各染色体区域的基因型。4.如权利要求1所述的方法,其特征在于,在步骤(s3)中,对于子代的各染色体区域,基于各亲本得分值或得分值曲线,确定对应于子代的各染色体区域的基因型。5.如权利要求1所述的方法,其特征在于,在步骤(s3)中,包括:通过滑动窗口在全基因组SNP位点上的滑动,就可以得到每一条染色体上各个亲本的得分值,并将该分值为纵坐标,以每个滑动窗在染色体上的位置为横坐标,绘制每个亲本的得分曲线。6.如权利要求1所...

【专利技术属性】
技术研发人员:韩斌朱舟王阿红
申请(专利权)人:中国科学院分子植物科学卓越创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1