System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 美洲黑杨全基因组育种芯片及其构建方法和应用技术_技高网

美洲黑杨全基因组育种芯片及其构建方法和应用技术

技术编号:40397919 阅读:5 留言:0更新日期:2024-02-20 22:25
本发明专利技术公开了美洲黑杨全基因组育种芯片及其构建方法和应用,属于杨树的生物育种领域。本发明专利技术利用大规模杨树群体的全基因组重测序数据鉴定多态位点,并通过设定最大缺失率、最小等位基因频率以及哈德温伯格平衡等检验参数,筛选出具有高质量的SNP位点。利用全基因组关联分析获得与生长材性等重要经济性状显著相关的功能位点,最终开发出适用于杨树重要经济性状的40K SNP育种芯片。本发明专利技术不仅设计了一种高效、低成本、高精度的基因分型芯片,而且显著提高了杨树重要性状的基因组选择育种准确度。因此,本发明专利技术能够提高林木早期选育效率,加速林木良种选育进程,为林木良种选育提供了高效的分子育种技术手段,具有广阔的育种应用前景。

【技术实现步骤摘要】

本专利技术属于杨树的生物育种领域,涉及美洲黑杨全基因组育种芯片及其构建方法和应用


技术介绍

1、林业事关经济社会可持续发展根本,而良种是林业的命脉和促进林业产业发展的原动力。杨树作为全球分布最广、栽培面积最大的速生用材树种之一,因其速生、丰产、易繁殖、适应性强等特征,在我国的林业生产和生态环境建设中发挥着不可或缺的重要作用。此外,作为首个完成全基因组测序的木本植物,杨树完备的全基因组序列为功能基因挖掘和林木遗传育种提供了坚实的基础。

2、由于林木具有世代周期长、近交衰退以及遗传背景复杂等特点,这些因素限制了林木遗传改良的进程,成为提升林木育种效率和加速林木种质创新的瓶颈。突破林木长育种周期瓶颈的关键在于实现从表型选择向基因型选择的转变。林木许多重要经济性状如生长、材性和抗性等属于微效多基因控制的数量性状。随着分子生物学和基因组学的发展,基于分子标记辅助选择(mas)技术的遗传作图和关联分析克服了传统数量遗传学研究方法的局限,显著提高了数量性状基因定位的精准度。在后基因组时代,林木高密度遗传连锁图谱的构建和全基因组关联分析(gwas)为深入揭示林木数量性状的遗传机制奠定了基础,为林木遗传改良和育种提供了重要的基因资源。近年来,高通量测序技术的快速发展以及全基因组水平遗传标记的开发促进了现代选择育种技术的发展。基于经典数量遗传学与分子标记计算育种值的全基因组选择育种技术(gs)能够快速从大量种质资源中选择出具有优异性状的基因型,提高对微效多基因控制复杂性状以及低遗传力性状的选择效率。gs技术在复杂数量性状选育中取得了巨大成功,能够加速育种周期,有助于定向、高效地实现育种改良,成为现代育种的基本方法。

3、开展全基因组选择育种的核心是采用高效且成本较低的全基因组分子标记分型技术。单核苷酸多态性(single nucleotide polymorphism,snp)作为广泛分布于基因组的遗传标记,具备数量众多、遗传稳定性高、多样性丰富、易于检测等特点,成为遗传变异研究中最常见且效果理想的标记类型。全基因组重测序技术能够获得全基因组snp标记,但其高昂的大规模测序分型成本仍然是一个挑战;简化基因组测序技术可以大幅降低分型成本,但只能获取酶切位点附近的标记。snp育种芯片技术以其准确性高和重复率好等特点,在畜牧业和作物育种领域已得到广泛应用。林木全基因组选择技术研发尚处于起步阶段,主要针对林木生长、材性等性状构建gs预测模型,并对影响预测准确性的主要因素开展理论研究,目前尚未见到与林木全基因选择育种芯片相关的报道。


技术实现思路

1、针对现有技术的不足,本专利技术要解决的技术问题是提供一种美洲黑杨全基因组育种芯片,用于筛选杨树速生良种;本专利技术要解决的另外一个技术问题是提供美洲黑杨全基因组育种芯片的构建方法。本专利技术还要解决的另外一个技术问题是提供美洲黑杨全基因组育种芯片的应用。

2、为了解决上述技术问题,本专利技术所采用的技术方案如下:

3、美洲黑杨全基因组育种芯片的构建方法,包括:

4、1)对296株杨树进行基因组重测序和基因分型,获得855,807个高质量的snp位点;

5、2)基于获得的855,807个高质量snp位点,结合296株杨树胸径值、木材密度、纤维素含量、半纤维素含量和木质素含量表型数据,对杨树材性性状进行全基因组关联分析,获得23,791个snp功能位点;

6、3)使用annovar软件对855,807个高质量snp位点进行基因注释和区域筛选,筛选出16,442个snp骨架位点;

7、4)将23,791个snp功能位点和16,442个snp骨架位点合并并筛选,最终得到包含40,213个snp位点的集合,构成了杨树生长材性性状的40k snp育种芯片。

8、步骤1)为采用wgs基因组重测序技术,利用illuminahiseq6000高通量测序平台对296株杨树植株进行了双末端pe150测序;使用bwa工具将测序数据比对到美洲黑杨的参考基因组上,得到bam格式的比对结果;为提高后续变异检测的准确性,对比对结果进行预处理,包括去除pcr重复序列、质量控制、局部重比对、碱基质量值校正;随后使用gatk中的haplotypecaller工具进行了单核苷酸变异和插入/缺失的检测;变异结果首先通过gatk中的variantfiltration工具基于质量和深度指标进行初步过滤,去除假阳性和伪变异;接着,利用plink和vcftools软件对基因型进行严格过滤,其中过滤标准包括测序深度大于3x、完整度大于0.8、最小等位基因频率不低于0.05、缺失率低于20%,以及符合哈迪-温伯格平衡定律;最后,使用beagle软件填充过滤后的基因型数据,以预测可能因测序而丢失的部分单核苷酸多态性位点,并使用annovar软件对这些snp位点进行了注释和功能预测;最终获得了855,807个高质量的snp位点。

9、步骤2)为基于上述获得的855,807个snp变异位点,分别使用plink软件和gemma软件进行主成分分析和亲缘关系分析,得到了所有个体的特征向量pca矩阵和两两个体之间亲缘关系系数kinship矩阵,结合杨树胸径值、木材密度、纤维素含量、半纤维素含量和木质素含量表型数据,利用gemma软件以群体结构作为固定效应,亲缘关系作为随机效应加入到混合线性模型的分析中,获得每个snp与性状的关联p值,根据p值从小到大排序后取前5000个snp位点,合并后获得胸径值、木材密度、纤维素含量、半纤维素含量和木质素含量性状关联的显著snp位点集合,共包含23,791个snp功能位点。

10、步骤3)为使用annovar软件对全基因组上的855,807个snp变异位点进行基因注释和区域筛选,将这些变异位点定位到具体的基因间区、未翻译区、基因上游或下游1kb区域、内含子区域、剪切位点以及外显子区域,其中,外显子区域的snp位点进一步细分为非同义突变、同义突变以及终止密码子获得或丢失变异,在排除与杨树生长材性性状紧密关联的snp位点集后,选择均匀覆盖染色体各个区段的snp位点,并加大外显子区域的非同义突变的snp位点的比重,最终共筛选出16,442个snp骨架位点。

11、步骤4)为将23,791个snp功能位点和16,442个snp骨架位点合并并筛选,最终得到包含40,213个snp位点的集合,构成了杨树生长材性性状的40k snp育种芯片。

12、美洲黑杨全基因组育种芯片的构建方法,具体步骤包括:

13、1)采用wgs基因组重测序技术,利用illuminahiseq6000高通量测序平台对296株杨树植株进行了双末端pe150测序;使用bwa工具将测序数据比对到美洲黑杨的参考基因组上,得到bam格式的比对结果;为提高后续变异检测的准确性,对比对结果进行预处理,包括去除pcr重复序列、质量控制、局部重比对、碱基质量值校正;随后使用gatk中的haplotypecaller工具进行了单核苷酸本文档来自技高网...

【技术保护点】

1.美洲黑杨全基因组育种芯片的构建方法,其特征在于,包括:

2.根据权利要求1所述美洲黑杨全基因组育种芯片的构建方法,其特征在于,步骤1)为采用WGS基因组重测序技术,利用IlluminaHiSeq6000高通量测序平台对296株杨树植株进行了双末端PE150测序;使用BWA工具将测序数据比对到美洲黑杨的参考基因组上,得到BAM格式的比对结果;为提高后续变异检测的准确性,对比对结果进行预处理,包括去除PCR重复序列、质量控制、局部重比对、碱基质量值校正;随后使用GATK中的HaplotypeCaller工具进行了单核苷酸变异和插入/缺失的检测;变异结果首先通过GATK中的VariantFiltration工具基于质量和深度指标进行初步过滤,去除假阳性和伪变异;接着,利用PLINK和VCFtools软件对基因型进行严格过滤,其中过滤标准包括测序深度大于3X、完整度大于0.8、最小等位基因频率不低于0.05、缺失率低于20%,以及符合哈迪-温伯格平衡定律;最后,使用BEAGLE软件填充过滤后的基因型数据,以预测可能因测序而丢失的部分单核苷酸多态性位点,并使用ANNOVAR软件对这些SNP位点进行了注释和功能预测;最终获得了855,807个高质量的SNP位点。

3.根据权利要求1所述美洲黑杨全基因组育种芯片的构建方法,其特征在于,步骤2)为基于上述获得的855,807个SNP变异位点,分别使用PLINK软件和GEMMA软件进行主成分分析和亲缘关系分析,得到了所有个体的特征向量PCA矩阵和两两个体之间亲缘关系系数Kinship矩阵,结合杨树胸径值、木材密度、纤维素含量、半纤维素含量和木质素含量表型数据,利用GEMMA软件以群体结构作为固定效应,亲缘关系作为随机效应加入到混合线性模型的分析中,获得每个SNP与性状的关联P值,根据P值从小到大排序后取前5000个SNP位点,合并后获得胸径值、木材密度、纤维素含量、半纤维素含量和木质素含量性状关联的显著SNP位点集合,共包含23,791个SNP功能位点。

4.根据权利要求1所述美洲黑杨全基因组育种芯片的构建方法,其特征在于,步骤3)为使用ANNOVAR软件对全基因组上的855,807个SNP变异位点进行基因注释和区域筛选,将这些变异位点定位到具体的基因间区、未翻译区、基因上游或下游1kb区域、内含子区域、剪切位点以及外显子区域,其中,外显子区域的SNP位点进一步细分为非同义突变、同义突变以及终止密码子获得或丢失变异,在排除与杨树生长材性性状紧密关联的SNP位点集后,选择均匀覆盖染色体各个区段的SNP位点,并加大外显子区域的非同义突变的SNP位点的比重,最终共筛选出16,442个SNP骨架位点。

5.根据权利要求1所述美洲黑杨全基因组育种芯片的构建方法,其特征在于,步骤4)为将23,791个SNP功能位点和16,442个SNP骨架位点合并并筛选,最终得到包含40,213个SNP位点的集合,构成了杨树生长材性性状的40K SNP育种芯片。

6.根据权利要求1所述美洲黑杨全基因组育种芯片的构建方法,其特征在于,具体步骤包括:

7.根据权利要求1-6任一所述美洲黑杨全基因组育种芯片的构建方法构建得到的美洲黑杨全基因组育种芯片,其特征在于,由40,213个SNP位点组成。

8.用于美洲黑杨速生良种选育的SNP分子标记组合,其特征在于,由40,213个SNP位点组成。

9.权利要求7所述美洲黑杨全基因组育种芯片在美洲黑杨全基因组选择育种中的应用。

10.权利要求7所述的美洲黑杨全基因组育种芯片在美洲黑杨全速生良种选育中的应用。

...

【技术特征摘要】

1.美洲黑杨全基因组育种芯片的构建方法,其特征在于,包括:

2.根据权利要求1所述美洲黑杨全基因组育种芯片的构建方法,其特征在于,步骤1)为采用wgs基因组重测序技术,利用illuminahiseq6000高通量测序平台对296株杨树植株进行了双末端pe150测序;使用bwa工具将测序数据比对到美洲黑杨的参考基因组上,得到bam格式的比对结果;为提高后续变异检测的准确性,对比对结果进行预处理,包括去除pcr重复序列、质量控制、局部重比对、碱基质量值校正;随后使用gatk中的haplotypecaller工具进行了单核苷酸变异和插入/缺失的检测;变异结果首先通过gatk中的variantfiltration工具基于质量和深度指标进行初步过滤,去除假阳性和伪变异;接着,利用plink和vcftools软件对基因型进行严格过滤,其中过滤标准包括测序深度大于3x、完整度大于0.8、最小等位基因频率不低于0.05、缺失率低于20%,以及符合哈迪-温伯格平衡定律;最后,使用beagle软件填充过滤后的基因型数据,以预测可能因测序而丢失的部分单核苷酸多态性位点,并使用annovar软件对这些snp位点进行了注释和功能预测;最终获得了855,807个高质量的snp位点。

3.根据权利要求1所述美洲黑杨全基因组育种芯片的构建方法,其特征在于,步骤2)为基于上述获得的855,807个snp变异位点,分别使用plink软件和gemma软件进行主成分分析和亲缘关系分析,得到了所有个体的特征向量pca矩阵和两两个体之间亲缘关系系数kinship矩阵,结合杨树胸径值、木材密度、纤维素含量、半纤维素含量和木质素含量表型数据,利用gemma软件以群体结构作为固定效应,亲缘关系作为随机效应加入到混合线性模型的分析中,获得每个snp与性状的关...

【专利技术属性】
技术研发人员:韦素云尹佟明郭臣臣吴怀通戴晓港陈赢男
申请(专利权)人:南京林业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1