System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于基因聚合数据分析的玉米作物改良方法技术_技高网

一种基于基因聚合数据分析的玉米作物改良方法技术

技术编号:41006159 阅读:4 留言:0更新日期:2024-04-18 21:42
本发明专利技术公开了一种基于基因聚合数据分析的玉米作物改良方法,涉及作物改良技术领域,包括以下步骤:步骤S1、获取与玉米作物基因聚合数据,基因聚合数据包括转录组测序数据和表型数据,并对基因聚合数据进行预处理,步骤S2、将预处理后的基因聚合数据进行分组,分为标准产量最大和最小的样本组。本发明专利技术通过预处理和差异表达分析,可以准确地筛选出与玉米作物目标特性相关的差异基因聚合数据,从而能够快速识别潜在的关键基因,并且加快作物改良的进程,并且通过合并差异基因聚合数据和与目标特性相关的基因聚合数据子集,可以得到一个综合的基因表达集,从而有助于更全面地了解与目标特性相关的基因的表达模式。

【技术实现步骤摘要】

本专利技术涉及作物改良,具体为一种基于基因聚合数据分析的玉米作物改良方法


技术介绍

1、玉米作为重要的粮食作物,在全球范围内被广泛种植和应用,玉米作物改良方法的主要目标包括但不限于提高产量、改善抗逆性(如抗病虫害、耐旱抗涝等)、增强品质(如蛋白质含量、油脂含量、营养价值等)、延长保存期和适应不同环境条件等;

2、传统玉米作物改良方法通常需要进行大量的试验和观察,以便筛选出具有目标特性的个体植株,这一过程耗时且费力,且无法快速获得满足需求的新品种,并且传统玉米作物改良方法通常依赖于育种师的经验和观察,难以准确识别和筛选出关键基因,导致改良过程中可能出现误差和延误,并且传统玉米作物改良方法往往缺乏生物信息学技术的支持,无法全面理解与目标特性相关的基因的表达模式和功能机制,也无法为精确的作物改良策略提供充分的科学依据。


技术实现思路

1、本专利技术的目的在于提供一种基于基因聚合数据分析的玉米作物改良方法,以解决上述
技术介绍
中提出的问题。

2、为实现上述目的,本专利技术提供如下技术方案:一种基于基因聚合数据分析的玉米作物改良方法,包括以下步骤:

3、步骤s1、获取与玉米作物基因聚合数据,基因聚合数据包括转录组测序数据和表型数据,并对基因聚合数据进行预处理;

4、步骤s2、将预处理后的基因聚合数据进行分组,分为标准产量最大和最小的样本组;

5、步骤s3、通过差异表达分析获取两个样本组之间的基因聚合数据差异,从而筛选出与玉米作物目标特性相关的差异基因聚合数据,并通过相关性分析获取与目标特性相关的基因聚合数据子集,将差异基因聚合数据和基因聚合数据子集进行合并,以获取基因表达集;

6、步骤s4、通过基因表达集和玉米作物目标特性的标准产量数据对回归模型进行训练,并通过交叉验证调整回归模型的参数,通过调整回归模型的参数获取回归模型的最小均方误差,在回归模型达到最小均方误差时,获取回归模型的特征参数,并获取特征参数对应的基因表达集,从而获取候选基因集;

7、步骤s5、对候选基因集进行go注释和kegg分析,并基于go注释和kegg分析对玉米作物进行改良。

8、优选的,所述步骤s1中,对基因聚合数据进行预处理,包括以下步骤:

9、步骤a1、对转录组测序数据进行质量控制;

10、步骤a2、获取玉米作物的参考基因组与参考基因组注释文件,基于参考基因组注释文件提取外显子和剪切位点,并基于提取的外显子和剪切位点,使用参考基因组构建索引文件;

11、步骤a3、对转录组测序数据进行基因表达定量;

12、步骤a4、对表型数据中缺失的基因段进行补全;

13、步骤a5、通过最佳线性无偏预测估计测序样本真实的表型数据,其中,最佳线性无偏预测公式具体为:

14、y=xβ+zu+ε

15、其中,y表示n个观测的向量,x表示n×p的已知矩阵,z表示n×q的已知矩阵,μ表示q×1的随机向量,ε表示随机误差项,β表示p×1的未知向量,具体为固定效应部分。

16、优选的,所述步骤a3,对转录组测序数据进行基因表达定量,包括以下步骤:

17、步骤a301、将质控后的转录组测序数据与参考基因组进行比对,以确定每个读段在基因组上的位置;

18、步骤a302、根据比对结果,统计每个基因的读段数目,得到基因表达计数矩阵;

19、步骤a303、采用rpkm标准化方法,将不同基因的表达量转换为相对值,并消除由于基因长度和测序深度的变化而导致的偏差,其中,rpkm标准化公式具体为:

20、

21、其中,nr表示目标基因的读段数量,l表示外显子长度之和,n表示因组的有效读段总量。

22、优选的,所述步骤a5中,最佳线性无偏预测估计采用blup模型。

23、优选的,所述步骤s3,通过差异表达分析获取两个样本组之间的基因聚合数据差异,从而筛选出与玉米作物目标特性相关的差异基因聚合数据,并通过相关性分析获取与目标特性相关的基因聚合数据子集,将差异基因聚合数据和基因聚合数据子集进行合并,以获取基因表达集,包括以下步骤:

24、步骤s301、通过差异表达分析方法,比较两个样本组之间的基因表达差异,从而产生差异基因列表,其中包括在两个样本组之间表达量显著差异的基因;

25、步骤s302、从差异基因列表中筛选出与玉米作物目标特性相关的基因,通过相关性分析方法将差异基因的表达值与目标特性的测量值进行相关性计算,选择与目标特性具有显著相关性的基因;

26、步骤s303、根据相关性分析结果,选择与目标特性高度相关的基因形成基因聚合数据子集;

27、步骤s304、将差异基因聚合数据和基因聚合数据子集合并为基因表达集,从而得到包括与玉米作物目标特性相关的基因的基因表达集。

28、优选的,所述步骤s301中,差异表达分析方法为deseq2方法。

29、优选的,所述步骤s302中,相关性分析方法为pearson相关系数,pearson相关系数具体公式为:

30、

31、其中,ρx,y表示pearson相关系数,cov(x,y)表示x与y间的协方差,σx表示x的标准差,σy表示y的标准差,e(x)表示x的期望,e(y)表示y的期望。

32、优选的,所述步骤s4中,回归模型具体为lasso回归模型,交叉验证具体为k折交叉验证。

33、优选的,所述步骤s4中,最小均方误差具体公式如下:

34、

35、其中,mse表示最小均方误差,n表示样本总数,表示数据的估计值,yi表示数据的实际值。

36、与现有技术相比,本专利技术的有益效果是:

37、1、本专利技术通过预处理和差异表达分析,可以准确地筛选出与玉米作物目标特性相关的差异基因聚合数据,从而能够快速识别潜在的关键基因,并且加快作物改良的进程,并且通过合并差异基因聚合数据和与目标特性相关的基因聚合数据子集,可以得到一个综合的基因表达集,从而有助于更全面地了解与目标特性相关的基因的表达模式,并为后续的功能注释和遗传机制研究提供基础;

38、2、本专利技术通过回归模型训练和参数调整,可以建立一个用于预测玉米作物产量的回归模型,通过最小化均方误差,可以使回归模型更加准确地预测作物的产量,并找到与产量相关的特征参数,从而为作物改良提供指导和决策依据,并且对候选基因集进行go注释和kegg分析可以揭示这些基因在功能和通路上的富集情况,从而进一步理解目标特性的分子机制和生物学过程,为精确的作物改良策略的设计和实施提供重要参考。

本文档来自技高网...

【技术保护点】

1.一种基于基因聚合数据分析的玉米作物改良方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于基因聚合数据分析的玉米作物改良方法,其特征在于:所述步骤S1中,对基因聚合数据进行预处理,包括以下步骤:

3.根据权利要求2所述的一种基于基因聚合数据分析的玉米作物改良方法,其特征在于:所述步骤A3,对转录组测序数据进行基因表达定量,包括以下步骤:

4.根据权利要求2所述的一种基于基因聚合数据分析的玉米作物改良方法,其特征在于:所述步骤A5中,最佳线性无偏预测估计采用BLUP模型。

5.根据权利要求1所述的一种基于基因聚合数据分析的玉米作物改良方法,其特征在于:所述步骤S3,通过差异表达分析获取两个样本组之间的基因聚合数据差异,从而筛选出与玉米作物目标特性相关的差异基因聚合数据,并通过相关性分析获取与目标特性相关的基因聚合数据子集,将差异基因聚合数据和基因聚合数据子集进行合并,以获取基因表达集,包括以下步骤:

6.根据权利要求5所述的一种基于基因聚合数据分析的玉米作物改良方法,其特征在于:所述步骤S301中,差异表达分析方法为DESeq2方法。

7.根据权利要求1所述的一种基于基因聚合数据分析的玉米作物改良方法,其特征在于:所述步骤S302中,相关性分析方法为Pearson相关系数,Pearson相关系数具体公式为:

8.根据权利要求1所述的一种基于基因聚合数据分析的玉米作物改良方法,其特征在于:所述步骤S4中,回归模型具体为Lasso回归模型,交叉验证具体为k折交叉验证。

9.根据权利要求1所述的一种基于基因聚合数据分析的玉米作物改良方法,其特征在于:所述步骤S4中,最小均方误差具体公式如下:

...

【技术特征摘要】

1.一种基于基因聚合数据分析的玉米作物改良方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于基因聚合数据分析的玉米作物改良方法,其特征在于:所述步骤s1中,对基因聚合数据进行预处理,包括以下步骤:

3.根据权利要求2所述的一种基于基因聚合数据分析的玉米作物改良方法,其特征在于:所述步骤a3,对转录组测序数据进行基因表达定量,包括以下步骤:

4.根据权利要求2所述的一种基于基因聚合数据分析的玉米作物改良方法,其特征在于:所述步骤a5中,最佳线性无偏预测估计采用blup模型。

5.根据权利要求1所述的一种基于基因聚合数据分析的玉米作物改良方法,其特征在于:所述步骤s3,通过差异表达分析获取两个样本组之间的基因聚合数据差异,从而筛选出与玉米作物目标特性相关的差异基因聚合数据,并通过相关性分析获...

【专利技术属性】
技术研发人员:吴建忠韩微波孙德全赵茜林红马延华杨国伟范金生高超
申请(专利权)人:黑龙江省农业科学院草业研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1