一种基于神经架构搜索的作物表型组学分析模型构建方法、电子设备及存储介质技术

技术编号:38548425 阅读:9 留言:0更新日期:2023-08-22 20:56
本发明专利技术公开了一种基于神经架构搜索的作物表型组学分析模型构建方法、电子设备及存储介质,属于作物表型分析技术领域。本发明专利技术先采用神经架构搜索构建单个表型信息分析基础模型集;再使用策略网络调整基础模型的网络权重,并对调整后的基础模型进行自适应微调,得到目标模型覆盖集;采用进化算法对目标模型覆盖集进行优化,选择帕累托最优解,并基于群优化算法优化模型超参数;将最终得到的模型用于作物表型组学分析。本方法能够实现株高、覆盖度及光合效率等表型信息的高通量检测,满足田间作物表型组学研究和分子育种所需的表型分析需求。析需求。析需求。

【技术实现步骤摘要】
一种基于神经架构搜索的作物表型组学分析模型构建方法、电子设备及存储介质


[0001]本专利技术涉及作物表型分析
,更具体地说,尤其涉及一种基于神经架构搜索的作物表型组学分析模型构建方法、电子设备及存储介质。

技术介绍

[0002]作物表型组学在作物育种、栽培及田间管理中被广泛研究,对监测作物生长,分析基因型以及探究环境对植物生长过程的影响具有重要意义。传统的田间作物表型分析主要依靠侵入式人工分析,这种方式对田间作物有着一定的破坏且存在人工消耗大,误差较大等问题。部分表型参数分析需要专业的仪器进行测量,这种仪器往往体积较大、价格昂贵和操作不便。相较于传统的作物表型分析方式,随着遥感技术的发展,无人机因其非侵入式采集且不需要大量的人工参与被广泛应用到田间作物表型数据采集。利用无人机采集到的多源遥感数据,基于机器学习的表型分析模型能够有效提高表型分析的效率以及准确率。然而,训练一个基于机器学习的表型分析模型往往需要大量的已有表型数据,训练数据集的制作需要专业的作物育种与栽培专家进行指导,需要耗费大量的人力和时间。
[0003]目前,自动机器学习(AutoML)能够通过让一些通用步骤(如数据预处理、模型选择和调整超参数)自动化,来简化机器学习中生成模型的过程,其具有代表性的一个方法是神经架构搜索。其中,神经架构搜索方法已被证明在多个领域表现出优于人工搭建网络,如图像分类和语义分割等工作。但在实际的农情信息分析过程中,基于神经架构搜索构建表型分析模型尚存在如下问题:

由于神经架构搜索缺少迁移学习机制,模型构建过程中往往需要从零开始,然而由于神经架构搜索方法的计算过程是复杂且耗时的,因此构建的表型分析模型往往受设备算力限制,且不具有实时性。

传统的神经架构搜索方法通常将问题定义为单目标优化问题,使得搜索工作仅能满足于单个表型分析任务,若实现作物表型组学分析,则需要成倍的分析计算代价。

技术实现思路

[0004]针对目前神经架构搜索仅作为单目标优化分析过程往往仅针对单一表型、难以实现多个表型并行分析的不足,本专利技术提供一种基于神经架构搜索的作物表型组学分析模型构建方法,利用多目标进化算法对搜索过程进行优化,最终构建适用于多种表型并行识别的综合模型,实现田间作物全生育期表型的精准检测,并能够提升田间多源遥感数据高通量采集的准确性与有效性,显著提高作物全生育期表型检测的准确率与鲁棒性。
[0005]为满足上述需求,本专利技术具体采用如下技术方案:
[0006]本专利技术第一方面提供一种基于神经架构搜索的作物表型组学分析模型构建方法,所述方法包括如下步骤:
[0007]S110:获取预定区域同步采集的多源遥感数据,所述多源遥感数据包括可见光数据、多光谱数据、热红外数据以及荧光数据的一种或多种;
[0008]S120:根据待分析的N个作物表型目标分配训练基础模型集所需的训练数据;
[0009]S130:将待分析的N个待分析作物表型分别作为目标,利用神经架构搜索得到每个作物表型分析任务对应的网络模型构建基础模型集,对所述基础模型集中的所有模型进行自适应微调,将微调后的模型构建目标模型覆盖集;
[0010]S140:根据作物表型分析的准确率对目标模型覆盖集中的模型进行非支配排序,对获得的非支配解集进行遗传变异;将产生新的种群组成帕累托解集,构建距离函数以度量帕累托解集中种群距离理想模型最近的模型,获得帕累托解集的最优解;
[0011]S150:对所述最优解的超参数进行优化,并将结果反馈至搜索过程以指导下一轮基础模型的构建,待搜索结束后,得到作物表型组学分析模型。
[0012]作为一个示例,所述步骤S130包括:
[0013]将N个待分析作物表型分别作为目标,将待分析作物表型对应的源域数据视为训练数据,初始化神经架构搜索空间;
[0014]利用神经架构搜索得到每个作物表型分析任务对应的网络模型,将搜索得到的N个网络模型共同构建基础模型集;
[0015]针对每个待分析作物表型目标,将除自身目标外的其他每个表型目标均视为一个独立的目标域,构建自适应微调损失函数;
[0016]寻找所述基础模型集中每个网络模型在各目标域中对应的最佳微调策略,利用每个独立的目标域数据对基础模型集中的每个网络模型进行自适应微调,得到N*(N

1)个目标模型;
[0017]根据微调得到的N*(N

1)个网络模型共同构建目标模型覆盖集。
[0018]作为一个示例,所述自适应微调步骤包括:
[0019]定义策略网络,输入源域数据进行预训练,将预训练的结果作为候选解;
[0020]对所述候选解进行获取采样,根据获取采样结果对于基础模型进行微调决策,并保留权重,所述微调决策包括微调或者冻结。
[0021]作为一个示例,所述获取采样的公式如下:
[0022][0023]式中,α
i
为策略网络输出的标量,α
j
为类别,τ为控制输出离散程度的参数,z为策略网络的层数,G
i
、G
j
为Gumbel分布的噪音,Y
i
表示采样结果。
[0024]针对需要微调的层,将微调过程中的损失函数定义为:
[0025][0026]式中,v
l
表示目标集中用于微调的样本,λ1、λ2表示平衡参数,k表示用于微调的block数,s
j
表示模型预测值,y
j
表示真实值,M表示样本总数,L表示block总数。
[0027]作为一个示例,对获得的非支配解集进行遗传变异步骤包括:
[0028]根据获得非支配排序结果,对所述目标模型覆盖集中的模型进行编码构建父种群;
[0029]将编码后的父种群进行交叉和/或变异,获得子种群;
[0030]将子种群与父种群共同构建新种群。
[0031]作为一个示例,所述将产生新的种群组成帕累托解集,构建距离函数以度量帕累托解集中种群距离理想模型的距离,获得帕累托解集的最优解步骤包括:
[0032]对新种群的模型进行非支配排序,将非支配解形成帕累托前沿面;
[0033]构建距离函数,对帕累托前沿面的个体进行拥挤距离排序,在排序时,先采用最小化曼哈顿距离来寻找最优膝导向;在最优膝距离的基础上,选择拥挤距离大的个体模型作为最优解。
[0034]作为一个示例,基于群优化方法对所述基础模型集和自适应微调时的训练Epoch比值以及训练时的学习率进行优化,在第k+1次迭代时,粒子i位置更新公式为:
[0035][0036]速度更新公式为:
[0037][0038]式中,w为惯性权重(取值范围为[0,1]),指粒子i在第k次迭代中的移动速度,R指在[0,2]范围内随机数,C1、C2为学习因子(取值范围为[0,1]),为粒子i在第k次迭代中的位置,指粒子i在前k次迭本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于神经架构搜索的作物表型组学分析模型构建方法,其特征在于,所述方法包括如下步骤:S110:获取预定区域同步采集的多源遥感数据,所述多源遥感数据包括可见光数据、多光谱数据、热红外数据以及荧光数据的一种或多种;S120:根据待分析的N个作物表型目标分配训练基础模型集所需的训练数据;S130:将待分析的N个待分析作物表型分别作为目标,利用神经架构搜索得到每个作物表型分析任务对应的网络模型构建基础模型集,对所述基础模型集中的所有模型进行自适应微调,将微调后的模型构建目标模型覆盖集;S140:根据作物表型分析的准确率对目标模型覆盖集中的模型进行非支配排序,对获得的非支配解集进行遗传变异;将产生新的种群组成帕累托解集,构建距离函数以度量帕累托解集中种群距离理想模型最近的模型,获得帕累托解集的最优解;S150:对所述最优解的超参数进行优化,并将结果反馈至搜索过程以指导下一轮基础模型的构建,待搜索结束后,得到作物表型组学分析模型。2.根据权利要求1所述一种基于神经架构搜索的作物表型组学分析模型构建方法,其特征在于,所述步骤S130包括:将N个待分析作物表型分别作为目标,将待分析作物表型对应的源域数据视为训练数据,初始化神经架构搜索空间;利用神经架构搜索得到每个作物表型分析任务对应的网络模型,将搜索得到的N个网络模型共同构建基础模型集;针对每个待分析作物表型目标,将除自身目标外的其他每个表型目标均视为一个独立的目标域,构建自适应微调损失函数;寻找所述基础模型集中每个网络模型在各目标域中对应的最佳微调策略,利用每个独立的目标域数据对基础模型集中的每个网络模型进行自适应微调,得到N*(N

1)个目标模型;根据微调得到的N*(N

1)个网络模型共同构建目标模型覆盖集。3.根据权利要求2所述一种基于神经架构搜索的作物表型组学分析模型构建方法,其特征在于,所述自适应微调步骤包括:定义策略网络,输入源域数据进行预训练,将预训练的结果作为候选解;对所述候选解进行获取采样,根据获取采样结果对于基础模型进行微调决策,并保留权重,所述微调决策包括微调或者冻结。4.根据权利要求3所述一种基于神经架构搜索的作物表型组学分析模型构建方法,其特征在于,所述获取采样的公式如下:式中,α
i
为策略网络输出的标量,α
j
为类别,τ为控制输出离散程度的参数,z为策略网络的层数,G
i
、G
j
为Gumbel分布的噪音,Y
i
表示采样结果;针对需要微调的层,将微调过程中的损失函数定义为:
式中,v
l
表示目标集中用于微调的样本,λ1、λ2表示平衡参数,k表示...

【专利技术属性】
技术研发人员:饶元张通查海涅金秀王晓波王玉伟王坦刘路查沛万天与
申请(专利权)人:安徽易刚信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1