一种用于植物工厂作物种植的智能环境控制方法技术

技术编号:34854740 阅读:32 留言:0更新日期:2022-09-08 07:55
本发明专利技术涉及一种用于植物工厂作物种植的智能环境控制方法,包括:用马尔可夫决策过程对作物种植过程进行建模;构建智能环境控制算法的采样经验池,设计植物工厂采样学习策略;设计指导智能环境控制算法的奖励函数;使用智能环境控制算法学习环境控制策略,通过双通路机制输出环境控制策略。本发明专利技术的有益效果是:本发明专利技术提供的环境控制策略考虑了海量组合优化空间,且较为精细,进而植物工厂的环境控制效果较好,作物种植产量提升效果也较好。作物种植产量提升效果也较好。作物种植产量提升效果也较好。

【技术实现步骤摘要】
一种用于植物工厂作物种植的智能环境控制方法


[0001]本专利技术涉及植物工厂环境调控领域,更确切地说,它涉及一种用于植物工厂作物种植的智能环境控制方法。

技术介绍

[0002]近年来,分布不均匀的降水、极端的高温天气以及来自南北极的寒流严重损害了部分地区的农业生产情况,直接导致了粮食的减产与供给不足,故不受外部气候条件影响的的植物工厂成为了保证作物产量的重要手段。通过高精度环境控制让作物种植脱离自然环境的约束,植物工厂涉及多种学科交叉,集生物、材料、农学、计算机科学、人工智能、自动化控制、机械、机器人等技术于一体,实现了周年连续生产的高效农业系统,为我国土地资源需求矛盾提出了新的解决方案。
[0003]但植物工厂作物智能环境控制需要准确刻画植物工厂环境中光照、二氧化碳、温湿度等环境因子及不同营养液配比对作物不同阶段生长发育的影响,进而为作物生长提供最优的环境因子及营养液精准管理策略。与传统设施栽培相比,植物工厂作物主要生理过程与环境因子之间的耦合关系更强。另一方面,由于设施的全封闭,使得原植物的地下部、地上部和小气候环境形成连通的封闭的循环系统,传统刻画环境因子与作物生长关系的生长模型已不能适应植物工厂环境下的作物栽培控制。传统基于经验的设定值控制、模糊控制、环境因子耦合控制等环境控制方法,已经不能满足植物工厂中环境控制的需求。其中基于经验的设定值控制无法应对植物工厂中生产目标的变更,当更换种植作物时需要重新进行控制设计,同时非常依赖于设计控制阈值的专家能力;模糊控制也存在设计缺乏系统性,控制精度低的问题,不能充分利用到植物工厂精准控制的环境控制优势;环境因子耦合控制缺少对于单环境因素调节的能力。

技术实现思路

[0004]本专利技术的目的是克服现有技术中的不足,提供了一种用于植物工厂作物种植的智能环境控制方法,包括:
[0005]S1、根据不同的植物工厂的设计结构和种植作物类别,利用马尔可夫决策过程对作物种植过程进行建模;
[0006]S2、对植物工厂中现有的专家经验策略和种植数据进行整合,构建智能环境控制算法的采样经验池,设计植物工厂采样学习策略;
[0007]S3、确定植物工厂种植目标,并根据所述种植目标,设计指导智能环境控制算法的奖励函数,通过所述奖励函数评估环境控制策略能否实现种植目标;
[0008]S4、使用智能环境控制算法学习环境控制策略,通过双通路机制输出环境控制策略,并根据输出的环境控制策略控制植物工厂的内部环境。
[0009]作为优选,S1包括:
[0010]S101、获取目标植物工厂的状态空间,所述目标植物工厂的状态空间包括目标植
物工厂的环境状态维度及其取值范围、种植相应作物的状态维度及其取值范围;
[0011]S102、获取目标植物工厂的动作空间,所述目标植物工厂的动作空间包括目标植物工厂中的可调环境参数以及其可调幅度;
[0012]S103、将植物工厂环境下作物种植和环境交互过程利用马尔可夫决策过程建模表达。
[0013]作为优选,S2包括:
[0014]S201、根据植物工厂中现有的专家经验策略和种植数据,构建分层采样经验池,将分层采样经验池划分为专家经验层、重点信息经验层和普通信息经验层;
[0015]S202、设计每个经验层数据录入的标准以及最大数据条目容量;
[0016]S203、设计不同层采样经验池的采样概率,确定智能环境控制算法从每个经验层中抽取数据样本进行学习的概率。
[0017]作为优选,S3包括:
[0018]S301、确定主要优化目标以及是否有辅助优化目标,所述主要优化目标包括植物工厂作物的产量优化目标和作物成熟速度的优化目标,拆分大优化任务;
[0019]S302、根据主要优化目标设计主干奖励函数,所述为主干奖励函数为正向奖励函数或负向奖励函数;
[0020]S303、根据不同作物生长的特性,设计辅助奖励函数。
[0021]作为优选,S4包括:
[0022]S401、获取智能环境控制算法学习的环境控制策略,所述智能环境控制算法为支持离线学习且支持连续状态和策略空间优化的算法;
[0023]S402、设计双通路机制,将智能环境控制算法学习的环境控制策略和已有的专家策略进行比对,当差异化小于设定阈值时采纳智能环境控制算法学习的环境控制策略;
[0024]S403、将智能环境控制算法学习的环境控制策略转化为特定植物工厂的控制行为。
[0025]作为优选,S101中,植物工厂的状态空间包括作物状态空间S
crop
和环境状态空间S
env
;所述作物状态空间S
crop
包括作物的表型参数数据,表示为:
[0026](D
H
,D
D
,D
LA
,D
DW
,D
FW
)
[0027]其中,D
H
表示作物植株的高度,D
D
表示作物根茎的深度,D
LA
表示作物叶面积指数的大小,D
DW
表示作物脱水后的干物质重量,D
FW
表示作物的鲜重;
[0028]所述环境状态空间S
env
包括植物工厂的环境状态维度,所述环境状态维度包括湿度、二氧化碳浓度、光照强度、温度和营养液微量元素含量;
[0029]S102中,植物工厂的动作空间还包括用于调控环境的设备以及其调控方式。
[0030]作为优选,S103中,马尔可夫决策过程表示为:
[0031](S,A,P,R,γ)
[0032]其中,S表示状态空间;A表示动作状态空间;P表示状态转移函数;R表示奖励函数;γ表示折扣因子。
[0033]作为优选,S201和S202中,专家经验层中具有至少两个存在差异的完整策略链样本;
[0034]重点信息经验层具有重点信息样本,所述重点信息样本通过是否会带来高额奖励
回报来进行判断,判断标准公式为:
[0035][0036][0037]其中,E表示求期望公式,r
n
表示第n个时刻获得的奖励数值,K表示重点信息经验层中最近存储的重点信息样本的经验轨迹的数量,G
i
表示第i次种植后总累积回报,表示重点信息层中的策略种植得到的平局总奖励。
[0038]作为优选,S203中,设计不同层经验池的采样概率,其中专家经验层采样概率的计算公式为:
[0039][0040]其中,G
Export
表示使用专家经验策略轨迹完成种植得到的平均累计奖励,G
Last
表示当前训练轮次前的K轮训练平均奖励,α
e
为超参数且α
e
∈[0,1]。
[0041]作为优选,S402中,智能环境控制算法学习的环境控制策略和已有的专家策略的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于植物工厂作物种植的智能环境控制方法,其特征在于,包括以下步骤:S1、根据不同的植物工厂的设计结构和种植作物类别,利用马尔可夫决策过程对作物种植过程进行建模;S2、对植物工厂中现有的专家经验策略和种植数据进行整合,构建智能环境控制算法的采样经验池,设计植物工厂采样学习策略;S3、确定植物工厂种植目标,并根据所述种植目标,设计指导智能环境控制算法的奖励函数,通过所述奖励函数评估环境控制策略能否实现种植目标;S4、使用智能环境控制算法学习环境控制策略,通过双通路机制输出环境控制策略,并根据输出的环境控制策略控制植物工厂的内部环境。2.根据权利要求1所述的用于植物工厂作物种植的智能环境控制方法,其特征在于,S1包括:S101、获取目标植物工厂的状态空间,所述目标植物工厂的状态空间包括目标植物工厂的环境状态维度及其取值范围、种植相应作物的状态维度及其取值范围;S102、获取目标植物工厂的动作空间,所述目标植物工厂的动作空间包括目标植物工厂中的可调环境参数以及其可调幅度;S103、将植物工厂环境下作物种植和环境交互过程利用马尔可夫决策过程建模表达。3.根据权利要求1所述的用于植物工厂作物种植的智能环境控制方法,其特征在于,S2包括:S201、根据植物工厂中现有的专家经验策略和种植数据,构建分层采样经验池,将分层采样经验池划分为专家经验层、重点信息经验层和普通信息经验层;S202、设计每个经验层数据录入的标准以及最大数据条目容量;S203、设计不同层采样经验池的采样概率,确定智能环境控制算法从每个经验层中抽取数据样本进行学习的概率。4.根据权利要求1所述的用于植物工厂作物种植的智能环境控制方法,其特征在于,S3包括:S301、确定主要优化目标以及是否有辅助优化目标,所述主要优化目标包括植物工厂作物的产量优化目标和作物成熟速度的优化目标,拆分大优化任务;S302、根据主要优化目标设计主干奖励函数,所述为主干奖励函数为正向奖励函数或负向奖励函数;S303、根据不同作物生长的特性,设计辅助奖励函数。5.根据权利要求1所述的用于植物工厂作物种植的智能环境控制方法,其特征在于,S4包括:S401、获取智能环境控制算法学习的环境控制策略,所述智能环境控制算法为支持离线学习且支持连续状态和策略空间优化的算法;S402、设计双通路机制,将智能环境控制算法学习的环境控制策略和已有的专家策略进行比对,当差异化小于设定阈值时采纳智能环境控制算法学习的环境控制策略;S403、将智能环境控制算法学习的环境控制策略转化为特定植物工厂的控制行为。6.根据权利要求2所述的用于植物工厂作物种植的智能环境控制方法,其特征在于,S101中,植物工厂的状态空间包括作物状态空间S
crop
和环境状态空间S
env...

【专利技术属性】
技术研发人员:陈垣毅王德志闫鹏全郑增威
申请(专利权)人:浙大城市学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1