深度学习模型预测因素解释方法及其在土壤含水量预测中的应用技术

技术编号:31710678 阅读:21 留言:0更新日期:2022-01-01 11:14
本发明专利技术公开了一种深度学习模型预测因素解释方法及其在土壤含水量预测中的应用。步骤1:对不同预测因素以及目标结果的时间序列数据进行标准化处理;步骤2:基于步骤1中标准化处理后的预测因素以及目标结果数据训练得到深度学习模型,用于预测输出结果的动态变化;步骤3:采用Shapley值方法,计算不同预测因素对于上述构建的深度学习模型的输出结果的贡献度;步骤4:根据步骤三计算出来的各预测因素的贡献度大小,确定深度学习模型中重要的预测因素,去除不重要的影响因素,对不同预测因素数据进行精简。数据进行精简。数据进行精简。

【技术实现步骤摘要】
深度学习模型预测因素解释方法及其在土壤含水量预测中的应用


[0001]本专利技术属于人工智能
,具体涉及一种深度学习模型预测因素解释方法及其在土壤含水量预测中的应用。

技术介绍

[0002]深度学习(Deep Learning)是机器学习(Machine Learning)领域中一个新的研究方向,其通过学习样本数据的内在规律和表示层次,获得的信息对数据进行内部解释,从而让计算机能够像人类一样具有学习、分析与识别等能力。其中,以多层感知机(MLP)、卷积神经网络(CNN)模型最为经典。2010年前后,计算机硬件与计算性能,乃至大数据与互联网+等技术的日益成熟,使得深度学习发展一日千里。目前深度学习模型与框架已经扩展到图像处理、自然语言处理等多个领域,取得了优异的结果。
[0003]深度学习模型大多数具有模型复杂度高、参数多、透明性低的不足,其分析与决策过程的原理如同“黑箱”难以被获得。当下很多应用领域在得到优异分析结果的同时,希望获取模型内在的变化机制。而深度学习模型是通过输入变量直接映射输出结果,这种操作方式无法满足不同领域对内在分析的需求。

技术实现思路

[0004]本专利技术的目的在于克服现有技术的不足,提供一种深度学习模型预测因素解释方法及其在土壤含水量预测中的应用。
[0005]本专利技术是通过以下技术方案实现的:
[0006]一种深度学习模型预测因素解释方法,包括以下步骤:
[0007]步骤1:对不同预测因素以及目标结果的时间序列数据进行标准化处理;r/>[0008]步骤2:基于步骤1中标准化处理后的预测因素以及目标结果数据训练得到深度学习模型,用于预测输出结果的动态变化;
[0009]步骤3:采用Shapley值方法,计算不同预测因素对于上述构建的深度学习模型的输出结果的贡献度;
[0010]步骤4:根据步骤三计算出来的各预测因素的贡献度大小,确定深度学习模型中重要的预测因素,去除不重要的影响因素,对不同预测因素数据进行精简。
[0011]在上述技术方案中,步骤3中,各预测因素的贡献度采用Shapley值方法进行分析,Shapley值是根据预测因素集合S中每个玩家的值函数val定义的,每个预测因素的Shapley值是其对输出结果的贡献,对所有可能的预测因素组合进行加权求和:
[0012][0013]其中,S是应用于所述深度学习模型中的预测因素集合,x是要解释的当前实例的预测因素组成的向量,p是LSTM模型中的预测因素数量,val
x
(S)是对预测因素集合S中的各
预测因素值的预测结果,这些因素从预测因素集合S中未包含的因素边缘化得到:
[0014][0015]对预测因素集合S中未包含的每个因素执行多重集成,是集合X中所有预测因素组成的向量的平均预测值;
[0016]为了计算准确的Shapley值,引入蒙特卡洛近似抽样方法,根据需要计算的因素,选择感兴趣的实例1:x0=(x
(1)


,x
(j)


,x
(p)
);然后依据不同预测因素的数据矩阵,随机选择实例2:z0=(z
(1)


,z
(j)


,z
(p)
);根据实例1和实例2在不同位置的预测因素数值,构建两个新的实例:x
+j
=(x
(1)


,x
(j

1)
,x
(j)
,z
(j+1)


,z
(p)
)和x

j
=(x
(1)


,x
(j

1)
,z
(j)
,z
(j+1)
),

,z
(p)
);根据两个新实例,计算它们在深度学习模型f中的差异平均值,作为当前预测因素的Shapley值,公式如下所示:
[0017][0018]式中,是当前实例x在预测因素组成向量上的预测数值,随机个数的预测因素被随机选择的实例z在对应因素位置上的数值替换,j本身的因素值除外。和之间的差异很小,并且也同样选择于实例z。
[0019]在上述技术方案中,步骤4中,将不同预测因素按照其Shapley值的贡献度大小,由大至小顺序排列,保留排名前N位的预测因素数据,然后对保留的预测因素数据进行标准化处理,输入深度学习模型中进行训练,得到新的深度学习模型。
[0020]在上述技术方案中,深度学习模型采用LSTM模型。
[0021]上述深度学习模型预测因素解释方法应用于土壤含水量预测,包括以下步骤:
[0022]步骤1:将和土壤含水量相关的天气因素作为预测因素,对和土壤含水量相关的天气因素的预测因素以及土壤含水量的目标结果的时间序列数据进行处理;
[0023]步骤2:基于步骤1中标准化处理后的预测因素以及目标结果数据训练得到深度学习模型,用于预测输出结果的动态变化;
[0024]步骤3:采用Shapley值方法,计算不同预测因素对于上述构建的深度学习模型的土壤含水量输出结果的贡献度;
[0025]步骤4:根据步骤三计算出来的各预测因素的贡献度大小,确定深度学习模型中重要的预测因素,去除不重要的影响因素,对不同预测因素数据进行精简。
[0026]在上述技术方案中,和土壤含水量相关的天气因素包括:最大温度、最小温度、平均温度、最大相对湿度、最小相对湿度、蒸汽压差、太阳总辐射、2米的平均风速、长波辐射、短波辐射、实际蒸气压、饱和蒸气压、最大温度饱和水气压、最小温度饱和水气压、蒸气压曲线的斜率、降雨量和蒸发量。
[0027]在上述技术方案中,预测因素以及土壤水含量数据分为训练数据、验证数据以及预测数据三部分,比例为7:1:2;训练数据和验证数据用于训练得到满足一定准确度的LSTM深度学习模型,预测数据用于输入到得到的LSTM深度学习模型中预测土壤含水量的动态变化。
[0028]本专利技术的优点和有益效果为:
[0029]本专利技术能够根据不同预测因素,通过深度学习LSTM时间序列模型,实现对结果变量动态变化的准确分析与预测;同时,利用不同预测因素的Shapley值,在深度学习模型基础上,实现不同情形下的预测因素重要性解释,从而打破传统深度学习模型黑箱处理的方式,使研究者了解模型的内部机制,从而推动相关领域发展。另外,该模型在土壤水含量中的应用,使得研究人员清楚不同情形下的土壤水含量与预测因素的变化机制,以实现该领域科学有效的管理。
附图说明
[0030]图1是深度学习模型预测因素解释方法的整体流程图。
[0031]图2是将深度学习模型预测因素解释方法用于土壤含水量预测实本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种深度学习模型预测因素解释方法,其特征在于,包括以下步骤:步骤1:对不同预测因素以及目标结果的时间序列数据进行标准化处理;步骤2:基于步骤1中标准化处理后的预测因素以及目标结果数据训练得到深度学习模型,用于预测输出结果的动态变化;步骤3:采用Shapley值方法,计算不同预测因素对于上述构建的深度学习模型的输出结果的贡献度;步骤4:根据步骤三计算出来的各预测因素的贡献度大小,确定深度学习模型中重要的预测因素,去除不重要的影响因素,对不同预测因素数据进行精简。2.根据权利要求1所述的深度学习模型预测因素解释方法,其特征在于:步骤3中,各预测因素的贡献度采用Shapley值方法进行分析,Shapley值是根据预测因素集合S中每个玩家的值函数val定义的,每个预测因素的Shapley值是其对输出结果的贡献,对所有可能的预测因素组合进行加权求和:其中,S是应用于所述深度学习模型中的预测因素集合,x是要解释的当前实例的预测因素组成的向量,p是LSTM模型中的预测因素数量,val
x
(S)是对预测因素集合S中的各预测因素值的预测结果,这些因素从预测因素集合S中未包含的因素边缘化得到:对预测因素集合S中未包含的每个因素执行多重集成,是集合X中所有预测因素组成的向量的平均预测值;为了计算准确的Shapley值,引入蒙特卡洛近似抽样方法,根据需要计算的因素,选择感兴趣的实例1:x0=(x
(1)


,x
(j)


,x
(p)
);然后依据不同预测因素的数据矩阵,随机选择实例2:z0=(z
(1)


,z
(j)


,z
(p)
);根据实例1和实例2在不同位置的预测因素数值,构建两个新的实例:x
+j
=(x
(1)


,x
(j

1)
,x
(j)
,z
(j+1)


,z
(p)
)和x

j
=(x
(1)


,x

【专利技术属性】
技术研发人员:黄新张楠
申请(专利权)人:天津师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1