本发明专利技术公开了一种基于多元非线性因果分析的干旱成因溯源方法,主要包括以下步骤:S1,数据预处理和提取目标变量自相关特征及预测变量的预测因子特征;S2,利用基于梁氏克尔曼信息流理论改进后的随机森林回归方法构建回归模型代替传统格兰杰因果关系中的线性向量自回归模型;S3,利用梁氏克尔曼信息流理论代替传统格兰杰因果关系中的决定系数,确定回归模型预测结果质量;S4,基于结合随机森林和梁氏克尔曼信息流的多元非线性因果分析方法进行干旱成因溯源分析。本发明专利技术能实现在干旱成因的各类多变量中高效、快速、准确的获取其中各变量之间的复杂因果关系,还能够精确量化各因素的强度。素的强度。素的强度。
【技术实现步骤摘要】
一种基于多元非线性因果分析的干旱成因溯源方法
[0001]本专利技术涉及干旱成因溯源,尤其涉及一种基于多元非线性因果分析的干旱成因溯源方法。
技术介绍
[0002]水是人类赖以生存和发展不可或缺的重要的物质资源之一,时刻影响着人类社会的发展。IPCC第六次评估报告指出,在全球气候变暖的背景下,水资源短缺的问题越发突出,全球干旱事件的频率和强度均呈现出增加态势。由于干旱发生的持续时间长,短则数周,长则数月甚至数年,因此不仅会对经济造成巨大的损失,还给人类的生活造成了极大的影响,是目前世界上最严重的自然灾害之一。然而,想要准确分析干旱事件的成因通常十分复杂,这是由于干旱事件往往涉及复杂的陆面
‑
大气相互作用,其中各变量之间的相互依赖关系通常会存在两种截然不同的情况。第一种情况是各变量是同步发展的,即它们之间的连接是无向的,对于这种情况,大部分研究可采用基于对称度量的方法(如相关性检验)来进行研究。第二种情况是一个变量驱动另一个变量,即变量之间存在“驱动
‑
响应”关系,这种关系为有向连接,也称为因果关系。因果关系是复杂系统中普遍存在的一种重要关系,能够有效揭示事务发展的内在规律,帮助人们透过现象看本质,因此识别变量之间的因果关系并量化其强度是研究陆面
‑
大气相互作用的关键问题,也是目前科学研究中的核心问题。然而,由于陆面
‑
大气相互作用通常存在多个变量,且这些作用大多是非线性的,这导致陆面
‑
大气相互作用中的因果关系往往是不确定的且难以发现。由于传统的统计方法如线性分析和相关分析等往往过于简单,通常难以对陆面
‑
大气相互作用中的“驱动
‑
响应”关系进行研究,而目前因果分析的理论和方法还不够成熟,对于复杂系统的深入应用还有很大不足,因此迫切需要开发新的基于数据驱动的多元非线性因果分析方法。
技术实现思路
[0003]专利技术目的:本专利技术的目的是提供一种能够准确识别陆面
‑
大气相互作用中各变量的线性以及非线性因果关系、准确量化各变量强度的基于多元非线性因果分析的干旱成因溯源方法。
[0004]技术方案:本专利技术的干旱成因溯源方法,包括步骤如下:
[0005]S1,对某干旱区域,选择陆面
‑
大气相互作用的相关变量数据作为预测变量和目标变量的原始预测数据,在对原始数据进行预处理后分别对目标变量数据和预测变量数据进行自相关特征提取和预测因子特征提取,得到数个时间序列长度相同的目标变量自相关特征和预测因子特征,并将时间序列长度相同的目标变量自相关特征和预测因子特征按照一定比例划分为训练集、测试集、验证集;
[0006]S2,采用基于梁氏克尔曼信息流理论改进后的随机森林回归方法构建基线回归模型与完整回归模型,通过不断调整超参数及其参数组合的方式,多次对网络进行训练,从中选出最好的模型,完成对完整回归模型及基线回归模型的训练;
[0007]S3,基于梁氏克尔曼信息流理论,分别对完成训练的基线回归模型、完整回归模型分别所得预测值与真实值之间的信息流进行计算,将所得计算结果作为评价森林模型回归效果的标准;
[0008]S4,基于结合随机森林和梁氏克尔曼信息流的多元非线性因果分析方法进行干旱成因溯源分析。
[0009]进一步,步骤S1中,所述陆面
‑
大气相互作用的选择相关变量包括:表层土壤湿度、深层土壤湿度、地表气温、降水、植被总初级生产力、水汽饱和压差、蒸散发、太阳辐射。
[0010]进一步,步骤S1中,数据预处理和提取目标变量自相关特征及预测变量的预测因子特征的详细实现步骤如下:
[0011]S11,统一所有预测变量及目标变量原始数据集的时间分辨率确保所有原始数据集的时间分辨率保持相同;
[0012]S12,对统一时间分辨率之后的数据按照同一时间范围内进行提取,以保证各预测变量及目标变量的时间序列长度相同;
[0013]S13,对统一时间分辨率及时间序列长度的目标变量数据进行自相关特征提取,得到目标变量的自相关特征;
[0014]S14,从统一时间分辨率及时间序列长度的预测数据中减去长期气候平均值,得到去除预测变量周期趋势的气候异常值数据;
[0015]S15,根据步骤S13中所得去除预测变量周期趋势的气候异常值数据,提取预测变量的预测因子特征,最终得到数个时间序列长度相同的预测因子特征。
[0016]S16,利用所得目标变量及预测因子特征,按照6:2:2划分为训练集、测试集、验证集,为后续的训练做好准备。
[0017]进一步,步骤S2中,采用基于梁氏克尔曼信息流理论改进后的随机森林回归方法构建回归模型的实现详细步骤如下:
[0018]S21,将梁氏克尔曼信息流作为随机森林回归方法中的Loss函数,作为评估随机森林回归树分枝质量的指标;
[0019]S22,根据基于梁氏克尔曼信息流理论改进后的随机森林回归方法,分别构建完整回归模型以及基线回归模型;
[0020]S23,将步骤S1中提取得到的预测因子特征带入到完整回归模型和基线回归模型进行训练,对训练结果进行分析评价;通过不断调整超参数及其参数组合的方式,多次对网络进行训练,从中选出最好的模型,完成对完整回归模型及基线回归模型的训练。
[0021]进一步,步骤S4中,基于结合随机森林和梁氏克尔曼信息流的多元非线性因果分析方法进行干旱成因溯源分析的实现详细步骤如下:
[0022]S41,将完整回归模型的信息流结果T
full
与基线回归模型的信息流结果T
baseline
进行比较;
[0023]S42,如果T
full
>T
baseline
,则表明加入预测变量对目标变量存在因果关系,则该加入预测变量是造成该区域干旱的因素;
[0024]S43,完整回归模型的信息流结果T
full
与基线回归模型的信息流结果T
baseline
的差值T
full
‑
T
baseline
作为加入预测变量对目标变量的因果强度,用来判断不同预测变量对于干旱事件的影响强度,实现对干旱成因进行溯源分析。
[0025]本专利技术与现有技术相比,其显著效果如下:
[0026]1、本专利技术通过结合随机森林回归方法及梁氏克尔曼信息流理论,提出了一种适用于复杂系统的多元非线性因果分析方法;该方法不仅可以实现在干旱成因的各类多变量中高效、快速、准确的获取其中各变量之间的复杂因果关系,还能够精确量化各类多变量的强度;
[0027]2、通过多元非线性因果分析方法,能准确识别并分离陆面
‑
大气相互作用中多变量之间复杂的“驱动
‑
响应”关系能够有效揭示出事务发展的内在规律,实现如相关分析、回归分析等传统分析方法难以分析的问题,本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于多元非线性因果分析的干旱成因溯源方法,其特征在于,包括步骤如下:S1,对某干旱区域,选择陆面
‑
大气相互作用的相关变量数据作为预测变量和目标变量的原始预测数据,在对原始数据进行预处理后分别对目标变量数据和预测变量数据进行自相关特征提取和预测因子特征提取,得到数个时间序列长度相同的目标变量自相关特征和预测因子特征,并将时间序列长度相同的目标变量自相关特征和预测因子特征按照一定比例划分为训练集、测试集、验证集;S2,采用基于梁氏克尔曼信息流理论改进后的随机森林回归方法构建基线回归模型与完整回归模型,通过不断调整超参数及其参数组合的方式,多次对网络进行训练,从中选出最好的模型,完成对完整回归模型及基线回归模型的训练;S3,基于梁氏克尔曼信息流理论,分别对完成训练的基线回归模型、完整回归模型分别所得预测值与真实值之间的信息流进行计算,将所得计算结果作为评价森林模型回归效果的标准;S4,基于结合随机森林和梁氏克尔曼信息流的多元非线性因果分析方法进行干旱成因溯源分析。2.根据权利要求1所述基于多元非线性因果分析的干旱成因溯源方法,其特征在于,步骤S1中,所述陆面
‑
大气相互作用的选择相关变量包括:表层土壤湿度、深层土壤湿度、地表气温、降水、植被总初级生产力、水汽饱和压差、蒸散发、太阳辐射。3.根据权利要求1所述基于多元非线性因果分析的干旱成因溯源方法,其特征在于,步骤S1中,数据预处理和提取目标变量自相关特征及预测变量的预测因子特征的详细实现步骤如下:S11,统一所有预测变量及目标变量原始数据集的时间分辨率确保所有原始数据集的时间分辨率保持相同;S12,对统一时间分辨率之后的数据按照同一时间范围内进行提取,以保证各预测变量及目标变量的时间序列长度相同;S13,对统一时间分辨率及时间序列长度的目标变量数据进行自相关特征提取,得到目标变量的自相关特征;S14,从统一时间分辨率及时间序列长度的预测数据中减去长期气候平均值,得到去除预测变量周期趋势的气候异常值数据;S15...
【专利技术属性】
技术研发人员:王国杰,周费宏,丹尼尔,徐永明,邵禹豪,张海燕,
申请(专利权)人:南京信息工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。