【技术实现步骤摘要】
基于地理加权岭回归的多源降雨数据融合方法及设备
[0001]本专利技术实施例涉及多源降雨数据处理
,尤其涉及一种基于地理加权岭回归的多源降雨数据融合方法及设备。
技术介绍
[0002]卫星遥感降雨产品具有时空分辨率高、覆盖范围广、成本相对低廉等优势,在水文预报、水资源规划与管理等领域的科学研究和生产实践中已得到广泛应用。原始的卫星遥感降雨产品的精度较低,数据质量较差,很难满足防洪预警的精度要求。对雨量站和卫星降雨产品的降雨数据进行融合已经成为改善卫星降雨空间估计的一种重要手段。传统的融合方法为构建雨量站降雨实测值与卫星遥感降雨之间的地理加权回归(GWR)关系。然而,传统的融合方法中,雨量站观测降雨仅同单个卫星降雨产品融合,需要对大量卫星降雨产品进行评估以优选出表现较好的卫星降雨产品作为融合的数据源之一,很大程度上增加了多源降雨融合的繁琐程度,且数据精度仍待提高。另外,GWR作为一种局部回归方法,很容易遭受共线性问题的影响,共线性程度较高时,回归参数的估计将会变得很不稳定,极端情形下回归参数甚至无解。因此,开发一种基于地 ...
【技术保护点】
【技术特征摘要】
1.一种基于地理加权岭回归的多源降雨数据融合方法,其特征在于,包括:S1:获取研究区域范围内的雨量站实测日降雨资料和卫星遥感日降雨资料,若用到多种卫星日降雨产品,则将各卫星遥感日降雨数据处理成相同的空间分辨率,并对雨量站实测日降雨和各卫星遥感日降雨进行Box
‑
Cox变换;S2:求解经Box
‑
Cox变换的雨量站实测日降雨与卫星遥感日降雨之间的地理加权回归GWR关系中的回归参数,并进行共线性诊断;S3:对出现共线性问题的位置,将岭回归集成到地理加权回归GWR的框架中,计算岭参数,求解经Box
‑
Cox变换的雨量站实测日降雨与多种卫星遥感日降雨之间的地理加权岭回归GWRR关系中的回归参数,其余位置的回归参数仍保持S2步骤得到的GWR关系中的回归参数不变;S4:由各栅格位置处的各卫星日降雨数据和由S3步骤得到各栅格位置处的回归参数,计算各栅格位置处的日降雨估计值;S5:计算雨量站位置处的GWRR模型残差,并将其插值至各栅格位置处;S6:各栅格位置处的降雨估计值和残差叠加,经过还原变换,得到各栅格位置处的日降雨融合产品;S7:采用连续性指标和分类指标,对原始卫星降雨产品与融合降雨产品进行精度评价。2.根据权利要求1所述的基于地理加权岭回归的多源降雨数据融合方法,其特征在于,所述步骤S1中的Box
‑
Cox变换,包括:(1)式中,P
d
为日降雨数据;为对日降雨数据进行Box
‑
Cox变换后的结果;δ为Box
‑
Cox变换中的参数。3.根据权利要求2所述的基于地理加权岭回归的多源降雨数据融合方法,其特征在于,所述步骤S2中:A1、地理加权回归GWR:对于某一变量y,在区域内存在n个观测点,则GWR模型可表达为:(2)式中,x
ik
是第i个观测位置处变量y的第k个解释变量;p为解释变量的个数;β
i,k
是第i个观测位置处的第k个回归参数,为空间位置的函数;ε
i
为第i个观测位置处的模型回归残差,服从独立正态分布,式(2)矩阵表示如下:(3)式中,为矩阵的逻辑乘法;y为被解释变量矩阵;X为解释变量矩阵;β为回归参数矩阵;I为单位矩阵;ε为残差矩阵;y、X、β的具体形式分别为:y=(y1,y2,
…
,y
n
)
T
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
GWR模型中回归参数β(i)=(β
i0
,β
i1
,
…
,β
ip
)
T
的估计采用加权最小二乘法,即寻找估计值满足:(7)式中,w
j
(i)为空间权函数,随样本观测点j与回归点i之间的地理距离单调递减,对式(7)进行求解,可得GWR回归参数的估计值,其矩阵形式为:(8)式中,W(i)=diag[w1(i),w2(i),
…
,w
n
(i)]为空间权重矩阵,一般由空间权函数w
j
(i)和所用带宽b决定,常用的空间权函数包含四种,即距离阈值函数、距离反比函数、高斯函数和bi
‑
square函数,其表达式分别为:函数,其表达式分别为:函数,其表达式分别为:函数,其表达式分别为:(9)、(10)、(11)、(12)四式中,为距离阈值函数;为距离反比函数;为高斯函数;为bi
‑
square函数;d
ij
为样本观测点j与回归点i之间的欧氏距离;c为常数;b为带宽,带宽的选择有两种方案:一是固定带宽,即各回归点估计均采用相同的带宽,适用于样本点均匀分布的情况;二是自适应带宽,即参与各回归点估计的样本数目相同,带宽大小随回归点位置而自动调整,适用于样本点分布不均匀的情况,由以上各式,可以得到第i个观测点被解释变量的估计值为:A2、共线性诊断:
共线性是指解释变量之间存在线性相关关系的现象,共线性程度较高时,回归参数的估计将会变得很不稳定,极端情况下回归参数甚至无解,采用条件数CN作为共线性问题诊断的指标,对于各列单位化的解释变量矩阵X,条件数定义为:式(14)中,μ
max
和μ
min
分别为解释变量矩阵X的最大奇异值和最小奇异值,由解释变量矩阵X的奇异值分解得到,条件数CN值越大,设计解释变量矩阵X各列之间的共线性越强,当CN值较小时,共线性几乎对回归参数估计无影响;但当设计矩阵的CN值超出某一阈值后,将出现共线性问题,使得回归参数的估计很不稳定;在CN值无穷大的极端情形下,将产生完全共线性问题,此时回归参数无解。4.根据权利要求3所述的基于地理加权岭回归的多源降雨数据融合方法,其特征在于,所述步骤S3中:B1、地理加权岭回归GWRR:GWWR通过限制回归参数的范围来收缩多余解释变量造成的影响,克服GWR中的共线性问题,GWRR模型中回归参数的估计为求约束条件下的最小值问题,即寻找估计值满足:(15)式的拉...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。