一种大规模降雨监测异常站点筛查方法技术

技术编号:32824642 阅读:90 留言:0更新日期:2022-03-26 20:24
本发明专利技术涉及一种大规模降雨监测异常站点筛查方法,包括以下步骤:步骤1、采用Hampel法基于年序列降雨观测资料初步判定基准站;步骤2、采用格拉布斯准则再次判别基准站;步骤3、确定基准站后采用周边测站分析法基于逐小时降雨监测数据判别异常站点;步骤4、雷达辅助校验异常站点。本发明专利技术可以实现大规模雨量监测站数据的异常识别和快速处理,异常识别率高达95%以上,为暴雨洪水风险提示和预警提供准确、可靠的依据。靠的依据。靠的依据。

【技术实现步骤摘要】
一种大规模降雨监测异常站点筛查方法


[0001]本专利技术涉及一种大规模降雨监测异常站点筛查方法,属于气象水文领域,主要用于为暴雨洪水风险提示和预警提供准确、可靠的降雨监测信息。

技术介绍

[0002]降雨监测是水文监测的重要组成部分,是暴雨洪水灾害防御工作的耳目和参谋。21世纪以来,水利部门加大了对自动监测站建设的支持力度,特别是经过山洪灾害防治项目建设,全国山洪灾害自动监测站点达13.2万个,自动雨量站网平均密度为 38km2/站,是2006年(6000站)的22倍,最小报汛时段缩短到 10min,数据信息量增加100余倍,极大地缩小了降雨监测盲区,有力支撑了水旱灾害防御工作。但由于部分测站建设标准偏低,位于山丘区的测站运维困难,数据质量难以得到保障,常常出现冒大数、缺测、漏测等情况,且测站出现问题具有很强的随机性,完全抛弃某一测站不切实际。
[0003]为了站点的监测数据得到有效利用,需要从众多降雨监测站点中找出不同时段内监测数据准确的站点,剔除数据质量有问题的站点,但目前大多数识别方法具有很强的主观性,误判的可能性很大,业务当中应用时存在较大风险,一是难以识别出确有异常的站点,二是容易将正确站点错误认为是异常站点,与开展异常站点识别的初衷相悖。对于极个别异常识别准确性较高的方法,需要进行大量的距离计算与比较,对计算资源要求极高,而事实上业务应用对异常站点识别方法的稳定性、可靠性和高效性均提出很高的要求。提出一个能够业务化应用的大规模异常站点识别方法极为迫切。

技术实现思路

[0004]本专利技术提出了一种大规模降雨监测异常站点筛查方法,其解决的技术问题是基于Hampel法、格拉布斯准则、周边测站分析法和雷达辅助校验等方法,建立递进式异常站点筛查体系,并通过K

d tree(K

dimension tree)高级数据结构和并行计算方法提高计算效率,为大规模降雨监测数据异常识别、充分利用雨量监测站有效信息提供可靠的方法。
[0005]为了解决上述存在的技术问题,本专利技术采用了以下方案:
[0006]一种大规模降雨监测异常站点筛查方法,包括以下步骤:
[0007]步骤1、采用Hampel法基于年序列降雨观测资料初步判定基准站;
[0008]步骤2、采用格拉布斯准则再次判别基准站;
[0009]步骤3、确定基准站后采用周边测站分析法基于逐小时降雨监测数据判别异常站点;
[0010]步骤4、雷达辅助校验异常站点。
[0011]建立了“年尺度初筛—小时尺度细判—小时尺度验证”的多时空异常站点筛查体系。
[0012]进一步,步骤1、2提出了以年降雨序列为数据基础的“时空维度+先后规则”的基准站判别方法,即从大规模测站中,先通过某一测站降雨时间序列查找出测站的异常年份,再
通过周边测站雨量确定其是否为异常,能够适应我国大多数测站年观测序列短的现状,提高了查找效率。
[0013]进一步,步骤1中的采用Hampel法初步筛选出雨量监测较为稳定、数据质量相对较高的测站,首先是基于长序列测站的年雨量值,利用Hampel法对单一测站监测数据的异常年份进行识别。Hampel法可用于异常极端值的判别,其基本原理是对给定的数据集假设一个分布和概率模型,然后根据假设采用不一致检验对数据系列进行处理,其公式如下:
[0014][0015]其中,X
i
为数据序列X中的某一值,Median为X的中位数, MAD(median absolute deviation)为数据集Y的中位数, X={x1,x2,

x
n
},是测站年降雨量数据序列,Y={y1,y2,

,y
n
} ={x1‑
median,x2‑
median,

,x
n

median}。
[0016]进一步,步骤1采用Hampel法进行时间维度判别,对于年序列小于10的测站,阈值设定为2.24。当Z
i
(i=1,2,

,n)值大于2.24 时,则判定X
i
为异常点,i为该测站的异常年份。
[0017]步骤1可以根据研究区面积、测站分布情况等因素,在考虑待测站点与周边站点距离的基础上,通过经纬度将目标分区,计算机程序在查找20km范围内测站时,仅在其中一个区域内查找即可,目标分区的区域同时进行搜索对比,已经判断为异常的测站在后续判别待测站时不作为周边测站参与比较,减少部分异常值对判别效果的不良影响。
[0018]考虑到大量测站建设年代较近,数据序列较短,仅通过Hampel 法从时间维度上判定测站监测数据的异常年份,可靠性还不够。
[0019]进一步,步骤2采用改进的格拉布斯准则进行空间维度判别,以监测出异常年份的站点为中心,20km为半径划定影响区域,对测站的异常年份进行验证。
[0020]进一步,步骤2中格拉布斯准则适用于测量次数较少的情况 (3≤n<100),可一次性求出多个异常值。其基本原理是判断可疑值取舍的过程中,将正态分布中平均值和方差这两个最重要的参数引进来,有利于提高判断的准确性。考虑到本文单站年累积雨量的时间序列较短,为了提高异常值判定的准确性,需借助周边测站从空间维度再做判断,格拉布斯准则判别法较为适用。
[0021]改进的格拉布斯准则是将原准则公式中的平均值用中位数代替,可有效消除同侧异常值的屏蔽效应,是更为稳健的处理方法,其方法如下:
[0022]先将通过Hampel法初步判定为某年异常的测站选出,在其周围以20km为半径划定区域,区域内测站约50个左右,区域内所有站点的年雨量值构成样本,通过从小至大排序为样本序列X=(x1,x2, x
n
),统计临界系数G(a,n)的值G0(查临界值表获得),a为显著性水平,本文取a为0.05,并计算G1,G
n

[0023]G1=(X


x
i
)/σ
[0024]Gn=(x
n

X

)/σ
[0025]其中,n为测站数量,X

为样本中位数,σ为标准差。
[0026]若G1≥G
n
且G1>G0,则判定x1为异常值并予以剔除;若G
n
≥G1且G
n
>G0,则x
n
为异常值并予以剔除;若G1<G0且G
n
<G0,则不存在异常值。若存在异常值,则剔除之后用剩余站点
的年雨量值重新计算,重复上述步骤,直到无异常值为止。
[0027]为提高计算效率,缩短程序运行时对待判断测站与周边站点距离关系的判断所用时长,步骤2采用改进的格拉布斯准则进行空间维度判别时,根据研究区面积、测本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大规模降雨监测异常站点筛查方法,包括以下步骤:步骤1、采用Hampel法基于年序列降雨观测资料初步判定基准站;步骤2、采用格拉布斯准则再次判别基准站;步骤3、基准站确定后采用周边测站分析法基于逐小时降雨监测数据判别异常站点;步骤4、雷达辅助校验异常站点。2.根据权利要求1所述一种大规模降雨监测异常站点筛查方法,其特征在于:所述步骤1、2提出了以年降雨序列为数据基础的“时空维度+先后规则”的基准站判别方法,即从大规模测站中,先通过某一测站降雨时间序列查找出测站的异常年份,再通过周边测站雨量确定其是否为异常,能够适应我国大多数测站年观测序列短的现状,提高了查找效率。3.根据权利要求2所述一种大规模降雨监测异常站点筛查方法,其特征在于:所述步骤1采用Hampel法进行时间维度判别,对于年序列小于10的测站,阈值设定为2.24。4.根据权利要求2所述一种大规模降雨监测异常站点筛查方法,其特征在于:所述步骤2采用改进的格拉布斯准则进行空间维度判别,先将通过Hampel法初步判定为某年异常的测站选出,在其周围以20km为半径划定区域,区域内测站约50个左右,区域内所有站点的年雨量值构成样本,通过从小至大排序为样本序列X=(x1,x2,x
n
),统计临界系数G(a,n)的值G0(查临界值表获得),a为显著性水平,本文取a为0.05,并计算G1,G
n
:G1=(X


x
i
)/σGn=(x
n

X

)/σ其中,n为测站数量,X

为样本中位数,σ为标准差;若G1≥G
n
且G1>G0,则判定x1为异常值并予以剔除;若G
n
≥G1且G
n
>G0,则x
n
为异常值并予以剔除;若G1<G0且G
n
<G0,则不存在异常值;若存在异常值,则剔除之后用剩余站点的年雨量值重新计...

【专利技术属性】
技术研发人员:田济扬刘荣华刘含影
申请(专利权)人:中国水利水电科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1