一种检验G219沿线高寒区域气象站小时数据异常的方法技术

技术编号:37315076 阅读:14 留言:0更新日期:2023-04-21 22:57
本发明专利技术公开一种检验G219沿线高寒区域气象站小时数据异常的方法,G219沿线高寒区域气象站小时数据预处理;利用去趋势波动分析方法对预处理好的数据进行标度分析;对上述标度结果进行统计,获得正常数据合理标度指数的结果区间,作为检验数据问题的指标;依据实际情况,针对每种气象要素,对异常数据进行标度分析;通过异常数据的标度结果是否落在合理区间内,检验数据质量问题。本申请基于时间序列的去趋势波动分析方法,定量刻画G219沿线高寒地区气象要素的长程持续性特征,通过数据长程持续性特征的偏离程度,检验小时气象数据的异常。检验小时气象数据的异常。检验小时气象数据的异常。

【技术实现步骤摘要】
一种检验G219沿线高寒区域气象站小时数据异常的方法


[0001]本专利技术涉及高寒区域气象站小时数据异常检验方法
具体地说是一种检验G219沿线高寒区域气象站小时数据异常的方法。

技术介绍

[0002]高原山地在气象研究中具有特殊性,国内外学者在高原山地气象学方面开展多方探索和研究,积累了丰富成果。G219国道(新藏线叶城至狮泉河)位于青藏高原西部,平均海拔4570米,最高海拔5400多米,沿线有喀喇昆仑山、昆仑山、喜马拉雅山等高山,属于高海拔山区。一直以来,高海拔地区恶劣的气候环境,给无人值守的气象观测站仪器的维护和气象数据的收集带来挑战。气象仪器维护人员需要尽可能早地远程发现观测数据异常,然后去自动观测站点进行仪器维护,而通常这些站点建在海拔较高且周边无明显遮挡的地带,尤其在寒冷冬季交通不便,给高原地区仪器维护带来困难。
[0003]2019年之前,G219国道1100KM里程范围内,仅有一个无人值守的自动气象站,多站点、连续的气象观测数据资料的缺乏,非常不利于利用资料的长程持续性等特征发现数据异常。
[0004]至2020年12月,G219国道沿线的上述里程范围内,又增添十几个新建自动区域气象站,并实现温度、压强、湿度、风等气象要素逐小时数据实时传输,以及在新疆气象信息中心存储,如图1所示。这十几个自动气象站组成G219公路沿线时空相对连续的观测网,有助于实现由传统的单站质量控制(从单一站点记录气象数据的时间维度开展分析)向多站协同质量控制(从多个站点记录气象数据的空间维度开展分析)技术升级,并使得本专利技术提出新的数据异常检验方法成为可能。
[0005]本专利技术方法的提出,一方面考虑到,G219国道沿线区域处于高原山区的特殊性,传统的气象自动站数据质控方法,并不完全适用,需要针对该地区高海拔、山区等特点,制定新的质控指标和方法。另一方面,已有的传统气象资料质量控制方法,如界限值检查、极值检查、内部一致性检查、空间一致性检查等等,往往仅考虑气象资料时间序列中的局部特征——是否某时空点观测本身的数值过大或者与临近时空点观测值的差距较大,并没有充分考虑资料的长程持续性等标度特征。
[0006]而已有研究结果表明,气象台站观测得到的温度、压强、湿度、风等气象要素长时间序列普遍存在长程持续性特征。以风速为例,简单来说,长程持续性是指在一定的时间尺度上,大风速后面往往更倾向于继续大风,而小风速后面倾向于小风。为了研究利用长程持续性,人们提出去趋势波动分析
[0007](简记为DFA)算法,利用所选取时间窗口s与波动函数F(s)之间的标度关系F(s)~s
α
,来定量刻画这种特征。不同时间分辨率、不同类型的气象要素的长程持续性特征存在显著差异,但是,相同时间分辨率的同类气象要素,却表现出普适的长程持续性特征,即标度指数α近似相同,已有技术均没有利用该特征来检验高寒区域气象站小时数据中的异常。

技术实现思路

[0008]为此,本专利技术所要解决的技术问题,针对现有技术的不足,本专利技术提出一种利用资料的长程持续性特征,来检验G219沿线高寒区域气象站小时数据异常的方法。通过对不同气象资料开展去趋势波动分析,检验数据异常。
[0009]为解决上述技术问题,本专利技术提供如下技术方案:
[0010]一种检验G219沿线高寒区域气象站小时数据异常的方法,包括如下步骤:
[0011]步骤P1:G219沿线高寒区域气象站小时数据预处理;
[0012]步骤P2:利用去趋势波动分析方法对预处理好的数据进行标度分析;
[0013]步骤P3:对标度分析结果进行统计,获得正常数据合理标度指数的结果区间,作为检验数据问题的指标;
[0014]步骤P4:依据实际情况,针对每种气象要素,对异常数据进行标度分析;
[0015]步骤P5:通过异常数据的标度结果是否落在合理区间内,检验数据异常问题。
[0016]上述一种检验G219沿线高寒区域气象站小时数据异常的方法,在步骤P1中,
[0017]步骤P101:收集G219沿线高寒区域14个气象站小时观测气象要素资料,气象要素资料包括温度T,逐小时最高温度Tmax,逐小时最低温度Tmin,压强P,相对湿度Rh,整小时时刻2分钟平均风速V2,整小时时刻10分钟平均风速V10;
[0018]步骤P102:在14个气象台站观测端,步骤P101中获得气象要素资料数据已经进行基本质量控制,包括僵值检查、内部一致性检查,保证在接下来的数据分析处理中有较高质量;
[0019]步骤P103:对步骤P102中获得气象要素资料数据,按照不同的气象要素,进行数据拼接,形成数据长时间序列;保证数据长度在104数量级,观测数据时间长度大于等于14个月;
[0020](24h/day)*(365day/year)*(1.2year)=10512≈104。
[0021]上述一种检验G219沿线高寒区域气象站小时数据异常的方法,在步骤P2中,
[0022]步骤P201:步骤P1中分类拼接好的气象要素资料数据为原始序列,先统一表示为{x
i
};i=1,2,

,N,对原始序列的距平序列对原始序列的距平序列进行累加,得到廓线序列:
[0023][0024]其中:{x
i
}为原始序列;为原始序列的平均值;{x
i

}为距平序列;{Y(j)}为廓线序列;N为大于等于1的正整数;
[0025]步骤P202:窗口划分,将廓线序列{Y(j)}从头部正向分解到等时间长度s,且互相不重叠的N
s
=N/s个窗口中;然后从廓线序列{Y(j)}的尾部反方向再进行一次窗口划分,同样得到互相不重叠的N
s
个窗口;得到2N
s
个窗口,并对窗口编号为v;
[0026]步骤P203:在每个窗口v内,对廓线序列{Y(j)}利用k阶多项式进行拟合得到拟合的趋势序列然后在所有窗口中用廓线序列{Y(j)}减去拟合的趋势序列就得到去趋势序列{Y
s
(j)}:
[0027]其中k=2;
[0028]步骤P204:对于去趋势序列{Y
s
(j)},计算每个窗口中的方差函数
[0029][0030]步骤P205:将2N
s
个窗口计算得到的方差函数累加后,开平方就得到要计算的波动函数F(s):
[0031][0032]步骤P206:原始序列{x
i
}是长程序列相关的,函数F(s)和时间尺度s之间应该满足幂律标度关系:F(s)~s
α
;对波动函数F(s)两边分别取以10为底的对数,得到:
[0033]log
10
(F(s))~α*log
10
(s);
[0034]步骤P207:以log
10
(s)为横轴,以lo本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种检验G219沿线高寒区域气象站小时数据异常的方法,其特征在于,包括如下步骤:步骤P1:G219沿线高寒区域气象站小时数据预处理;步骤P2:利用去趋势波动分析方法对预处理好的数据进行标度分析;步骤P3:对标度分析结果进行统计,获得正常数据合理标度指数的结果区间,作为检验数据问题的指标;步骤P4:依据实际情况,针对每种气象要素,对异常数据进行标度分析;步骤P5:通过异常数据的标度结果是否落在合理区间内,检验数据异常问题。2.根据权利要求1所述的一种检验G219沿线高寒区域气象站小时数据异常的方法,其特征在于,在步骤P1中,步骤P101:收集G219沿线高寒区域14个气象站小时观测气象要素资料,气象要素资料包括温度T,逐小时最高温度Tmax,逐小时最低温度Tmin,压强P,相对湿度Rh,整小时时刻2分钟平均风速V2,整小时时刻10分钟平均风速V10;步骤P102:在14个气象台站观测端,步骤P101中获得气象要素资料数据已经进行基本质量控制,包括僵值检查、内部一致性检查,保证在接下来的数据分析处理中有较高质量;步骤P103:对步骤P102中获得气象要素资料数据,按照不同的气象要素,进行数据拼接,形成数据长时间序列;保证数据长度在104数量级,观测数据时间长度大于等于14个月;(24h/day)*(365day/year)*(1.2year)=10512≈104。3.根据权利要求1所述的一种检验G219沿线高寒区域气象站小时数据异常的方法,其特征在于,在步骤P2中,步骤P201:步骤P1中分类拼接好的气象要素资料数据为原始序列,先统一表示为{x
i
};i=1,2,

,N,对原始序列的距平序列对原始序列的距平序列进行累加,得到廓线序列:其中:{x
i
}为原始序列;为原始序列的平均值;{x
i

}为距平序列;{Y(j)}为廓线序列;N为大于等于1的正整数;步骤P202:窗口划分,将廓线序列{Y(j)}从头部正向分解到等时间长度s,且互相不重叠的N
s
=N/s个窗口中;然后从廓线序列{Y(j)}的尾部反方向再进行一次窗口划分,同样得到互相不重叠的N
s
个窗口;得到2N
s
个窗口,并对窗口编号为v;步骤P203:在每个窗口v内,对廓线序列{Y(j)}利用k阶多项式进行拟合得到拟合的趋势序列然后在所有窗口中用廓线序列{Y(j)}减去拟合的趋势序列就得到去趋势序列{Y
s
(j)}:其中k=2;步骤P204:对于去趋势序列{Y
s
(j)},计算每个窗口中的方差函数(j)},计算每个窗口中的方差函数
步骤P205:将2N
s
个窗口计算得到的方差函数累加后,开平方就得到要计算的波动函数F(s):步骤P206:原始序列{x
i
}是长程序列相关的,函数F(s)和时间尺度s之间应该满足幂律标度关系:F(s)~s
α
;对波动函数F(s)两边分别取以10为底的对数,得到:log
10
(F(s))~α*log
10
(s);步骤P207:以log
10
(s)为横轴,以log
10
(F(s))为纵轴,在直角坐标系中,作图画出波动函数F(s)与时间尺度(s)两者的关系曲线,得到曲线的斜率,即标度指数α,是表征原始序列{x
i
}长程相关性的重要指标。4.根据权利要求3所述的一种检验G219沿线高寒区域气象站小时数据异常的方法,其特征在于,在步骤P3中,步骤P301:对小时温度T长时间序列的标度结果进行统计分析,获得所有14个站小时温度长时间序列标度指数的合理数值区间[α
T


T
],作为检验区域气象站观测小时温度数据异常问题的参考指标;步骤P302:对逐小时最高温度Tmax长时间序列的标度结果进行统计分析,获得所有14个站逐小时最高温度长时间序列标度指数的合理数值区间[α
Tmax


Tmax
],作为检验区域气象站观测逐小时最高温度数据异常问题的参考指标;步骤P303:对逐小时最低温度Tmin长时间序列的标度结果进行统计分析,获得所有14个站逐小时最低温度长时间序列标度指数的合理数值区间[α
Tmin


Tmin
],作为检验区域气象站观测逐小时最低温度数据异常问题的参考指标;步骤P304:对压强P长时间序列的标度结果进行统计分析,获得所有14个站小时压强长时间序列标度指数的合理数值区间[α
P


P
],作为检验区域气象站观测小时压强数据异常问题的参考指标;步骤P305:对小时相对湿度Rh长时间序列的标度结果进行统计分析,获得所有14个站小时相对湿度长时间序列标度指数的合理数值区间[α
Rh


Rh
],作为检验区域气象站观测小时相对湿度数据异常问题的参考指标;步骤P306:对2分钟平均风速V2长时间序列的标度结果进行统计分析,获得所有14个站逐小时平均风速V2长时间序列标度指数的合理数值区间[α
V2


V2
],作为检验区域气象站观测逐小时平均风速V2数据异常问题的参考指标;步骤P307:对10分钟平均风速V10长时间序列的标度结果进行统计分析,获得所有14个站逐小时平均风速V10长时间序列标度指数的合理数值区间[α
V10


V10
],作为检验区域气象站观测逐小时平均风速V10数据异常问题的参考指标;步骤P308:以上步骤P301

P307中,标度指数的合理数值区间,通过统计所有14个站的各个气象要素得到,其区间下...

【专利技术属性】
技术研发人员:李庆雷姚作新肖金梅孔婷杨挺李秦
申请(专利权)人:新疆维吾尔自治区气象信息中心新疆维吾尔自治区气象档案馆
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1