【技术实现步骤摘要】
一种水质自动在线站高频连续观测数据质量控制方法
本专利技术涉及水环境信息技术的研究领域,特别涉及一种水质自动在线站高频连续观测数据质量控制方法。
技术介绍
随着污染防治攻坚战不断深入、监测技术的不断发展,自动监测已进入水环境质量监测领域,具有时间和空间上连续监测的优势,弥补了手工监测的不足。地表水水质自动监测系统由地表水水质自动监测站(简称水站)、水质自动监测数据平台(简称数据平台)组成。目前全国已建成2000多个国家地表水水质自动站,大规模水质自动监测站建设和“互联网+”大数据时代的到来,对环境监测与环境管理提出了更高的要求。河流水质观测异常值或缺失值未适当修正,将对河流水质及污染情况误判,从而可能导致错误的决策。数据质量控制离不开数据挖掘程序算法和专家经验。目前国内外数据质量控制技术的在海洋观测数据方面应用较多,对于地表水监测数据质量控制方面的研究较少。随着大规模地表水水质自动监测站建设,水质监测频率大幅提高,数据量日益增加,怎样结合人为经验与计算机算法有效地提取、选择和处理获取的数据,实现数据的可靠性、保证信息的完整性并降低数据的不确定性,是亟待解决的问题。地表水水质参数之间具有协同或相反变化趋势,通过专家先验知识对参数相关性与趋势性分析对数据异常值把控不可或缺。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提供一种水质自动在线站高频连续观测数据质量控制方法,为了水质自动在线站高频连续观测数据异常值检测和数据集质量控制,提出了水质高频连续观测时间序列数据平稳处理方法并 ...
【技术保护点】
1.一种水质自动在线站高频连续观测数据质量控制方法,其特征在于,包括以下步骤:/n通过水质传感器采集模块连续获取第一水质观测序列数据,得到时间序列数据,并建立数据集;/n对时间序列数据集进行差分运算,并对差分时间序列进行平稳性检测,得到平稳差分时间序列数据;/n对平稳差分时间序列数据,确定统计窗口值大小和滑动步长取值范围,按照统计窗口值大小和滑动步长开展滑动检测;/n通过若干种检测方法进行异常值检测,将得到相应异常值,并对不同方法的结果进行合并,得到综合异常值;/n对异常值序列点位进行重构处理,得到第二水质观测序列数据,实现高频连续的水质观测数据质量控制。/n
【技术特征摘要】
1.一种水质自动在线站高频连续观测数据质量控制方法,其特征在于,包括以下步骤:
通过水质传感器采集模块连续获取第一水质观测序列数据,得到时间序列数据,并建立数据集;
对时间序列数据集进行差分运算,并对差分时间序列进行平稳性检测,得到平稳差分时间序列数据;
对平稳差分时间序列数据,确定统计窗口值大小和滑动步长取值范围,按照统计窗口值大小和滑动步长开展滑动检测;
通过若干种检测方法进行异常值检测,将得到相应异常值,并对不同方法的结果进行合并,得到综合异常值;
对异常值序列点位进行重构处理,得到第二水质观测序列数据,实现高频连续的水质观测数据质量控制。
2.根据权利要求1所述的一种水质自动在线站高频连续观测数据质量控制方法,其特征在于,所述差分运算具体如下:
其中,Δy(i)t为第i个水质观测属性在时刻t的差分观测值,y(i)t为第i个水质观测属性在时刻t的实际观测值,y(i)t-1为第i个水质观测属性在时刻t-1的实际观测值,Δt为采样周期。
3.根据权利要求2所述的一种水质自动在线站高频连续观测数据质量控制方法,其特征在于,所述采样周期范围是:1~14400s,第一水质观测序列长度不低于200个样本。
4.根据权利要求1所述的一种水质自动在线站高频连续观测数据质量控制方法,其特征在于,所述序列平稳性检测采用单位根检测方法。
5.根据权利要求1所述的一种水质自动在线站高频连续观测数据质量控制方法,其特征在于,所述确定统计窗口值大小和滑动步长取值范围,按照统计窗口值大小和滑动步长开展滑动检测,具体如下:
通过实际序列的相关关系代替平行规则,统计窗口w即选取时间序列值大小,当采样周期越大时,统计窗口越小;当采样周期越小时,统计窗口越大;滑动步长即时间序列每次滑动距离,其取值范围为[1,w-1]。
6.根据权利要求1所述的一种水质自动在线站高频连续观测数据质量控制方法,其特征在于,所述若干种检测方法进行异常值检测包括莱茵达检验法、狄克逊检验法、格拉布斯检验法。
7.根据权利要求6所述的一种水质自动在线站高频连续观测数据质量控制方法,其特征在于,所述莱茵达检验法进行异常值检测具体如下:
计算并获得贝塞尔计算值S(i)t:
其中,δ(i)t为第i个水质观测属性在时刻t的差分统计窗口内标准差,S(i)t为第i个水质观测属性在时刻t的差分统计窗口内内赛尔计算值,w为统计窗口取值,Δy(i)t+j为时刻t+j的观测序列差分值,为差分序列窗口内的平均值,w-1为自由度;
则异常值为序列中差分值在区间以外的值;
所述狄克逊检验法进行异常值检测具体如下:
将第i个水质观测序列窗口内的差分值按照从小到大排列,将排列好序列数据的最高值和最低值作为异常值的检验对象,检验高端值和地端值是否异常按下列公式,算出Q值:
其中,Δy(i)'t+w为新排序后序列的最大值,Δy(i)'t+1为新排序后序列的最小值,Δy(i)'t+w-1为新排序后序列的次大值,Δy(i)'t+2为新排序后序列的次小值,Δy(i)'t+w-2为新排序后序列的第3大值,Δy(i)'t+3为新排序后序列的第3小值;
根据选定的显著水平a和水质观测序列窗口w,依据狄克逊准...
【专利技术属性】
技术研发人员:范中亚,蒋锦刚,王文才,姜妮,赵长进,杨汉杰,林澍,陈钢,王钟,黄志伟,郭静,罗千里,
申请(专利权)人:生态环境部华南环境科学研究所,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。