The invention discloses an air quality data recovery method based on the completeness of low rank matrix, which comprises the following steps: (1) cleaning time series data of air pollutants; (2) establishing mathematical optimization model of low rank matrix recovery; (3) solving mathematical model and restoring data. The air quality data recovery method provided by the invention makes full use of the high correlation and local difference of data between monitoring stations nodes, and can efficiently recover all data at one time, especially under the condition of continuous missing more data, the recovery accuracy is considerable.
【技术实现步骤摘要】
一种基于低秩矩阵完备化的空气质量数据恢复方法
本专利技术涉及一种基于低秩矩阵完备化的空气质量数据恢复方法,属于城市大气污染监测与防治
技术介绍
空气质量数据恢复是将大气污染物监测站采集过程中出现的缺失记录、无效记录的时间序列数据进行高精度填补,在大气污染实时监测预测、重污染防治等环境工程中具有重要铺垫作用。城市大气污染物时间序列数据的变化涉及到时空复杂的物理化学过程,针对由于监测设备的不可抗力因素而导致的部分数据丢失的问题,常用的填补恢复方法包括插值与填补,例如K近邻、样条插值、EM、谱方法等。插值方法难以应对数据的不平稳性,尤其缺失数据较多的情况表现较差;已有填补方法,大多具有计算复杂的特征,往往不被选取使用。
技术实现思路
专利技术目的:为了克服现有方法的不足,本专利技术利用城市间各个监测站具有很高的相关性,同时考虑到监测站之间具有一定的局部差异性,提供了一种基于低秩矩阵完备化的空气质量数据填补恢复方法。通过建立矩阵分解的数学模型,将数据恢复转化为带约束的最小优化问题,使用交替方向梯度下降法迭代求解出需要恢复的数据。技术方案:为实现上述目的,本专利技术采用的技术方案为:一种基于低秩矩阵完备化的空气质量数据恢复方法,所述步骤如下:(1)、大气污染物时间序列数据清洗;(2)、建立低秩矩阵恢复的数学最优化模型;(3)、利用交替方向乘子法求解数学模型,恢复数据。上述步骤(1)中的数据清洗包括如下步骤:(a1)、对于每个监测节点的某污染物时间序列数据,将无效记录与空记录替换为None,作为缺失标记;(a2)、将步骤(a1)中清洗完成的时间序列数据按行组成原 ...
【技术保护点】
1.一种基于低秩矩阵完备化的空气质量数据恢复方法,其特征在于所述步骤如下:(1)、大气污染物时间序列数据清洗;(2)、建立低秩矩阵恢复的数学最优化模型;(3)、利用交替方向乘子法求解数学模型,恢复数据。
【技术特征摘要】
1.一种基于低秩矩阵完备化的空气质量数据恢复方法,其特征在于所述步骤如下:(1)、大气污染物时间序列数据清洗;(2)、建立低秩矩阵恢复的数学最优化模型;(3)、利用交替方向乘子法求解数学模型,恢复数据。2.根据权利要求1所述的基于低秩矩阵完备化的空气质量数据恢复方法,其特征在于所述步骤(1)中的数据清洗包括如下步骤:(a1)、对于每个监测节点的某污染物时间序列数据,将无效记录与空记录替换为None,作为缺失标记;(a2)、将步骤(a1)中清洗完成的时间序列数据按行组成原始不完备二维矩阵D;(a3)、构造一个标记数据缺失与否的矩阵M,缺失位置的值设为0,有效位置的值设为1,矩阵M的维度与矩阵D相同。3.根据权利要求2所述的基于低秩矩阵完备化的空气质量数据恢复方法,其特征在于所述步骤(2)中建立低秩矩阵恢复的数学最优化模型包括如下步骤:(b1)、将矩阵D中每个None值替换为所在行的非None值的算术均值μ,完成矩阵D的初始完备化;(b2)、定义矩阵A、E、Y,维度...
【专利技术属性】
技术研发人员:刘小峰,邹朗,蒋爱民,
申请(专利权)人:河海大学常州校区,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。