一种温度缺失数据填补方法、系统及电子设备技术方案

技术编号:21913917 阅读:44 留言:0更新日期:2019-08-21 12:25
本申请涉及一种温度缺失数据填补方法、系统及电子设备。包括:步骤a:分别读取待填补站点以及与待填补站点位于同一地区的各个观测站的温度数据,并根据温度数据统计待填补站点与各个观测站的共有时间序列;步骤b:利用所述待填补站点与各个观测站的共有时间序列对应时刻的温度数据计算待填补站点与各个观测站之间的相关系数,并根据所述相关系数筛选出与待填补站点相关性最强的至少一个观测站作为填补参考站点;步骤c:利用所述至少一个填补参考站点共有时间序列对应时刻的温度数据拟合待填补站点与所述至少一个填补参考站点之间的线性函数,通过所述线性函数对待填补站点的温度数据进行填补。本申请改善了温度数据填补的精确度与可操作性。

A Temperature Missing Data Filling Method, System and Electronic Equipment

【技术实现步骤摘要】
一种温度缺失数据填补方法、系统及电子设备
本申请属于气象服务
,特别涉及一种温度缺失数据填补方法、系统及电子设备。
技术介绍
温度数据是气象观测站通过一些设备或者人工方法测得,然后通过计算机系统录入数据。一方面现阶段我国各地区气象观测站密度相对较大且设备随着时间增长易出现故障,这无疑增加了各观测站数据缺失的可能性。另一方面,在计算机系统的录入过程中也有可能出现数据的遗漏。温度数据的缺失会在一定程度上使气象研究人员统计分析的结果出现偏差,影响相关部门制定相应措施。目前针对各类属性的气象缺失数据更多的是通过统计学方法进行统一填补,其中包括临近法、平均值等具有代表性的数值填补方法,以及通过设计统计优化算法进行数据填补。在申请公布号为CN104280791A的专利中,通过缺失值前后数据的平均值和预设时间段内的数据平均值的填补方法,针对不同的缺失情况完成数据填补。在申请公布号CN108897719A的专利中,利用线性插值法和相关性分类法计算缺失值,通过建立遗传算法目标函数计算出两种方法的最优权重系数,从而对缺失值填补。在处理温度数据连续缺失时,虽然利用申请公布号为CN108897719A的填补方法相比于申请公布号为CN104280791A的方法更加准确、且不用预先设置值。但一方面该方法在相关性分类方法计算缺失值的过程中,是讨论缺失数据的属性与同一个站其他属性之间的相关性,这样就需要有其他属性的同时刻数据,当只有温度数据时无从填补。另一方面温度作为一种气象数据,在同一地区内各地的温度可能相差不大,这就使得高密度观测站下各个观测站的温度数据一定具有很强的相关性。并且当数据缺失时,大都不会出现一个地区内所有站点温度数据都有缺失,这样可以充分利用未缺失站点的信息进行数据填补,现有技术均未考虑该点。同时,现有专利更多的是针对各类气象数据整体缺失的通用填补,并没有针对一种单一温度数据缺失的填补方法可供参考。
技术实现思路
本申请提供了一种温度缺失数据填补方法、系统及电子设备,旨在至少在一定程度上解决现有技术中的上述技术问题之一。为了解决上述问题,本申请提供了如下技术方案:一种温度缺失数据填补方法,包括以下步骤:步骤a:分别读取待填补站点以及与待填补站点位于同一地区的各个观测站的温度数据,并根据所述温度数据统计待填补站点与各个观测站的共有时间序列;步骤b:利用所述待填补站点与各个观测站的共有时间序列对应时刻的温度数据计算待填补站点与各个观测站之间的相关系数,并根据所述相关系数筛选出与待填补站点相关性最强的至少一个观测站作为填补参考站点;步骤c:利用所述至少一个填补参考站点共有时间序列对应时刻的温度数据拟合待填补站点与所述至少一个填补参考站点之间的线性函数,通过所述线性函数对待填补站点的温度数据进行填补。本申请实施例采取的技术方案还包括:所述步骤a还包括:根据所述待填补站点的温度数据确定待填补站点的温度数据缺失时刻信息。本申请实施例采取的技术方案还包括:所述步骤b还包括:根据所述相关系数计算结果对至少一个填补参考站点进行相关性由强到弱的排序,将相关系数绝对值最大的填补参考站点作为第一填补参考站,并依次确定得到k个填补参考站点。本申请实施例采取的技术方案还包括:在所述步骤c中,所述利用所述至少一个填补参考站点共有时间序列对应时刻的温度数据拟合待填补站点与所述至少一个填补参考站点之间的线性函数,通过所述线性函数对待填补站点的温度数据进行填补具体为:根据填补参考站点的相关性排序结果,依次利用k个填补参考站点共有时间序列对应时刻的温度数据逐一拟合待填补站点与k个填补参考站点之间的线性函数f1,f2,…fk,通过线性函数f1,f2,…fk对待填补站点温度数据缺失时刻的温度数据依次进行k次填补,其中,k为填补参考站点的数量。本申请实施例采取的技术方案还包括:在所述步骤c中,所述线性函数拟合公式为:f1(tn)=a1*C(tn)+b1f2(tn)=a2*A(tn)+b2f3(tn)=a3*D(tn)+b3上述公式中,ai,bi分别是拟合的一次项和常数项系数,fi(tn)是待填补站点与第i个填补参考站点的共有时间序列对应的温度数据拟合的线性函数,C(tn)、A(tn)、D(tn)分别是填补参考站点C、A、D在时刻tn的温度数据。本申请实施例采取的另一技术方案为:种温度缺失数据填补系统,包括:数据读取模块:用于分别读取待填补站点以及与待填补站点位于同一地区的各个观测站的温度数据;时间序列统计模块:用于根据所述温度数据统计待填补站点与各个观测站的共有时间序列;站点筛选模块:用于利用所述待填补站点与各个观测站的共有时间序列对应时刻的温度数据计算待填补站点与各个观测站之间的相关系数,并根据所述相关系数筛选出与待填补站点相关性最强的至少一个观测站作为填补参考站点;第一数据填补模块:用于利用所述至少一个填补参考站点共有时间序列对应时刻的温度数据拟合待填补站点与所述至少一个填补参考站点之间的线性函数,通过所述线性函数对待填补站点的温度数据进行填补。本申请实施例采取的技术方案还包括:所述数据读取模块还用于根据所述待填补站点的温度数据确定待填补站点的温度数据缺失时刻信息。本申请实施例采取的技术方案还包括:所述站点筛选模块还用于根据所述相关系数计算结果对至少一个填补参考站点进行相关性由强到弱的排序,将相关系数绝对值最大的填补参考站点作为第一填补参考站,并依次确定得到k个填补参考站点。本申请实施例采取的技术方案还包括:所述第一数据填补模块利用所述至少一个填补参考站点共有时间序列对应时刻的温度数据拟合待填补站点与所述至少一个填补参考站点之间的线性函数,通过所述线性函数对待填补站点的温度数据进行填补具体为:根据填补参考站点的相关性排序结果,依次利用k个填补参考站点共有时间序列对应时刻的温度数据逐一拟合待填补站点与k个填补参考站点之间的线性函数f1,f2,…fk,通过线性函数f1,f2,…fk对待填补站点温度数据缺失时刻的温度数据依次进行k次填补,其中,k为填补参考站点的数量。本申请实施例采取的技术方案还包括:所述线性函数拟合公式为:f1(tn)=a1*C(tn)+b1f2(tn)=a2*A(tn)+b2f3(tn)=a3*D(tn)+b3上述公式中,ai,bi分别是拟合的一次项和常数项系数,fi(tn)是待填补站点与第i个填补参考站点的共有时间序列对应的温度数据拟合的线性函数,C(tn)、A(tn)、D(tn)分别是填补参考站点C、A、D在时刻tn的温度数据。本申请实施例采取的又一技术方案为:一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的温度缺失数据填补方法的以下操作:步骤a:分别读取待填补站点以及与待填补站点位于同一地区的各个观测站的温度数据,并根据所述温度数据统计待填补站点与各个观测站的共有时间序列;步骤b:利用所述待填补站点与各个观测站的共有时间序列对应时刻的温度数据计算待填补站点与各个观测站之间的相关系数,并根据所述相关系数筛选出与待填补站点相关性最强的至少一个观测站作为填补参考站点;步骤c:本文档来自技高网
...

【技术保护点】
1.一种温度缺失数据填补方法,其特征在于,包括以下步骤:步骤a:分别读取待填补站点以及与待填补站点位于同一地区的各个观测站的温度数据,并根据所述温度数据统计待填补站点与各个观测站的共有时间序列;步骤b:利用所述待填补站点与各个观测站的共有时间序列对应时刻的温度数据计算待填补站点与各个观测站之间的相关系数,并根据所述相关系数筛选出与待填补站点相关性最强的至少一个观测站作为填补参考站点;步骤c:利用所述至少一个填补参考站点共有时间序列对应时刻的温度数据拟合待填补站点与所述至少一个填补参考站点之间的线性函数,通过所述线性函数对待填补站点的温度数据进行填补。

【技术特征摘要】
1.一种温度缺失数据填补方法,其特征在于,包括以下步骤:步骤a:分别读取待填补站点以及与待填补站点位于同一地区的各个观测站的温度数据,并根据所述温度数据统计待填补站点与各个观测站的共有时间序列;步骤b:利用所述待填补站点与各个观测站的共有时间序列对应时刻的温度数据计算待填补站点与各个观测站之间的相关系数,并根据所述相关系数筛选出与待填补站点相关性最强的至少一个观测站作为填补参考站点;步骤c:利用所述至少一个填补参考站点共有时间序列对应时刻的温度数据拟合待填补站点与所述至少一个填补参考站点之间的线性函数,通过所述线性函数对待填补站点的温度数据进行填补。2.根据权利要求1所述的温度缺失数据填补方法,其特征在于,所述步骤a中,还包括:根据所述待填补站点的温度数据确定待填补站点的温度数据缺失时刻信息。3.根据权利要求2所述的温度缺失数据填补方法,其特征在于,所述步骤b中,还包括:根据所述相关系数计算结果对至少一个填补参考站点进行相关性由强到弱的排序,将相关系数绝对值最大的填补参考站点作为第一填补参考站,并依次确定得到k个填补参考站点。4.根据权利要求3所述的温度缺失数据填补方法,其特征在于,在所述步骤c中,所述利用所述至少一个填补参考站点共有时间序列对应时刻的温度数据拟合待填补站点与所述至少一个填补参考站点之间的线性函数,通过所述线性函数对待填补站点的温度数据进行填补具体为:根据填补参考站点的相关性排序结果,依次利用k个填补参考站点共有时间序列对应时刻的温度数据逐一拟合待填补站点与k个填补参考站点之间的线性函数f1,f2,…fk,通过线性函数f1,f2,…fk对待填补站点温度数据缺失时刻的温度数据依次进行k次填补,其中,k为填补参考站点的数量。5.根据权利要求4所述的温度缺失数据填补方法,其特征在于,在所述步骤c中,所述线性函数拟合公式为:f1(tn)=a1*C(tn)+b1f2(tn)=a2*A(tn)+b2f3(tn)=a3*D(tn)+b3上述公式中,ai,bi分别是拟合的一次项和常数项系数,fi(tn)是待填补站点与第i个填补参考站点的共有时间序列对应的温度数据拟合的线性函数,C(tn)、A(tn)、D(tn)分别是填补参考站点C、A、D在时刻tn的温度数据。6.一种温度缺失数据填补系统,其特征在于,包括:数据读取模块:用于分别读取待填补站点以及与待填补站点位于同一地区的各个观测站的温度数据;时间序列统计模块:用于根据所述温度数据统计待填补站点与各个观测站的共有时间序列;站点筛选模块:用于利用所述待填补站点与各个观测站的共有时间序列对应时刻的温度数据计算待填补站点与各个观测站之间的相关系数,并根据所述相关系数筛选出与待填补站点相关性最强的至少一...

【专利技术属性】
技术研发人员:卢晓雄李晴岚李磊陈潜孙立群王霄雪
申请(专利权)人:中国科学院深圳先进技术研究院深圳市气象局
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1