System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于水利大数据的江河水位信息缺失修复方法技术_技高网
当前位置: 首页 > 专利查询>侯广华专利>正文

基于水利大数据的江河水位信息缺失修复方法技术

技术编号:41232453 阅读:2 留言:0更新日期:2024-05-09 23:48
本申请的基于水利大数据的江河水位信息缺失修复方法,面向不同水位数据缺失情形构建不同的解决方案,当水位信息缺失出现在离散的时间点时,基于水位信息的时间邻关联,采用三次样条插值法来修复数据;当水位信息缺失出现在连续的时间段时,基于水位信息的空间邻关联,采用多元线性回归模型来修复数据;当某些监测站同时监测水位和流量时,利用水位和流量之间的数据关联性,采用半监督回归来拟合水位和流量的关系,并用此函数关系来修复缺失的水位信息;修复的数据准确可靠,有效解决了水利信息化系统数据缺失问题,数据修复的准确性、实用性和适用性都达到了较高水平,提升对水文数据的利用效率,完善水利工程的使用价值。

【技术实现步骤摘要】

本申请涉及一种水利水位信息缺失修复方法,特别涉及一种基于水利大数据的江河水位信息缺失修复方法,属于水利信息缺失修复。


技术介绍

1、水利信息化已经成为当今世界建设与发展水利工程的一大趋势,利用高速发展的互联网技术,搭建水利信息系统,系统可以全程自动化的处理水利信息,包含采用硬件设备来采集水文数据,便捷的有线和无线网络来传输水文数据以及软件系统来处理和展示水文数据。采用高度信息化的水利系统,可以全面提升对水文数据的利用效率,完善水利工程的使用价值。

2、水利信息化系统或“智慧水利”工程都包含很多rtu(远程终端单元)监测设备,涉及到数据采集、存储以及与后台数据中心之间的通信。这些设备与移动通信、互联网相结合,共同组成水利信息化系统中的监测网络。一些监控和检测设备以及传输网络普遍处在偏僻的地理位置,自然环境恶劣,由于设备或网络自身的局限性,在数据监测和传输过程中,常常出现检测数据的缺失问题,这样水利信息化系统中信息的实时性和连续性受到了严重影响,给整个水利信息化系统的采用以及之后的管理带来了严峻的挑战。

3、如果数据库中水文监测数据缺失,首先会造成实际获取的水文监测信息的数据量,比设计信息系统时所预估的水文信息数据量小,造成事后统计分析或计算相关信息时准确度和精确度比实际的要低;其次,这些缺失的水文数据反应在数据库表中可能是空值(null),但却被系统当成是0值,这样实际缺失的水文数据却成为了未缺失的数据,给整个信息系统带来了误差;最后,一些水文数据分析挖掘算法或模型是建立在完整数据集上的,缺失数据的不完整数据集无法适用这些算法和模型。亟需行之有效的方法来解决此类数据缺失问题,使得信息系统能更加准确地指导相关部门开展水利工作。

4、现有技术的水利水位信息缺失修复方法需要解决的问题和本申请关键技术难点包括:

5、(1)水利信息化系统的一些监控和检测设备以及传输网络普遍处在偏僻的地理位置,自然环境恶劣,由于设备或网络自身的局限性,在数据监测和传输过程中,常出现检测数据的缺失问题,严重影响系统中信息的实时性和连续性,现有技术数据库中水文监测数据缺失,造成实际获取的水文监测信息的数据量,比设计预估的水文信息数据量小,造成事后统计分析或计算相关信息时准确度和精确度比实际的要低;其次,这些缺失的水文数据反应在数据库表中被当成是0值,给整个信息系统带来了误差;现有技术水文数据分析挖掘算法或模型是建立在完整数据集上的,缺失数据的不完整数据集无法适用这些算法和模型。现有技术缺少行之有效的方法来解决此类数据缺失问题,不利于信息系统准确指导相关部门开展水利工作。

6、(2)现有技术无法针对不同的水位信息缺失情形,对缺失的水位信息采用不同的模型来预测以及修复。现有技术水位数据缺失修复方案大多集中在均值修复、极大似然概率、多重修复等传统数理统计方法,而这些数论模型不能准确适用于水利水位信息缺失的所有情况,特别当获取到的数据特征变量不仅仅是水位信息的情形下,传统数理统计方法给出的预测值和实际值误差很大。针对离散时间点水位信息缺失情形,现有技术缺少基于时间邻关联来对缺失的水位信息进行修复;针对连续时间段水位信息缺失情形,现有技术缺少基于空间邻关联来对缺失的水位信息进行修复。现有技术缺少特定数量的特征向量对缺失的数据的修复,缺少对应的数据修复模型,无法将半监督回归应用于水位缺失数据修复,缺少适用于水位信息预测与修复的模型,水利数据修复准确性差,降低了水利信息系统的服务能力。

7、(3)现有技术面向不同数据缺失情形缺少不同的解决方案。针对水位信息缺失出现在某个监测站,且缺失的时间点分散在不同时刻,并且每个数据缺失时间点附近时刻都有完整的水位信息记录的情况,即水位信息缺失时间点近邻时刻的水位信息和缺失的水位信息具有联系,缺少三次样条插值法来对缺失的水位信息进行修复;针对水位信息缺失出现在某个监测站,但缺失的时间是连续的时间段,与其近邻地理位置上的其它监测站在同一时刻所采集到的水位信息具有关联,缺少基于空间邻关联构建多元线性回归模型;缺少基于监测数据关联性,当一个监测站水位信息缺失但雨量数据完整时,缺少基于数据相关性进行水位信息缺失修复。造成水位数据修复的针对性不强,数据修复的可靠性和效率较低。


技术实现思路

1、本申请面向不同水位数据缺失情形构建不同的解决方案,当水位信息缺失出现在离散的时间点时,基于水位信息的时间邻关联,采用三次样条插值法来修复数据;当水位信息缺失出现在连续的时间段时,基于水位信息的空间邻关联,采用多元线性回归模型来修复数据;当某些监测站同时监测水位和流量时,利用水位和流量之间的数据关联性,采用半监督回归来拟合水位和流量的关系,并用此函数关系来修复缺失的水位信息;修复的数据准确可靠,有效解决了水利信息化系统数据缺失问题,使得信息系统的利用价值更高,提升对水文数据的利用效率,完善水利工程的使用价值,能更加准确地指导相关部门开展水利工作。

2、为实现以上技术效果,本申请所采用的技术方案以下:

3、基于水利大数据的江河水位信息缺失修复方法,面向不同数据缺失情形构建不同的解决方案,当水位信息缺失出现在离散的时间点时,基于水位信息的时间邻关联,采用三次样条插值法来修复数据;当水位信息缺失出现在连续的时间段时,基于水位信息的空间邻关联,采用多元线性回归模型来修复数据;当某些监测站同时监测水位和流量时,利用水位和流量之间的数据关联性,采用半监督回归来拟合水位和流量的关系,并用此函数关系来修复缺失的水位信息;

4、s1-针对水位信息缺失出现在某个监测站,且缺失的时间点分散在不同时刻,并且每个数据缺失时间点附近时刻都有完整的水位信息记录的情况,基于同一个水位监测设备,其监测数据在时间是具有邻关联,即水位信息缺失时间点近邻时刻的水位信息和缺失的水位信息具有联系,采用三次样条插值法来对缺失的水位信息进行修复;

5、s2-针对水位信息缺失出现在某个监测站,但缺失的时间是连续的时间段,如果在这段时间段内,这个监测站近邻监测站的水位监测数据完整,基于空间邻关联,即同一时刻,某个监测站的水位监测数据,与其近邻地理位置上的其它监测站在同一时刻所采集到的水位信息具有关联,基于空间邻关联构建多元线性回归模型,解决连续时间段水位信息缺失问题;

6、s3-基于监测数据关联性,当一个监测站水位信息缺失但雨量数据完整时,构建半监督训练协同回归,基于数据相关性进行水位信息缺失修复。

7、优选地,离散时间点水位信息缺失修复:根据时间与水位在一段时间内的所具有的关系,当某个时间点出现数据缺失时,根据水位和时间所包含的函数关系,预测出所缺失的水位信息;

8、在外界自然环境没有发生很大变化时,监测设备监测到的水文数据值按照某种变化趋势呈现出平稳连续变化的特征,当某一时刻出现水位监测数据缺失时,根据监测数据在时间维度上的的关联关系,用近邻时刻所对应的监测数据,采用三次样条插值法来拟合时间和水位的关系曲线,对缺失的水位信息进行估算;<本文档来自技高网...

【技术保护点】

1.基于水利大数据的江河水位信息缺失修复方法,其特征在于,面向不同数据缺失情形构建不同的解决方案,当水位信息缺失出现在离散的时间点时,基于水位信息的时间邻关联,采用三次样条插值法来修复数据;当水位信息缺失出现在连续的时间段时,基于水位信息的空间邻关联,采用多元线性回归模型来修复数据;当某些监测站同时监测水位和流量时,利用水位和流量之间的数据关联性,采用半监督回归来拟合水位和流量的关系,并用此函数关系来修复缺失的水位信息;

2.根据权利要求1所述基于水利大数据的江河水位信息缺失修复方法,其特征在于,离散时间点水位信息缺失修复:根据时间与水位在一段时间内的所具有的关系,当某个时间点出现数据缺失时,根据水位和时间所包含的函数关系,预测出所缺失的水位信息;

3.根据权利要求1所述基于水利大数据的江河水位信息缺失修复方法,其特征在于,离散时间点数据修复过程:根据单个水位监测设备所监测的数据在实时性方面的缺失,构建一个基于插值法的修复方案,根据监测数据的时间邻关联,用发生数据缺失时刻附近时间点的数据,来对缺失的水位信息进行预估,并用预测值来对缺失数据进行修复;

4.根据权利要求1所述基于水利大数据的江河水位信息缺失修复方法,其特征在于,连续时间段水位信息缺失修复:针对测站点水位监测设备的监测数据非平稳变化特征,利用监测数据的空间邻关联,即地理位置相近的监测设备,其在相同时刻时采集到的监测值也相近。

5.根据权利要求1所述基于水利大数据的江河水位信息缺失修复方法,其特征在于,基于空间邻关联的多元线性回归模型:采用多元回归模型来描绘数据缺失设备节点Ri与其邻居设备节点的相关性,即对于任意时间点t,数据之间的关系如式1:

6.根据权利要求1所述基于水利大数据的江河水位信息缺失修复方法,其特征在于,连续时间段数据修复过程:首先,从数据集中选取出所有监测站都有水位信息的历史记录,并把这些数据作为训练样本,然后,用这些训练样本,求解其它监测站与水位信息缺失监测站之间的偏相关因子,得到各监测站之间的相关因子后,利用缺失值估算方程来求解出缺失的水位信息估算值,最后,采用估算值来对所缺失的水位信息进行修复;

7.根据权利要求1所述基于水利大数据的江河水位信息缺失修复方法,其特征在于,基于数据相关性的水位信息缺失修复方法:采用一种既利用数据缺失监测设备节点的时间邻关联和空间邻关联,同时也考虑这些不同的监测变量之间的逻辑相关性,采用半监督回归,解决水位监测设备的监测数据缺失问题。

8.根据权利要求1所述基于水利大数据的江河水位信息缺失修复方法,其特征在于,数据相关性修复:采用半监督回归来拟合水位和流量之间的函数关系,并用拟合之后的函数来估算缺失的水位信息;

9.根据权利要求1所述基于水利大数据的江河水位信息缺失修复方法,其特征在于,数据相关性数据修复过程:面向不同特征数据之间的相关性时,采用KNN回归来拟合水位和流量之间的函数关系,首先在数据集中筛选出带有标记的样本数据和未标记的样本数据作为整个训练数据集,然后用带有标记的样本数据来生成两个KNN回归模型,设定不同距离度量,接着再采用未标记的样本数据来改善这两个KNN模型,直至KNN在整个训练数据集中的均方误差最小,认定此时的KNN模型为最佳,最后分别用这两个KNN模型来计算出预测值,两个预测值求平均,即为最终的预测值,采用这个最终的预测值来修复所缺失的水位信息。

...

【技术特征摘要】

1.基于水利大数据的江河水位信息缺失修复方法,其特征在于,面向不同数据缺失情形构建不同的解决方案,当水位信息缺失出现在离散的时间点时,基于水位信息的时间邻关联,采用三次样条插值法来修复数据;当水位信息缺失出现在连续的时间段时,基于水位信息的空间邻关联,采用多元线性回归模型来修复数据;当某些监测站同时监测水位和流量时,利用水位和流量之间的数据关联性,采用半监督回归来拟合水位和流量的关系,并用此函数关系来修复缺失的水位信息;

2.根据权利要求1所述基于水利大数据的江河水位信息缺失修复方法,其特征在于,离散时间点水位信息缺失修复:根据时间与水位在一段时间内的所具有的关系,当某个时间点出现数据缺失时,根据水位和时间所包含的函数关系,预测出所缺失的水位信息;

3.根据权利要求1所述基于水利大数据的江河水位信息缺失修复方法,其特征在于,离散时间点数据修复过程:根据单个水位监测设备所监测的数据在实时性方面的缺失,构建一个基于插值法的修复方案,根据监测数据的时间邻关联,用发生数据缺失时刻附近时间点的数据,来对缺失的水位信息进行预估,并用预测值来对缺失数据进行修复;

4.根据权利要求1所述基于水利大数据的江河水位信息缺失修复方法,其特征在于,连续时间段水位信息缺失修复:针对测站点水位监测设备的监测数据非平稳变化特征,利用监测数据的空间邻关联,即地理位置相近的监测设备,其在相同时刻时采集到的监测值也相近。

5.根据权利要求1所述基于水利大数据的江河水位信息缺失修复方法,其特征在于,基于空间邻关联的多元线性回归模型:采用多元回归模型来描绘数据缺失设备节点ri与其邻居设备节点的相关性,即对于任意时间点t,数据之间的关...

【专利技术属性】
技术研发人员:侯广华马斌斌
申请(专利权)人:侯广华
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1