当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于洪峰参考集的中小河流流域相似性判别方法技术

技术编号:20655077 阅读:23 留言:0更新日期:2019-03-23 06:47
本发明专利技术公开了一种基于洪峰参考集的中小河流流域相似性判别方法,首先进行洪峰分割,提取洪峰模式,即根据水位数据变化趋势找出洪峰过程分割的起止点,采用起止点之间的水位序列代表洪峰模式;然后训练洪峰参考集:依次利用极大值过滤法、最大距离方差选择和最小相关选择从洪峰模式序列集中筛选出预设数目的洪峰模式序列,作为洪峰参考集;最后利用DTW距离度量待查询流域与其他流域的洪峰参考集中洪峰模式序列之间的距离,判断时间序列相似性,得到在洪峰模式上与待查询流域相似度最高的流域。本发明专利技术通过数据挖掘实现中小流域相似性进行定量分析和判断,解决现有技术无法针对洪水特性实现流域量化分析的技术问题。

【技术实现步骤摘要】
一种基于洪峰参考集的中小河流流域相似性判别方法
本专利技术属于相似性判断
,具体涉及一种基于洪峰参考集的中小河流流域相似性判别方法。
技术介绍
通过数据挖掘技术比较分析不同流域间的水文特征,对相似流域进行查找,或者多个流域进行分类比较,对水文资料的补充、中小流域防洪减灾、流域治理、水土保持等具有重要意义。现有的流域相似分析并没有直接对中小流域进行相似性分析,因为中小流域的数据往往是具有较多的特征数据,对于这种高维且复杂的数据集,现有的流域相似分析效果并不理想,且大都通过水文模块或者数学模型来实现流域相似性分析,无法进行量化分析,需要过多的人工参与和计算,分析的过程往往效率低下。此外,现有的中小流域相似研究并没有针对流域的某些重要特性进行分析,比如洪水就是中小流域的重要特性之一。中国众多大的江河历来是防洪抗灾的重点防护对象,所以其灾害防御标准一直很高。但是在中小流域区,由于流域过多而且每个地区都具有错综复杂不同情形,以至于防御山洪灾害的能力普遍较低。故现有技术无法准确对中小流域在某些特定场景下的相似性分析进行分析。
技术实现思路
为解决上述问题,本专利技术提出一种基于洪峰参考集的中小河流流域相似性判别方法,通过数据挖掘实现中小流域相似性进行定量分析和判断,解决现有技术无法针对洪水特性实现流域量化分析的技术问题。本专利技术采用如下技术方案,一种基于洪峰参考集的中小河流流域相似性判别方法,具体步骤如下:1)进行洪峰分割,提取洪峰模式,即根据水位数据变化趋势找出洪峰过程分割的起止点,采用起止点之间的水位序列代表洪峰模式;2)训练洪峰参考集:依次利用极大值过滤法、最大距离方差选择和最小相关选择从洪峰模式序列集中筛选出预设数目的洪峰模式序列,作为洪峰参考集;3)利用DTW距离度量待查询流域与其他流域的洪峰参考集中洪峰模式序列之间的距离,判断时间序列相似性,得到在洪峰模式上与待查询流域相似度最高的流域。优选地,所述步骤1)提取洪峰模式具体为,基于水位阈值对水位序列进行洪峰粗分割提取子序列,得到候选洪峰模式序列集;设定再分割阈值,使用洪峰细分法对候选洪峰模式序列集进行洪峰细分割提取,得到洪峰模式序列集。优选地,所述步骤1)中,在进行洪峰粗分割前,对水位序列进行预处理,具体为通过ETL处理水位序列。优选地,所述洪峰粗分割提取,具体步骤为:11)遍历水位序列X,提取水位序列X中所有极值点,组成极值点序列M;12)寻找第一个水位小于水位阈值δ的极值点(xi,pi),作为候选洪峰模式序列的起始点,其中xi和pi分别表示极值点序列M中第i个极值点的时间和水位;13)在极值点序列M中,寻找(xi,pi)之后的第一个满足设定条件的极值点,设定条件为极值点(xj,pj)水位大于水位阈值δ,且极值点(xj+1,pj+1)水位小于水位阈值δ,将(xj+1,pj+1)作为候选洪峰模式序列的终止点,将{(xi,pi),(xj+1,pj+1)}作为候选洪峰模式序列插入候选洪峰模式序列集F中,其中xj和pj分别表示极值点序列M中第j个极值点的时间和水位,xj+1和pj+1分别表示极值点序列M中第j+1个极值点的时间和水位;14)循环执行步骤12)和13),至极值点序列M遍历结束,得到候选洪峰模式序列集F。优选地,所述洪峰细分割提取,具体步骤为:15)计算候选洪峰模式序列集F中候选洪峰模式序列Fx的最大值MaxP;16)提取候选洪峰模式序列Fx中全部极小值点,组成候选洪峰模式序列Fx的极小值点序列N;17)将候选洪峰模式序列Fx的第一个点作为细分割提取的第一个洪峰模式序列的起始点;18)在极小值点序列N中,寻找第一个满足设定条件的极小值点(nt,pt)当作洪峰模式序列的终止点,设定条件为极小值点(nt,pt)的水位小于再分割阈值,本实施中设置再分割阈值为MaxP/10,并将极小值点(nt,pt)作为下一个洪峰模式序列的起始点,其中nt,pt分别表示极小值点序列N中第t个极小值点的时间和水位;19)循环执行步骤18),至极小值点序列N遍历完;对候选洪峰模式序列集F中的每个候选洪峰模式序列均执行步骤15)至步骤19),得到所有洪峰模式序列,组成洪峰模式序列集RF。优选地,所述步骤2)中训练洪峰参考集,具体步骤为:21)利用极大值过滤法进行筛选:计算洪峰模式序列集RF洪峰模式序列的极大值中位数m,乘以预设的阈值系数ζ,得到过滤阈值,过滤掉最大值小于过滤阈值的洪峰模式序列,以筛选出峰值较高值得关注的洪峰模式序列,得到初始洪峰参考集;22)利用最大距离方差选择处理初始洪峰参考集:洪峰距离方差为洪峰模式序列与其他洪峰模式序列间度量距离以及与其他洪峰模式序列间洪峰数目的差值叠加形成的数组的方差。筛选出洪峰距离方差最大的p个洪峰模式序列,p为预定数目。所述洪峰模式序列与其他洪峰模式序列间度量距离具体为洪峰模式序列与其他洪峰模式序列的DTW距离;23)利用最小相关选择处理最大距离方差筛选出的p个洪峰模式序列:遍历步骤22)得到的p个洪峰模式序列,分析不同洪峰模式序列间的相关性,计算两两洪峰模式序列之间的相关系数,按相关系数从大到小的顺序排列洪峰模式序列对,删除前m个洪峰模式序列对中的一条序列,m为预定数目,即剔除相关性较大的洪峰模式序列,最终得出洪峰参考集。优选地,所述步骤3)中得到在洪峰模式上与待查询流域相似度最高的流域,具体步骤如下:31)遍历待查询流域洪峰参考集中的每个洪峰模式序列O;32)计算步骤31)中洪峰模式序列O与洪峰集合内其他流域洪峰参考集中洪峰模式序列的DTW距离矩阵;33)选取步骤32)得到的洪峰集合内其他流域参考集中与洪峰模式序列O之间的DTW距离最小的四个洪峰模式序列,作为与洪峰模式序列O相似的序列,采用加权投票法为相似的序列所在流域投票;34)遍历待查询流域洪峰参考集中的洪峰模式序列,统计得到票数最高的流域即为与待查询流域在洪峰模式上相似度最高的流域。专利技术所达到的有益效果:本专利技术是一种基于洪峰参考集的中小河流流域相似性判别方法,通过数据挖掘实现中小流域相似性进行定量分析和判断,解决现有技术无法针对洪水特性实现流域量化分析的技术问题。本专利技术通过粗细分洪峰的时间序列切割方法,从长时间序列中分割得到洪峰模式,洪峰粗分割和细分割使得对数据的分割更为精细,有助于得到洪峰模式集;通过极大值过滤法、最大方差选择、最小相关性选择等参考集训练方法,更直观的得出其中的典型洪峰模式;本专利技术的基于水位洪峰模式的相似性判别方法为中小流域相似性分析提供有效的参考。附图说明图1为本专利技术实施例的方法流程图;图2为本专利技术中实施例翰林桥站2008年至2010年洪峰粗分割提取示意图;图3为本专利技术中实施例神山站2008年至2010年洪峰粗分割提取示意图。图4位本专利技术中实施例翰林桥站的洪峰模式过程图。具体实施方式下面根据附图并结合实施例对本专利技术的技术方案作进一步阐述。洪峰模式定义为具有相似特征的一段水位数据的集合,洪峰过程一般先通过多个局部的波动达到水位最高点,然后再通过多个水位波动达到阈值水位之下。图1为本专利技术实施例的方法流程图;本专利技术采用如下技术方案,一种基于洪峰参考集的中小河流流域相似性判别方法,包括以下步骤:S1:进行洪峰分割,提取洪峰模式,即根据水位数据变化趋势找出本文档来自技高网...

【技术保护点】
1.一种基于洪峰参考集的中小河流流域相似性判别方法,其特征在于,包括:1)进行洪峰分割,提取洪峰模式,即根据水位数据变化趋势找出洪峰过程分割的起止点,采用起止点之间的水位序列代表洪峰模式;2)训练洪峰参考集:依次利用极大值过滤法、最大距离方差选择和最小相关选择从洪峰模式序列集中筛选出预设数目的洪峰模式序列,作为洪峰参考集;3)利用DTW距离度量待查询流域与其他流域的洪峰参考集中洪峰模式序列之间的距离,判断时间序列相似性,得到在洪峰模式上与待查询流域相似度最高的流域。

【技术特征摘要】
1.一种基于洪峰参考集的中小河流流域相似性判别方法,其特征在于,包括:1)进行洪峰分割,提取洪峰模式,即根据水位数据变化趋势找出洪峰过程分割的起止点,采用起止点之间的水位序列代表洪峰模式;2)训练洪峰参考集:依次利用极大值过滤法、最大距离方差选择和最小相关选择从洪峰模式序列集中筛选出预设数目的洪峰模式序列,作为洪峰参考集;3)利用DTW距离度量待查询流域与其他流域的洪峰参考集中洪峰模式序列之间的距离,判断时间序列相似性,得到在洪峰模式上与待查询流域相似度最高的流域。2.根据权利要求1所述的一种基于洪峰参考集的中小河流流域相似性判别方法,其特征在于,所述步骤1)提取洪峰模式具体为,基于水位阈值对水位序列进行洪峰粗分割提取子序列,得到候选洪峰模式序列集;设定再分割阈值,使用洪峰细分法对候选洪峰模式序列集进行洪峰细分割提取,得到洪峰模式序列集。3.根据权利要求2所述的一种基于洪峰参考集的中小河流流域相似性判别方法,其特征在于,所述步骤1)中,在进行洪峰粗分割前,对水位序列进行预处理,具体为通过ETL处理水位序列。4.根据权利要求2所述的一种基于洪峰参考集的中小河流流域相似性判别方法,其特征在于,所述洪峰粗分割提取,具体步骤为:11)遍历水位序列X,提取水位序列X中所有极值点,组成极值点序列M;12)寻找第一个水位小于水位阈值δ的极值点(xi,pi),作为候选洪峰模式序列的起始点,其中xi和pi分别表示极值点序列M中第i个极值点的时间和水位;13)在极值点序列M中,寻找(xi,pi)之后的第一个满足设定条件的极值点,设定条件为极值点(xj,pj)水位大于水位阈值δ,且极值点(xj+1,pj+1)水位小于水位阈值δ,将(xj+1,pj+1)作为候选洪峰模式序列的终止点,将{(xi,pi),(xj+1,pj+1)}作为候选洪峰模式序列插入候选洪峰模式序列集F中,其中xj和pj分别表示极值点序列M中第j个极值点的时间和水位,xj+1和pj+1分别表示极值点序列M中第j+1个极值点的时间和水位;14)循环执行步骤12)和13),至极值点序列M遍历结束,得到候选洪峰模式序列集F。5.根据权利要求2所述的一种基于洪峰参考集的中小河流流域相似性判别方法,其特征在于,所述洪峰细分割提取,具体步骤为:15)计算候选洪峰模式序列集F中候选洪峰模式序列Fx的最大值MaxP;16)提取候选洪峰模式序列Fx中全部极小值点,组成候选洪峰模式序列Fx的极小值点序列N;17)将候选洪峰模式序列Fx的第一个点作为...

【专利技术属性】
技术研发人员:万定生周金玉赵群阮祥超石波沈强
申请(专利权)人:河海大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1