当前位置: 首页 > 专利查询>河海大学专利>正文

基于单场降雨类型的降雨站点相似性评价方法技术

技术编号:8079004 阅读:197 留言:0更新日期:2012-12-13 21:52
本发明专利技术公开了一种基于单场降雨类型的降雨站点相似性评价方法,属于水文水资源与数据挖掘技术交叉领域。首先提取降雨时间序列中的雨量项,经过数据预处理,选择和提取单场降雨特征,并将这些特征进行数据标准化处理;采用基于DBI指数的K-means自动聚类方法进行聚类,最后根据聚类结果计算降雨类型直方图进行相似性分析。本发明专利技术方法具有计算方法简单,但能包含降雨时间序列更多更细粒度信息,真正反映降雨站点相似性的优点。

【技术实现步骤摘要】

本专利技术涉及一种降雨站点相似性评价方法,尤其涉及一种,,属于水文水资源与数据挖掘技术交叉领域。
技术介绍
时间序列是一种在科学研究、商业应用中普遍存在的数据形式,如灾变预测,降雨预测,金融数据和电力负载数据预测等。在水文领域中,对时间序列的研究由来已久,通过研究水文时间序列的时空规律,对洪水暴雨等自然灾害进行预测,为流域水利建设及社会建设提供决策依据。降雨是水资源的主要来源之一,水资源是社会经济发展的重要支撑和保障条件,水利、农业以及生态系统都受其影响。因此,研究 降雨时间序列对社会经济可持续发展和农业水利事业布局具有重要的意义。目前我国大部分地区雨量站分布稀疏,许多雨量站设站时间较晚,部分站点降雨资料只有短短几年。为了更准确地认识水文现象和解决水资源问题,需要对缺失资料的站点数据进行补充,也需要设立新的观测站点,去除旧的冗余站点。因此有必要对降雨站点进行相似性研究,为水资源管理提供新的技术支撑。以往对降雨时间序列的研究主要包括降雨预测、极值分布、周期分析和降水场的时空分布等。例如,陈晓宏等将模式识别的聚类分析理论方法引入降雨空间特征分类研究,进行降雨特征空间分布模式识别,预测无雨量站点的降雨模式。以年降雨量的变换数据为基础,结合高程、气温和蒸发量作为特征参数,分析不同聚类数下的分类有效性,将雨量站点类型分为六类,再经过模型验证,预测无记录的站点归类,为降雨资料的插补延长提供了一种新的途径;张国建等利用最大年降水量与最小年降水量比值来分析降水量的年际变化特征;苏布达等利用weibull分布分析了长江流域降水极值时间序列的分布特征;王兆礼等采用Morlet小波函数对东江流域在不同时间尺度下的降雨周期和突变点进行了研究;刘德地等将云模型引入到降雨量时空分布特性的研究中;欧春平等研究了基于信息熵的流域水文要素时空变异;巴金福等根据黄河上游逐月降水资料分析了汛期降雨量的变化趋势和空间分布特征及其变化。降雨序列实质是一个不连续的时间序列,大多数此前的研究,都是基于日月或年降雨量单纯累积的宏观统计分析,没有从更细粒度分析单场降雨的统计特征。而单场降雨序列恰恰包含了更丰富的降雨信息,能反映降雨序列的本质。例如单独对两个站点一年的降雨进行统计,同样降雨量总和为IOOOmm的降雨,可能是8场单场降雨为125mm,也可能是20场单场降雨为50mm,甚至还可能是若干场不同降雨量,不同持续天数的降雨。若单纯利用年降雨量的累计而不考虑单场降雨,则无法区分一年内两个站点降雨类型的差异,更无法区分降雨持续的时间等信息;若考虑单场降雨的情况,则可以区分出站点更多的降雨信息,除了单场降雨和,单场降雨日均值,大于或小于某个临界值的降雨量,降雨天数等更多降雨信息。
技术实现思路
本专利技术所要解决的技术问题在于克服现有技术的不足,提供一种,针对降雨时间序列不连续的特点,对单场降雨的各种特征进行统计分析,通过研究基于单场降雨的降雨序列相似性,继而研究区域降雨的相似性。本专利技术的,包括以下步骤步骤A、从降雨站点一段时期雨量历史数据中提取各单场降雨的以下统计特征量单场降雨雨量和、单场降雨天数、单场降雨日平均降雨量、单场降雨日降雨量最大值、单场降雨日降雨量最小值、单场降雨日降雨量小于I. 27mm的雨量之和、单场降雨日降雨量小于I. 27mm的降雨天数、单场降雨日降雨量大于50mm的雨量之和、单场降雨日降雨量大于50mm的降雨天数;各单场降雨的以上统计特征量构成该单场降雨的特征向量; 步骤B、对所有单场降雨的特征向量进行均值为0,方差为I的标准化;步骤C、对标准化后的单场降雨的特征向量进行聚类,从而将各单场降雨归入相应的类别中;步骤D、对聚类得到的各类别的单场降雨场次数目进行归一化处理,统计每个站点的降雨类型直方图;步骤E、根据下式计算任意两个降雨站点M和N的降雨类型直方图的相似度Sim(M, N),相似度越大表示两个降雨站点的相似性越高 权利要求1.,其特征在于,包括以下步骤 步骤A、从降雨站点一段时期雨量历史数据中提取各单场降雨的以下统计特征量单场降雨雨量和、单场降雨天数、单场降雨日平均降雨量、单场降雨日降雨量最大值、单场降雨日降雨量最小值、单场降雨日降雨量小于I. 27mm的雨量之和、单场降雨日降雨量小于I.27mm的降雨天数、单场降雨日降雨量大于50mm的雨量之和、单场降雨日降雨量大于50mm的降雨天数;各单场降雨的以上统计特征量构成该单场降雨的特征向量; 步骤B、对所有单场降雨的特征向量进行均值为0,方差为I的标准化; 步骤C、对标准化后的单场降雨的特征向量进行聚类,从而将各单场降雨归入相应的类别中; 步骤D、对聚类得到的各类别的单场降雨场次数目进行归一化处理,统计每个站点的降雨类型直方图; 步骤E、根据下式计算任意两个降雨站点M和N的降雨类型直方图的相似度Sim (M3N),相似度越大表示两个降雨站点的相似性越高2.如权利要求I所述,其特征在于,对标准化后的单场降雨的特征向量进行聚类时,采用基于DBI指数的K-means自动聚类算法,具体如下 步骤Cl、设置聚类类别数K的初始值为MinK,MinK为预设的2到10之间的自然数;步骤C2、判断K是否小于等于预设的阈值MaxK,MaxK为大于MinK的自然数;如果是,则随机从样本数据中取K个聚类中心,转向步骤C2,否则转向步骤C7 ; 步骤C3、分别计算各个样本点到各聚类中心的距离,并且将该样本点归到与其距离最近的类中; 步骤C4、将所有样本点归类结束之后,重新计算这K个类别的聚类中心; 步骤C5、比较新计算的K个聚类中心与步骤C2中选取的聚类中心是否相同,若不同,则转向步骤C3 ;否则,转向步骤C6 ; 步骤C6、计算此时的DBI指数,并使K=K+1,转向步骤C2 ; 步骤C7、比较所有的DBI指数值,将DBI指数值最小的K所对应的聚类结果作为最终的聚类结果输出。3.如权利要求2所述,其特征在于,所述阈值MaxK的取值范围为15到30。全文摘要本专利技术公开了一种,属于水文水资源与数据挖掘技术交叉领域。首先提取降雨时间序列中的雨量项,经过数据预处理,选择和提取单场降雨特征,并将这些特征进行数据标准化处理;采用基于DBI指数的K-means自动聚类方法进行聚类,最后根据聚类结果计算降雨类型直方图进行相似性分析。本专利技术方法具有计算方法简单,但能包含降雨时间序列更多更细粒度信息,真正反映降雨站点相似性的优点。文档编号G06F19/00GK102819677SQ20121026838公开日2012年12月12日 申请日期2012年7月30日 优先权日2012年7月30日专利技术者朱跃龙, 李士进, 章龙飞, 万定生, 高祥涛, 柏屏 申请人:河海大学本文档来自技高网
...

【技术保护点】
基于单场降雨类型的降雨站点相似性评价方法,其特征在于,包括以下步骤:步骤A、从降雨站点一段时期雨量历史数据中提取各单场降雨的以下统计特征量:单场降雨雨量和、单场降雨天数、单场降雨日平均降雨量、单场降雨日降雨量最大值、单场降雨日降雨量最小值、单场降雨日降雨量小于1.27mm的雨量之和、单场降雨日降雨量小于1.27mm的降雨天数、单场降雨日降雨量大于50mm的雨量之和、单场降雨日降雨量大于50mm的降雨天数;各单场降雨的以上统计特征量构成该单场降雨的特征向量;步骤B、对所有单场降雨的特征向量进行均值为0,方差为1的标准化;步骤C、对标准化后的单场降雨的特征向量进行聚类,从而将各单场降雨归入相应的类别中;步骤D、对聚类得到的各类别的单场降雨场次数目进行归一化处理,统计每个站点的降雨类型直方图;步骤E、根据下式计算任意两个降雨站点:M和N的降雨类型直方图的相似度???????????????????????????????????????????????,相似度越大表示两个降雨站点的相似性越高:式中,K为步骤C得到的单场降雨的类别数,和分别为降雨站点M、降雨站点N的第i类单场降雨的归一化后的场次;A和B分别为降雨站点M、降雨站点N的单场降雨场次总数。2012102683812100001dest_path_image002.jpg,2012102683812100001dest_path_image004.jpg,2012102683812100001dest_path_image006.jpg,2012102683812100001dest_path_image008.jpg...

【技术特征摘要】

【专利技术属性】
技术研发人员:朱跃龙李士进章龙飞万定生高祥涛柏屏
申请(专利权)人:河海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1