一种基于聚类的降水日变化类型划分与空间分布提取方法技术

技术编号:21297316 阅读:28 留言:0更新日期:2019-06-12 06:56
本发明专利技术公开了一种基于聚类的降水日变化类型划分与空间分布提取方法,包括基于多年逐小时的栅格降水数据,统计得到每个栅格单元每个降水指标对应一个24维的向量;对得到的24维降水日变化数据做标准化处理;采用不同的聚类数据,基于KMeans算法对标准化后的降水日变化数据进行聚类;分析聚类结果,确定最优聚类数目;归并聚类结果中的相似类,得到降水日变化分类方案,并计算每类的平均日变化特征,归并后所得到的聚类结果中各个类型所包含栅格单元的位置构成降水日变化特征的空间分布图。本发明专利技术突破了现有研究降水日变化研究中区域确定主观性强、所提取降水日变化特征准确性差等问题,在降水预报、气象灾害预警等领域具有广阔应用前景。

【技术实现步骤摘要】
一种基于聚类的降水日变化类型划分与空间分布提取方法
本专利技术属于降水预报、气象灾害预警相关领域,涉及一种基于聚类的降水日变化类型划分与空间分布提取方法。
技术介绍
受太阳辐射、下垫面和地形等因素影响,降水在一天24小时的分布不是均一的,而是呈现出一定规律性(例如有的区域夜雨偏多),并具有显著的区域差异。降水日变化的分类与空间分布信息可以帮助探明区域的降水形成机制、验证和改进气象预报模型、辅助气象灾害预警,具有重要的理论和应用价值。现有的降水日变化类型划分和空间分布提取方法通常采用“自上而下”的方式进行,即:依据自然地理区域或是规则的矩形区域预先定义区域边界,然后进行区域内的日变化特征提取与特征刻画。但是这种预先定义区域的方式依赖执行者的经验知识,存在一定程度的主观性,且难以准确刻画日变化特征的空间分布。近年来,空间上连续分布的栅格降水数据(如GPM、CMORPH等)使得采用“自下而上”的数据挖掘方法来探索降水日变化的空间分布成为可能。通过“自下而上”的方式,可以根据基本栅格单元的降水日变化特征,将其分为不同的类型,每个类型中的基本单元具有相似的降水日变化,这些单元的位置构成了降水日变化的空间分布。这种方式可以用栅格降水数据客观地确定降水日变化的空间分布,在降水预报、气象灾害预警等领域具有广阔的应用前景。
技术实现思路
专利技术目的:为克服当前降水日变化研究中区域确定主观性强、所提取降水日变化特征准确性差等问题,提供一种基于聚类的降水日变化类型划分与空间分布提取方法,采用“自下而上”的数据挖掘方法,从连续分布的栅格降水数据中,获取一个相对客观的、易于理解的降水日变化空间分布模式。技术方案:为实现上述专利技术目的,本专利技术采用以下技术方案:一种基于聚类的降水日变化类型划分与空间分布提取方法,包括以下步骤:(1)基于多年逐小时的栅格降水数据,统计各栅格单元上降水量、降水频率和降水强度在一天中各小时的多年平均值,统计结果为每个栅格单元每个降水指标对应一个24维的向量;(2)对步骤(1)中得到的24维降水日变化数据做标准化处理,去除因天气形势所导致的降水日变化差异;(3)采用不同的聚类数据,基于KMeans算法对标准化后的降水日变化数据进行聚类,将具有相似降水日变化形态特征的栅格单元聚成一类;(4)分析聚类结果,确定最优聚类数目;(5)归并聚类结果中的相似类,得到降水日变化分类方案,并计算每类的平均日变化特征,归并后所得到的聚类结果中各个类型所包含栅格单元的位置即构成了降水日变化特征的空间分布图。进一步的,所述步骤(2)标准化处理降水日变化数据的方法为:遍历每个栅格单元的24小时降水日变化数据,首先,计算每个栅格单元24小时降水数据的平均值;然后,判断平均值是否为0,按如下方式标准化日变化数据:①如果平均值为0,则标准化后的数值为0;②若平均值不为0,则根据公式求得标准化的数据值,其中,Da(h)是该栅格单元第h小时的标准化数据值,Ra(h)代表第h小时的原始数据。进一步的,所述步骤(3)对降水日数据的聚类方法为:读取步骤(2)求得的所有栅格单元标准化后的24维日变化时间序列数据,存入二维数组,每行日变化数据即中国区对应索引号的栅格单元的日变化数据,利用KMeans聚类算法进行聚类分析,聚类算法为‘kmeans++’,为了弥补初始质心的影响,算法重复运行10次,然后返回最好的结果,聚类结果为每个栅格单元所属的聚类簇的编号,将每个栅格单元的分析结果对应到其空间位置,非中国区域赋值-99;设置不同的聚类数进行聚类,对于每个聚类结果,求得属性空间中各栅格单元到各自所属聚类中心的总距离和,并将所有聚类数的距离和存储到一个文本文档中。进一步的,所述步骤(4)聚类数目的确定方法为:根据步骤(3)中得到的不同聚类数下各单元到聚类中心的距离和,计算该距离和与总的栅格单元数的比值,得到每个栅格单元到聚类中心的平均距离,绘制平均距离随聚类簇数目变化的曲线图,计算相邻两个聚类数平均距离的差值,按照聚类数从小到大判断该差值是否小于给定阈值,将第一个差值小于给定阈值的聚类数作为最优聚类数。进一步的,所述步骤(5)相似聚类的归并方法为:计算最优聚类数结果中,每个类的24小时平均降水日变化,并绘制日变化曲线,如果曲线的峰值时间属于凌晨:2:00-6:00,早晨:6:00-10:00,正午:10:00-14:00,下午:14:00-18:00,晚间:18:00-22:00,或午夜:22:00-2:00这6个时间段的相同时间段,则合并为一类;对于多峰值的类,如果所有峰值时间都落入相同的时间段,则合并为一类,对合并的类再求平均日变化数据,得到各类最终的降水日变化特征曲线;然后进行重分类操作,合并峰值时段相同的类,得到最终的降水日变化空间分布图。本专利技术的原理是:近年来出现的栅格降水数据能够更为详细地描述降水空间分布,而小时尺度的栅格降水产品为降水日变化的类型划分和空间分布提取提供了新的数据集。本专利技术将数据挖掘方法用于小时尺度的栅格降水产品,通过聚类算法挖掘栅格降水数据中的模式,将具有相似降水日变化形态特征的栅格单元聚成一类,然后归并聚类结果中的相似类,得到降水日变化分类方案,所得到结果中各个类型所包含栅格单元的位置即构成了降水日变化特征的空间分布图。通过该方法可获取精细、客观的降水日变化类型与空间分布信息。有益效果:现有技术中预先定义研究区的过程往往依赖于研究者的经验知识,存在一定程度上的主观性,得到的结果不够客观、所得空间分布过于粗略。与现有技术相比,本专利技术采用“自下而上”的数据挖掘算法,根据降水数据采用数据驱动的方法获取降水日变化的类型与空间分布,较现有方法更加客观和精细。附图说明图1为本专利技术的实现流程图;图2为聚类数较少(5类)、最佳(19类)和较多(30类)的结果空间对比分布图(以降水频率为例);图3为各样点到聚类中心的平均距离以及每两类间的平均距离差值随聚类数的变化曲线(以降水频率为例);图4为中国陆地区域上的夏季(6、7、8月)降水日变化最终提取结果及其各类的降水日变化特征曲线(以降水频率为例)。具体实施方式下面结合附图和具体实施例对本专利技术的技术方案进行详细说明。以下实施例仅是本专利技术的优选实施方式,应当指出,对于本
的普通技术人员来说,在不脱离本专利技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视作本专利技术的保护范围。本专利技术的一种基于聚类的降水日变化类型划分与空间分布提取方法,对栅格降水数据各个单元的降水(降水量、频率、强度)日变化时间序列数据进行聚类分析,并进行类型划分和空间映射,实现对降水日变化空间分布的提取。具体为:基于多年逐小时的网格降水数据,统计各栅格单元上降水量、降水频率和降水强度在一天中各小时的多年平均值,统计结果为每个栅格单元每个降水指标对应一个24维的向量(对应24小时);对降水日变化数据做标准化处理,去除因天气形势所导致的降水日变化差异;基于KMeans算法对标准化后的降水日变化数据进行聚类,将具有相似降水日变化的栅格单元聚成一类;归并聚类结果中的相似类,得到降水日变化分类方案,并计算每类的平均日变化特征;所得到结果中各个类型所包含栅格单元的位置构成了降水日变化特征的空间分布图。本专利技术突破了现有研究降水本文档来自技高网
...

【技术保护点】
1.一种基于聚类的降水日变化类型划分与空间分布提取方法,其特征在于,包括以下步骤:(1)基于多年逐小时的栅格降水数据,统计各栅格单元上降水量、降水频率和降水强度在一天中各小时的多年平均值,统计结果为每个栅格单元每个降水指标对应一个24维的向量;(2)对步骤(1)中得到的24维降水日变化数据做标准化处理,去除因天气形势所导致的降水日变化差异;(3)采用不同的聚类数据,基于KMeans算法对标准化后的降水日变化数据进行聚类,将具有相似降水日变化形态特征的栅格单元聚成一类;(4)分析聚类结果,确定最优聚类数目;(5)归并聚类结果中的相似类,得到降水日变化分类方案,并计算每类的平均日变化特征,归并后所得到的聚类结果中各个类型所包含栅格单元的位置即构成了降水日变化特征的空间分布图。

【技术特征摘要】
1.一种基于聚类的降水日变化类型划分与空间分布提取方法,其特征在于,包括以下步骤:(1)基于多年逐小时的栅格降水数据,统计各栅格单元上降水量、降水频率和降水强度在一天中各小时的多年平均值,统计结果为每个栅格单元每个降水指标对应一个24维的向量;(2)对步骤(1)中得到的24维降水日变化数据做标准化处理,去除因天气形势所导致的降水日变化差异;(3)采用不同的聚类数据,基于KMeans算法对标准化后的降水日变化数据进行聚类,将具有相似降水日变化形态特征的栅格单元聚成一类;(4)分析聚类结果,确定最优聚类数目;(5)归并聚类结果中的相似类,得到降水日变化分类方案,并计算每类的平均日变化特征,归并后所得到的聚类结果中各个类型所包含栅格单元的位置即构成了降水日变化特征的空间分布图。2.根据权利要求1所述的一种基于聚类的降水日变化类型划分与空间分布提取方法,其特征在于,所述步骤(2)标准化处理降水日变化数据的方法为:遍历每个栅格单元的24小时降水日变化数据,首先,计算每个栅格单元24小时降水数据的平均值;然后,判断平均值是否为0,按如下方式标准化日变化数据:①如果平均值为0,则标准化后的数值为0;②若平均值不为0,则根据公式求得标准化的数据值,其中,Da(h)是该栅格单元第h小时的标准化数据值,Ra(h)代表第h小时的原始数据。3.根据权利要求1所述的一种基于聚类的降水日变化类型划分与空间分布提取方法,其特征在于,所述步骤(3)对降水日数据的聚类方法为:读取步骤(2)求得的所有栅格单元标准化后的24维日变化时间序列数据,存入二维数组,每行日变化数据即中国区对应索引号的栅格单元的日变化数据,利用KMeans聚类...

【专利技术属性】
技术研发人员:邓永翠朱黎明杨蕾刘军志江净超朱阿兴
申请(专利权)人:南京泛在地理信息产业研究院有限公司南京师范大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1