一种基于混合聚类算法的雷暴核识别及追踪方法技术

技术编号:18913471 阅读:27 留言:0更新日期:2018-09-12 02:56
本发明专利技术公开一种基于混合聚类算法的雷暴核识别及追踪方法,具体步骤如下:利用部署的雷电监测点探测并记录地闪数据,并对记录的地闪数据进行预处理,划分为各等时段的闪电数据集;采用GPS时钟同步技术和闪电电场变化辐射脉冲到达各站点的时间差,通过到达时间差算法,求得闪电的空间定位坐标;对上述步骤中所求得的雷电定位数据,利用DBSCAN算法和KMEANS算法求得雷电定位数据的雷暴核质心坐标位置、闪电频次以及雷暴核之间的关联性。实验证明,该方法能够在雷暴天气较为准确的反映出雷电变化趋势,达到良好的雷暴核识别及雷暴移动追踪的效果。

A method of identifying and tracking thunderstorms based on Hybrid Clustering Algorithm

The invention discloses a thunderstorm nuclear identification and tracking method based on hybrid clustering algorithm. The concrete steps are as follows: detecting and recording ground lightning data by deployed lightning monitoring points, preprocessing the recorded ground lightning data and dividing them into lightning data sets of different periods; adopting GPS clock synchronization technology and lightning electric field variation. The time difference of radiation pulse arriving at each station is calculated by time difference algorithm, and the lightning location coordinates are obtained by DBSCAN algorithm and KMEANS algorithm. Experiments show that this method can accurately reflect the trend of lightning change in thunderstorm weather, and achieve good results of thunderstorm nuclear identification and thunderstorm movement tracking.

【技术实现步骤摘要】
一种基于混合聚类算法的雷暴核识别及追踪方法
本专利技术属于雷电监测领域,涉及一种基于混合聚类算法的雷暴核识别及追踪方法。
技术介绍
随着电子技术和计算机技术的发展,雷暴闪电活动监测从传统的闪电定位观测发展到完整记录整个雷暴生命史期间闪电活动细节特征,在此基础上可以开发各种基于雷暴生命史演化的闪电资料产品。闪电活动作为雷暴对流活动强弱的指示因子,相比雷暴云降水粒子的气象雷达探测,在诊断强对流活动的时效性及其准确性方面的潜力越来越受到重视,并有望在一些气象多普勒雷达难以探测的区域开展雷暴对流活动的监测。数据挖掘技术和地理信息系统技术作为信息技术中的两个重要技术,在处理气象资料方面有着极其重要的地位和作用。数据挖掘(DataMining)指在数据库中,综合利用统计学方法、模式识别技术、人工智能方法、神经网络技术等理论,吸取新颖的、可信的、人们感兴趣的和最终可理解的知识,从而揭示出蕴含在数据中的规律、内在联系和发展趋势。地理信息系统技术可以将气象数据所具有的空间特征、属性特征及时间特征等特点较好地表现出来,是实现数据管理的有效手段。对雷暴核识别、预测方法有很多,但因为雷电具有随机性、局域性、分散性、突发性、瞬时性及三维性这些鲜明的特点,使得不同的雷电预测方法都有自己最适用的环境。运用数据挖掘中的聚类算法,结合GIS平台,针对雷电自身特点,对算法进行优化,可以做到快速、便捷、准确地计算,并且满足临近趋势预报中的相关要求,在雷电临近预报工作中具有实际的意义。基于传统的DBSCAN算法能在具有噪声的空间数据中发现任意形状的簇,可将密度足够大的相邻区域连接,能有效处理异常数据,算法稳定等特点。但是,当应用到闪电数据的聚类时,得到的结果是一个个的簇,并不是一个“中心”,并且存在的噪声点也无法区分。而KMEANS算法的关键是K值的选取,如果闪电定位数据分布过于分散,按照固定K值聚合,得到的质心的位置可能和实际位置相差甚远。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于混合聚类算法的雷暴核识别及追踪方法,提出了对监测点同等时段的闪电定位数据通过DBSCAN算法进行密度聚合,形成若干个簇,并且将每一簇的数据集作为新的输入,再利用KMEANS算法的迭代聚合,设定K值固定为1,求出雷暴核质心的坐标位置;在聚类分析结果的基础上,对质心闪电点的移动路径和闪电强弱进行拟合,从而得到雷暴核之间的关联性并且可预测下一时刻雷暴核的强弱变化;该计算方法应用在雷暴核识别及核追踪方面是有效的。本专利技术为解决上述技术问题采用以下技术方案:基于混合聚类算法的雷暴核识别及追踪方法,具体步骤如下:步骤A,利用部署的雷电监测点探测并记录闪电数据,并对记录的闪电数据进行预处理,划分为各等时段的闪电数据集;步骤B,采用GPS时钟同步技术和闪电电场变化辐射脉冲到达各站点的时间差(TOA),通过到达时间差算法,求得闪电的空间定位坐标;步骤C,对步骤B中所求得的雷电定位数据,利用DBSCAN算法和KMEANS算法混合求得雷电定位数据的雷暴核质心坐标位置、闪电频次以及雷暴核之间的关联性。作为本专利技术的进一步优化方案,步骤A中记录的闪电数据进行预处理,划分为各等时段的闪电数据集,具体为:步骤A-1,闪电定位监测站点内设置甚低频闪电辐射接收机、计算机、GPS时钟模块,站点连续无间隔捕获闪电脉冲波形及其到达绝对时间,生成数据集;步骤A-2,将步骤A-1生成的数据集进行预处理,通过互联网数据传输,得到相应时段的数据集。作为本专利技术的进一步优化方案,步骤B中采用GPS时钟同步技术和闪电电场变化辐射脉冲到达各站点的时间差(TOA),通过到达时间差算法,求得闪电的空间定位坐标,具体为:步骤B-1,至少建立四个闪电定位监测站点,对步骤A中得到的同一时段的数据取得其GPS时间;步骤B-2,充分利用显卡的GPU资源,根据到达时间差算法(TDOA),快速求得闪电定位坐标。作为本专利技术的进一步优化方案,步骤C中利用DBSCAN算法和KMEANS算法混合求得雷电定位数据的雷暴核质心坐标位置、闪电频次以及雷暴核之间的关联性,具体为:步骤C-1,设定Eps和MinPts值,利用DBSCAN算法,遍历步骤B-2中得到的各等时段的闪电定位坐标数据集,依次搜索每个闪电数据点的Eps邻域,对各等时段的定位数据进行聚类计算,使得同一类中的数据相似性最大,而不同类中的数据的相似性最小,去掉噪声数据后,形成若干个任意形状的簇;步骤C-2,根据C-1的最优聚类结果,将每一簇的数据集作为新的输入,再利用KMEANS算法,并通过簇内所有成员的经纬度坐标,迭代聚合求出簇即雷暴核质心的空间坐标位置;步骤C-3,根据C-2雷暴核及质心的结果,得到同一时间段多个雷暴核信息,但这些雷暴核是有一定的关联性,即雷暴核是由哪个雷暴核演变过来的;通过计算比较同一时段和不同时段的连续发生的雷暴核质心之间的距离在设定的阈值范围内以及雷暴核范围内闪电发生的强度,来推算各雷暴核之间的关系(当前雷暴核是由上一次哪个雷暴核演变来的),进而推算单个雷暴核的演变过程。作为本专利技术的进一步优化方案,步骤B-2中,采用CUDA编程技术,充分利用显卡GPU资源,加快数据运行处理速度。作为本专利技术的进一步优化方案,步骤C-2中,KMEANS算法,以质心代表一个聚类簇,过滤掉DBSCAN聚类簇中的噪声数据集,聚类结果代入KMEANS算法,得到最优聚合结果。本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:本专利技术针对传统DBScan算法对雷暴识别和雷暴强弱预测的不足,将KMEANS聚类算法与DBSCAN算法进行复合,用复合后提出的混合聚类算法对闪电定位数据进行等时段数据聚类;该算法不仅考虑了闪电数据分布杂乱的情况,也克服了DBSCAN算法不求出“中心点”的情况,完善了对雷暴核识别及核关联性计算的方法;同时,结合DBSCAN算法和KMEANS算法的特点,通过对各等时段下的闪电定位数据进行雷暴核识别、核关联性计算,求得单个雷暴核的移动演变过程和下一时刻的雷暴核强弱趋势变化;在实际雷电天气过程的检验中,通过与气象雷达数据的比较,结果表明本专利技术所提出的方法能够在雷暴天气较为准确的反映出雷电变化趋势,达到良好的雷暴核识别及雷暴核移动追踪的效果。附图说明为了便于本领域技术人员理解,下面结合附图对本专利技术作进一步的说明。图1是本专利技术一种基于混合聚类算法的雷暴核识别及追踪方法的流程图;图2是本专利技术实施例中DBSCAN算法流程图;图3是本专利技术实施例中KMEANS算法原理图;图4是本专利技术实施例中TDOA算法示意图;图5是本专利技术实施例中闪电分布图;图6是本专利技术实施例中DBSCAN聚类分布图;图7是本专利技术实施例中KMEANS聚类后带质心的分布图;图8是本专利技术实施例中雷暴核轨迹图;图9是本专利技术实施例中雷暴核强弱趋势图。具体实施方式下面结合附图以及具体实施例对本专利技术的技术方案做进一步的详细说明:本专利技术提供一种基于混合聚类算法的雷暴核识别及追踪方法,如图1所示,针对雷电监测点中庞大而杂乱的定位数据,该方法依据监测点传输的雷电数据通过到达时间差算法求得的实时定位数据,先利用DBSCAN算法的密度可达特性将闪电数据集聚合成若干个簇,并且将每一簇的数据集作为新的输入,再利用KMEANS算法的本文档来自技高网
...

【技术保护点】
1.基于混合聚类算法的雷暴核识别及追踪方法,其特征在于,该方法具体步骤如下:步骤A,利用部署的雷电监测点探测并记录地闪数据,并对记录的地闪数据进行预处理,划分为各等时段的闪电数据集;步骤B,采用GPS时钟同步技术和闪电电场变化辐射脉冲到达各站点的时间差,通过到达时间差算法,求得闪电的空间定位坐标;步骤C,对步骤B中所求得的雷电定位数据,利用DBSCAN算法和KMEANS算法求得雷电定位数据的雷暴核质心坐标位置、闪电频次以及雷暴核之间的关联性。

【技术特征摘要】
1.基于混合聚类算法的雷暴核识别及追踪方法,其特征在于,该方法具体步骤如下:步骤A,利用部署的雷电监测点探测并记录地闪数据,并对记录的地闪数据进行预处理,划分为各等时段的闪电数据集;步骤B,采用GPS时钟同步技术和闪电电场变化辐射脉冲到达各站点的时间差,通过到达时间差算法,求得闪电的空间定位坐标;步骤C,对步骤B中所求得的雷电定位数据,利用DBSCAN算法和KMEANS算法求得雷电定位数据的雷暴核质心坐标位置、闪电频次以及雷暴核之间的关联性。2.根据权利要求1所述的基于混合聚类算法的雷暴核识别及追踪方法,其特征在于,所述的步骤A具体为:步骤A-1,闪电定位监测站点内设置甚低频闪电辐射接收机、计算机、GPS时钟模块,站点连续无间隔捕获闪电脉冲波形及其到达绝对时间,生成数据集;步骤A-2,将步骤A-1生成的数据集进行预处理,通过互联网数据传输,得到相应时段的数据集。3.根据权利要求1所述的基于混合聚类算法的雷暴核识别及追踪方法,其特征在于,所述的步骤B具体为:步骤B-1,至少建立四个闪电定位监测站点,对步骤A中得到的同一时段的数据取得其GPS时间;步骤B-2,充分利用显卡的GPU资源,根据到达时间差算法,快速求得闪电定位坐标,形成闪电定位数据集。4.根据权利要求1所述的基于混合聚类算法的雷暴核识别及追踪方法,其特征在于,...

【专利技术属性】
技术研发人员:张淑萍华德梅周松柏
申请(专利权)人:合肥佳讯科技有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1