当前位置: 首页 > 专利查询>中南大学专利>正文

一种高速铁路沿线极端风速大数据聚类预测方法技术

技术编号:19824439 阅读:27 留言:0更新日期:2018-12-19 15:39
本发明专利技术提供了一种高速铁路沿线极端风速大数据聚类预测方法,根据近期风速状况,通过在目标测风点构建目标测风站和时移测风站,对测风站的数据进行去噪处理后,并进行风速样本聚类,利用LS‑SVM对去噪后的风速聚类样本数据进行训练,构建各测风站在多种步长下的风速预测模型;选用各模型进行多种步长的最优预测组合,实现多步迭代预测,提高预测精度,降低随机误差的干扰;实现了铁路沿线风速超前预测,可以提前得知事故多发区域的风速环境状况,及时、有效地指导列车运行,保障列车运营安全。

【技术实现步骤摘要】
一种高速铁路沿线极端风速大数据聚类预测方法
本专利技术属于铁路风速预测领域,特别涉及一种高速铁路沿线极端风速大数据聚类预测方法。
技术介绍
我国高速铁路发展迅速,已成为有代表性的中国名片。就目前全世界范围内的发展现状来说,中国高速铁路成绩辉煌。但随着高速铁路速度的提升,面临着新的问题和挑战。大风是制约高速铁路发展的主要障碍之一,严重威胁运营安全。一方面,优化车身设计和车体材料必不可少,另一方面,如何快速精准地预测大风到来的时间与风速也有着不可忽视的意义。大风的恶劣影响随着列车运行速度的增加而愈发显著,严重制约着铁路客运货运提速和经济的发展。
技术实现思路
本专利技术为了实现铁路沿线短期风速的高精度预测,提出一种高速铁路沿线极端风速大数据聚类预测方法,根据历史风速数据,将风速环境进行聚类,提高预测模型对突变风速的预测精度,根据近期风速状况,选用各模型多种步长的最优预测组合,实现多步迭代预测,降低时间成本,降低随机误差的干扰。一种高速铁路沿线极端风速大数据聚类预测方法,包括以下步骤:步骤1:在铁路目标测风点设置测风站,包括目标测风站和时移测风站;所述目标测风站距离铁路目标测风点100米,所述时移测风站至少包括3个,且设置铁路目标测风点与目标测风站所在连线上,第一个时移测风站距离铁路目标测风点500米,相邻时移测风站之间间距为500米;步骤2:构建训练样本数据;以相同采样频率采集各测风站在历史时间段内的风速,依次将各测风站的历史风速,以时间间隔T内的风速中值作为各测风站的样本时刻风速,即将每个时间间隔T内的多个风速的中值作为一个样本时刻的风速值,压缩历史风速数据;将样本时刻风速依次以聚类时间T’进行划分,若每个聚类时间T’内的样本时刻风速数据的最大极值与均值的差值超过均值的30%,则该聚类时间T’内的样本时刻风速聚类为突变风速样本,否则,聚类为平稳风速样本,随机选择各测风站在至少10个不同时段的突变风速样本和平稳风速样本,获得训练样本数据;所述聚类时间T’的时间至少为120min,各测风站的风速采集时间间隔为3-5秒,时间间隔T的取值为5min;所述训练样本数据中的每个样本为一个突变风速样本或平稳风速样本;步骤3:利用训练样本数据和设置的预测步长,构建基于LS-SVM的风速预测模型组;LS-SVM,即最小二乘支持向量机。依次以目标测风站和所有时移测风站中任意三个测风站在任意历史时刻t0的风速值作为输入数据,剩余测风站在t0+Δt时刻的风速值作为输出数据,对LS-SVM模型进行训练,获得各测风站预测步长为Δt的基于LS-SVM的风速预测模型;所述预测步长Δt的取值依次为p、2p、3p、4p,p为预测步长单元时间,取值范围为1-5min,一种预测步长对应一组基于LS-SVM的风速预测模型;四个预测步长,一共四组风速预测模型,每组风速预测模型包含四个测风站的风速预测模型;每组风速预测模型的输入数据为四个测风站在某时刻的风速,输出数据为经过时间Δt后,四个测风站的预测风速;实际上每组风速预测模型中某个测风站的风速预测模型是指利用另外三个测风站的在某时刻的风速,对该测风站在经过时间Δt后的风速进行预测;步骤4:根据目标预测时间,构建所有测风站的预测任务迭代向量;将目标预测时间m拆分为n个子预测时间hi,依据子预测时间与风速预测模型组的步长进行对应,选择各子预测时间对应的风速预测模型组,形成各测风站预测任务迭代向量l={hi,j},hi,j表示第i个子预测时间选择第j个风速预测模型组进行风速预测的预测子任务,i的取值范围为1-n,j的取值范围为1-4;所述目标预测时间m是指在经过时间m后进行风速预测;每个子预测时间需要选择一个对应步长的风速预测模型组进行四个测风站的在经过子预测时间时的风速预测;每一个子预测时间选择一个风速预测模型组进行一次子任务预测,称为一个预测子任务,一个预测子任务的输入为四个测风站同一时刻的风速数据,一共四个数据,输出为四个测风站经过子预测时间对应步长Δt之后同一时刻的风速数据,一共四个数据,输出数据可以直接用于下一个预测子任务的输入,避免了常规预测方法中对多余风速值的预测,减少迭代次数,提升预测精度;步骤5:利用步骤4获得的任意一种预测任务迭代向量,进行风速预测;以当前时刻t时刻四个测风站的风速数据作为所选预测任务迭代向量中第一个预测子任务的输入数据,以所选预测任务迭代向量最后一个预测子任务输出数据中的目标测风站的风速数据作为目标预测时间m目标测风点的风速预测值;前一个预测子任务的输出数据作为后一个预测子任务的输入数据。进一步的,利用最新历史风速数据,选取最优预测任务迭代向量,进行风速预测,获得最优风速预测结果,具体过程如下:步骤A:基于目标预测时间m,选用与当前时刻t相距m+4p时间段内的历史风速数据按照训练样本数据的构建方法,获得预测样本数据,并从预测样本数据中选出各测风站依次在t、t-m、t-m-p、t-m-2p、t-m-3p、t-m-4p以及t-p、t-2p、t-3p、t-4p时的风速;步骤B:将四个测风站在时刻为t-m、t-m-p、t-m-2p、t-m-3p、t-m-4p时的风速,依次作为每个预测任务迭代向量的输入数据,获得每个预测任务迭代向量在t、t-p、t-2p、t-3p、t-4p时获得的目标测风站预测风速;步骤C:计算每个预测任务迭代向量依次在t、t-p、t-2p、t-3p、t-4p时获得的目标测风站预测风速与实测风速的误差,并对误差求取均值,得到每个预测任务迭代向量的总体预测误差;步骤D:选取总体预测误差值最小的预测任务迭代向量作为最优预测任务迭代向量,进行风速预测,获得最优风速预测结果。进一步的,设置预测任务迭代向量权重,构建最优预测任务迭代融合向量,进行风速预测,获得最优风速预测结果,;将所有预测任务迭代向量的总体预测误差值,按照从小到大排序,选取前5个预测任务迭代向量,并依据所选的5个预测任务迭代向量的总体预测误差值占所选5个预测任务迭代向量的总体预测误差值之和的比例,设置各预测任务迭代向量的权重,构建最优任务迭代融合向量,进行风速预测,获得最优风速预测结果。选取5个预测任务迭代向量,对同一时刻的风速进行5次预测,按照每个预测任务迭代向量的权重,将5次预测结果进行权重组合,得到目标测风站的预测风速;进一步的,对各测风站的样本数据进行交互卡尔曼滤波处理,将滤波后的数据用于模型训练和预测任务迭代向量的选取。进一步的,所述预测任务迭代向量中每个预测子任务的子预测时间满足以下公式:其中,hmin的取值为预测步长单元时间。进一步的,在与铁路平行的方向上,每个测风站两侧等间距设置有同类型测风站,获得目标测风站组和时移测风站组,其中时移测风站组包括第一时移测风站组、第二时移测风站组以及第三时移测风站组;从目标测风站组各测风站测得的风速值中,选取相同采样时刻的最大风速值作为虚拟目标测风站的各采样时刻的风速值,以虚拟目标测风站作为目标样本测风站;从各时移测风站组中,选取相同采样时刻的风速值与对虚拟测风站对应时刻的风速值显著性最大的时移测风站,获得时移目标测风站。进一步的,对所述基于LS-SVM的风速预测模型中的LS-SVM的参数γ和参数σ2同时采用以下至少一种方法进行优化:1)狼群-模拟本文档来自技高网...

【技术保护点】
1.一种高速铁路沿线极端风速大数据聚类预测方法,其特征在于,包括以下步骤:步骤1:在铁路目标测风点设置测风站,包括目标测风站和时移测风站;所述目标测风站距离铁路目标测风点100米,所述时移测风站至少包括3个,且设置铁路目标测风点与目标测风站所在连线上,第一个时移测风站距离铁路目标测风点500米,相邻时移测风站之间间距为500米;步骤2:风速环境聚类,构建训练样本数据;以相同采样频率采集各测风站在历史时间段内的风速,依次将各测风站的历史风速,以时间间隔T内的风速中值作为各测风站的样本时刻风速,将样本时刻风速依次以聚类时间T’进行划分,若每个聚类时间T’内的样本时刻风速数据的最大极值与均值的差值超过均值的30%,则该聚类时间T’内的样本时刻风速聚类为突变风速样本,否则,聚类为平稳风速样本,随机选择各测风站在至少10个不同时段的突变风速样本和平稳风速样本,获得训练样本数据;所述聚类时间T’的时间至少为120min,各测风站的风速采集时间间隔为3‑5秒,时间间隔T的取值为5min;所述训练样本数据中的每个样本为一个突变风速样本或平稳风速样本;步骤3:利用训练样本数据和设置的预测步长,构建基于LS‑SVM的风速预测模型组;依次以目标测风站和所有时移测风站中任意三个测风站在任意历史时刻t0的风速值作为输入数据,剩余测风站在t0+Δt时刻的风速值作为输出数据,对LS‑SVM模型进行训练,获得各测风站预测步长为Δt的基于LS‑SVM的风速预测模型;所述预测步长Δt的取值依次为p、2p、3p、4p,p为预测步长单元时间,取值范围为1‑5min,一种预测步长对应一组基于LS‑SVM的风速预测模型;步骤4:根据目标预测时间,构建所有测风站的预测任务迭代向量;将目标预测时间m拆分为n个子预测时间hi,依据子预测时间与风速预测模型组的步长进行对应,选择各子预测时间对应的风速预测模型组,形成各测风站预测任务迭代向量l={hi,j},hi,j表示第i个子预测时间选择第j个风速预测模型组进行风速预测的预测子任务,i的取值范围为1‑n,j的取值范围为1‑4;步骤5:利用步骤4获得的任意一种预测任务迭代向量,进行风速预测;以当前时刻t时刻四个测风站的风速数据作为所选预测任务迭代向量中第一个预测子任务的输入数据,以所选预测任务迭代向量最后一个预测子任务输出数据中的目标测风站的风速数据作为目标预测时间m目标测风点的风速预测值;前一个预测子任务的输出数据作为后一个预测子任务的输入数据。...

【技术特征摘要】
1.一种高速铁路沿线极端风速大数据聚类预测方法,其特征在于,包括以下步骤:步骤1:在铁路目标测风点设置测风站,包括目标测风站和时移测风站;所述目标测风站距离铁路目标测风点100米,所述时移测风站至少包括3个,且设置铁路目标测风点与目标测风站所在连线上,第一个时移测风站距离铁路目标测风点500米,相邻时移测风站之间间距为500米;步骤2:风速环境聚类,构建训练样本数据;以相同采样频率采集各测风站在历史时间段内的风速,依次将各测风站的历史风速,以时间间隔T内的风速中值作为各测风站的样本时刻风速,将样本时刻风速依次以聚类时间T’进行划分,若每个聚类时间T’内的样本时刻风速数据的最大极值与均值的差值超过均值的30%,则该聚类时间T’内的样本时刻风速聚类为突变风速样本,否则,聚类为平稳风速样本,随机选择各测风站在至少10个不同时段的突变风速样本和平稳风速样本,获得训练样本数据;所述聚类时间T’的时间至少为120min,各测风站的风速采集时间间隔为3-5秒,时间间隔T的取值为5min;所述训练样本数据中的每个样本为一个突变风速样本或平稳风速样本;步骤3:利用训练样本数据和设置的预测步长,构建基于LS-SVM的风速预测模型组;依次以目标测风站和所有时移测风站中任意三个测风站在任意历史时刻t0的风速值作为输入数据,剩余测风站在t0+Δt时刻的风速值作为输出数据,对LS-SVM模型进行训练,获得各测风站预测步长为Δt的基于LS-SVM的风速预测模型;所述预测步长Δt的取值依次为p、2p、3p、4p,p为预测步长单元时间,取值范围为1-5min,一种预测步长对应一组基于LS-SVM的风速预测模型;步骤4:根据目标预测时间,构建所有测风站的预测任务迭代向量;将目标预测时间m拆分为n个子预测时间hi,依据子预测时间与风速预测模型组的步长进行对应,选择各子预测时间对应的风速预测模型组,形成各测风站预测任务迭代向量l={hi,j},hi,j表示第i个子预测时间选择第j个风速预测模型组进行风速预测的预测子任务,i的取值范围为1-n,j的取值范围为1-4;步骤5:利用步骤4获得的任意一种预测任务迭代向量,进行风速预测;以当前时刻t时刻四个测风站的风速数据作为所选预测任务迭代向量中第一个预测子任务的输入数据,以所选预测任务迭代向量最后一个预测子任务输出数据中的目标测风站的风速数据作为目标预测时间m目标测风点的风速预测值;前一个预测子任务的输出数据作为后一个预测子任务的输入数据。2.根据权利要求1所述的方法,其特征在于,利用最新历史风速数据,选取最优预测任务迭代向量,进行风速预测,获得最优风速预测结果,具体过程如下:步骤A:基于目标预测时间m,选用与当前时刻t相距m+4p时间段内的历史风速数据按照训练样本数据的构建方法,获得预测样本数据,并从预测样本数据中选出各测风站依次在t、t-m、t-m-p、t-m-2p、t-m-3p、t-m-4p以及t-p、t-2p、t-3p、t-4p时的风速;步骤B:将四个测风站在时刻为t-m、t-m-p、t-m-2p、t-m-3p、t-m-4p时的风速,依次作为每个预测任务迭代向量的输入数据,获得每个预测任务迭代向量在t、t-p、t-2p、t-3p、t-4p时获得的目标测风站预测风速;步骤C:计算每个预测任务迭代向量依次在t、t-p、t-2p、t-3p、t-4p时获得的目标测风站预测风速与实测风速的误差,并对误差求取均值,得到每个预测任务迭代向量的总体预测误差;步骤D:选取总体预测误差值最小的预测任务迭代向量作为最优预测任务迭代向量,进行风速预测,获得最优风速预测结果。3.根据权利要求2所述的方法,其特征在于,设置预测任务迭代向量权重,构建最优预测任务迭代融合向量,进行风速预测,获得最优风速预测结果,;将所有预测任务迭代向量的总体预测误差值,按照从小到大排序,选取前5个预测任务迭代向量,并依据所选的5个预测任务迭代向量的总体预测误差值占所选5个预测任务迭代向量的总体预测误差值之和的比例,设置各预测任务迭代向量的权重,构建最优任务迭代融合向量,进行风速预测,获得最优风速预测结果。4.根据权利要求2所述的方法,其特征在于,对各测风站的样本数据进行交互卡尔曼滤波处理,将滤波后的数据用于模型训练和预测任务迭代向量的选取。5.根据权利要求1所述的方法,其特征在于,所述预测任务迭代向量中每个预测子任务的子预测时间满足以下公式:其中,hmin的取值为预测步长单元时间。6.根据权利要求1-5任一项所述的方法,其特征在于,在与铁路平行的方向上,每个测风站两侧等间距设置有同类型测风站,获得目标测风站组和时移测风站组,其中时移测风站组包括第一时移测风站组、第二时移测风站组以及第三时移测风站组;从目标测风站组各测风站测得的风速值中,选取相同采样时刻的最大风速值作为虚拟目标测风站的各采样时刻的风速值,以虚拟目标测风站作为目标样本测风站;从各时移测风站组中,选取相同采样时刻的风速值与对虚拟测风站对应时刻的风速值显著性最大的时移测风站,获得时移目标测风站。7.根据权利要求6所述的方法,其特征在于,对所述基于LS-SVM的风速预测模型中的LS-SVM的参数γ和参数σ2同时采用以下至少一种方法进行优化:1)狼群-模拟退火算法,所使用的LS-SVM输入层节点个数为3,输出层节点个数为1;训练过程中的最大迭代次数设置为200,γ的搜索区间为[0,100],σ2的搜索区间为[0,400];2)水循环算法,所使用的LS-SVM输入层节点个数为3,输出层节点个数为1;训练过程中的最大迭代次数设置为200,γ的搜索区间为[0,100],σ2的搜索区间为[0,400];3)混沌差分蝙蝠算法,所使用的LS-SVM输入层节点个数为3,输出层节点个数为1;训练过程中的最大迭代次数设置为200,γ的搜索区间为[0,100],σ2的搜索区间为[0,400]。8.根据权利要求7所述的方法,其特征在于,采用狼群-模拟退火算法对所述基于LS-SVM的风速预测模型中的LS-SVM的参数γ和参数σ2同时进行优化的步骤如下:步骤1.1):以个体狼位置作为所述基于LS-S...

【专利技术属性】
技术研发人员:刘辉吴海平段铸尹恒鑫
申请(专利权)人:中南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1