基于时间注意力机制的短时风速时序预测方法技术

技术编号:36826704 阅读:8 留言:0更新日期:2023-03-12 01:28
本发明专利技术公开了一种基于时间注意力机制的短时风速时序预测方法,包括如下步骤:S1、确定目标站点与驱动站点;S2、对站点的数据进行质量控制;S3、获取S2中连续365天内对应的目标站点和驱动站点逐秒的风速数据;S4、计算Spd_drive每分钟内风速的中值;S5、计算每分钟内风速的中值;S6:拆分成若干个子序列;S7、对数据做数据均衡化处理;S8、划分训练集和验证集;S9、建立一个归一化网络层BN模块。本发明专利技术以风速数据关注度的神经网络模块为基础架构,分别将相邻站点的驱动序列和目标站点的目标序列分别作为模块的输入,克服传统预测模型对单一时序输入的依赖。时序输入的依赖。时序输入的依赖。

【技术实现步骤摘要】
基于时间注意力机制的短时风速时序预测方法


[0001]本专利技术属于地球科学
,更具体地说,涉及一种基于时间注意力机制的短时风速时序预测方法。

技术介绍

[0002]由于风速具有很强的波动性、局地性和间歇性,短时风速预测是天气预报中最难的技术之一。提高风速预报的准确率能够降低大风灾害,同时有助于提升风力发电的效率。长期以来,短时风速预测方法大体可分为物理模型和统计模型两类。近年来,借助深度学习技术,进一步拓展了风速预测的方法,并取得了一定成效。当前,利用深度神经网络构建的时序数据预测模型普遍存在预测时序相较实际时序波动偏小,以及随着预测时效的延长预测准确率逐步下降等问题,进而影响了风速预测的性能,特别是预测的准确率。

技术实现思路

[0003]为了解决上述技术问题至少之一,根据本专利技术的一方面,提供了一种基于时间注意力机制的短时风速时序预测方法,包括如下具体步骤:
[0004]步骤1:确定目标站点和驱动站点,并获取目标站点和驱动站点的风速数据。站点的数据采用加密自动气象站通过实时观测保存下来的气象数据。目标站点是指当前需要预测的站点,驱动站点是地理位置与目标站点相邻的某一站点,驱动站点的选取,通过计算各个站点与目标站点之间的距离,选择距离相对最短且站点数据质量可靠的某一站点。对于站点数据质量的分析,可通过步骤2计算得到。
[0005]步骤2:对站点的数据进行质量控制。除了气象上常采取的报文格式检查、时间戳检查和异常字符检查外,还需剔除连续两次记录的风速差大于V1,以及连续V2次记录的风速始终大于V3且数值不变的数据。此外,还应对超出物理极值的记录进行剔除。上述V1∈[30,∞),V2∈[100,∞),V3∈[1.5,∞)。V1和V3的单位是m/s。
[0006]步骤3:。获取步骤2中连续365天内对应的目标站点和驱动站点逐秒的风速数据,分别定义为Spd_target和Spd_drive。
[0007]步骤4:计算Spd_drive每分钟内风速的中值Spd_drive_mean,Spd_drive_mean=(spdm1,spdm2,

,spdm
j
),其中spdm
b
表示第b分钟驱动序列风速的中值,j=521600,b∈[1,j]。计算5分钟内各中值的最大值Spd_dv_mean_max,Spd_dv_mean_max=(spdmx1,spdmx2,

,spdmx
r
),其中spdmx
h
表示第h个5分钟内的中值的最大值,r=104320,h∈[1,r]。
[0008]步骤5:计算Spd_target中每分钟内风速的中值Spd_target_mean,Spd_target_mean=(spdtm1,spdtm2,

,spdtm
j
),其中spdtm
b
表示第b分钟目标序列风速的中值,j=521600,b∈[1,j]。计算5分钟内各中值的最大值Spd_ta_mean_max,Spd_ta_mean_max=(spdtmx1,spdtmx2,

,spdtmx
r
),其中spdmx
h
表示第h个5分钟内的中值的最大值r=104320,h∈[1,r]。
[0009]步骤6:从步骤4和步骤5中获得相同长度的Spd_dv_mean_max和Spd_ta_mean_max,
将Spd_dv_mean_max和Spd_ta_mean_max各自拆分成若干个子序列,每个子序列为Spd_dv_mean_max和Spd_ta_mean_max对应时间上连续的T个风速值,T∈[12,60]分别定义为Se_dv_spd和Se_ta_spd,Se_dv_spd=(dspd1,dspd2,

,dspd
m
),Se_ta_spd=(tspd1,tspd2,

,tspd
m
),其中dspd
q
=(dws1,dws2,

,dws
T
)表示第q个驱动站点的子序列,tspd
q
=(tws1,tws2,

,tws
T
)表示第q个目标站点的子序列,dws
T
表示第q个驱动站点子序列中第T个风速值,tws
T
表示第q个目标站点子序列中第T个风速值,其中m=104308,q∈[1,m]。
[0010]步骤7:对步骤6中得到的Se_dv_spd和Se_ta_spd数据做数据均衡化处理。计算公式如下:
[0011][0012]式1中,μ1为Se_ta_spd中风速的平均值,σ1为Se_ta_spd中风速的标准差,μ2为Se_dv_spd中风速的平均值,σ通过公式1可以得到target_spd_norm和drive_spd_norm,drive_spd_norm=(X1,X2,

,X
m
),target_spd_norm=(Y1,Y2,

,Y
m
),令X
t
=(x1,x2,

,x
T
),Y
t
=(y1,y2,

,y
T
),其中t∈[1,m]。
[0013]步骤8:通过步骤7可获得相同长度的drive_spd_norm和target_spd_norm,定义数据集Data=(drive_spd_norm,target_spd_norm),其中Data[i]=(drive_spd_norm[i],target_spd_norm[i])=(X
i
,Y
i
)为一组数据集,在Data中划分ds_train_data和ds_valid_date,令ds_train_data=(Data[1],Data[2],

,Data[s]),ds_valid_date=(Data[s+1],Data[s+2],

,Data[m]),上述i∈[1,m),s=m*rate,且s向下取整,rate∈[0,1],且s向下取整。采用无重复抽样的10

fold cross validation,取时序的前90%作为训练集和验证集,后10%作为测试集。确保两条时序在相同位置的测风时间是一致性。得到的逐5分钟风速时序。
[0014]步骤9:建立一个归一化网络层BN模块,将目标站点某个子序列X
t
=(x1,x2,

,x
T
,)作为输入,BN
γ,β
(X
t
)将序列进行归一化得到X

t
=(x
′1,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时间注意力机制的短时风速时序预测方法,其特征在于,包括如下步骤:S1、确定目标站点与驱动站点,并获取目标站点和驱动站点的风速数据;S2、对站点的数据进行质量控制;S3、获取S2中连续365天内对应的目标站点和驱动站点逐秒的风速数据,分别定义为Spd_target和Spd_drive;S4、计算Spd_drive每分钟内风速的中值Spd_drive_mean,Spd_drive_mean=(spdm1,spdm2,

,spdm
j
),其中spdm
b
表示第b分钟驱动序列风速的中值,j=521600,b∈[1,j];计算5分钟内各中值的最大值Spd_dv_mean_max,Spd_dv_mean_max=(spdmx1,spdmx2,

,spdmx
r
),其中spdmx
h
表示第h个5分钟内的中值的最大值,r=104320,h∈[1,r];S5、计算Spd_target中每分钟内风速的中值Spd_target_mean,Spd_target_mean=(spdtm1,spdtm2,

,spdtm
j
),其中spdtm
b
表示第b分钟目标序列风速的中值,j=521600,b∈[1,j];计算5分钟内各中值的最大值Spd_ta_mean_max,Spd_ta_mean_max=(spdtmx1,spdtmx2,

,spdtmx
r
),其中spdmx
h
表示第h个5分钟内的中值的最大值r=104320,h∈[1,r];S6、从S4和S5中获得相同长度的Spd_dv_mean_max和Spd_ta_mean_max,将Spd_dv_mean_max和Spd_ta_mean_max各自拆分成若干个子序列,记为Spd_dv_mean_max和Spd_ta_mean_max;S7、对S6中得到的Se_dv_spd和Se_ta_spd数据做数据均衡化处理,记为target_spd_norm和drive_spd_norm;S8、划分训练集和验证集,记为ds_train_data和ds_valid_date;S9、建立一个归一化网络层BN模块;S10、建立计算风速数据关注度的神经网络模块AttentionLayerA;S11、创建LSTM模块;S12、建立计算隐层数据关注度的神经网络模块AttentionLayerB;S13、设计神经网络预报模块;S14、创建高斯损失模块;S15、模型训练;S16、模型验证与优化。2.根据权利要求1所述的方法,其特征在于,步骤S6具体如下:从S4和S5中获得相同长度的Spd_dv_mean_max和Spd_ta_mean_max,将Spd_dv_mean_max和Spd_ta_mean_max各自拆分成若干个子序列,每个子序列为Spd_dv_mean_max和Spd_ta_mean_max对应时间上连续的T个风速值,T∈[12,60],分别定义为Se_dv_spd和Se_ta_spd,Se_dv_spd=(dspd1,dspd2,

,dspd
m
),Se_ta_spd=(tspd1,tspd2,

,tspd
m
),其中dspd
q
=(dws1,dws2,

,dws
T
)表示第q个驱动站点的子序列,tspd
q
=(tws1,tws2,

,tws
T
)表示第q个目标站点的子序列,tws
T
表示第q个驱动...

【专利技术属性】
技术研发人员:王兴吴其亮叶威良顾然钱代丽王介君卞浩瑄
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1