一种基于注意力机制循环神经网络的三维声速场预测方法技术

技术编号:37362588 阅读:13 留言:0更新日期:2023-04-27 07:10
本发明专利技术公开了一种基于注意力机制循环神经网络的三维声速场预测方法,该方法首先将时序上连续的多个预报三维声速场输入空间注意力层,选取三维声速场在时序中变化较为明显的区域赋予更高的权重,之后将加权后的预报三维声速场送入时间注意力层,选取时序中变化较为明显的预报三维声速场赋予更高的权重,最后将在空间与时间上使用了注意力机制的预报三维声速场特征与后报三维声速场进行拼接,在时间注意力层中预测未来时刻的后报三维声速场。本发明专利技术在实时计算高精确度、大范围声速场的领域具有潜在的应用价值。具有潜在的应用价值。具有潜在的应用价值。

【技术实现步骤摘要】
一种基于注意力机制循环神经网络的三维声速场预测方法


[0001]本专利技术属于声场预报领域,尤其涉及一种基于注意力机制循环神经网络的三维声速场预测方法。

技术介绍

[0002]海洋蕴含着丰富的资源,开发海洋为人类带来了巨大效益,对海洋环境进行长期、及时、可靠的观测日益受到重视。但不同于空气介质,电磁波在海洋中传播受到各种限制,因此声波成为观测海洋最重要的手段,在通讯、定位、观测等领域广泛应用。影响声传播的因素有很多,其中声传播速度是至关重要的一部分。声传播速度在海洋环境中受到海域的温度、盐度、深度的影响,由于海洋环境复杂多变,温度、盐度在空间、时间上都呈现非线性变化,因此预测三维声速场具有较大难度。
[0003]预测声速场需要满足实时性、精确性的要求。常见的数值仿真方法分为预报驱动模式和后报驱动模式。后报驱动模式需要同化实时采样的水下设备采集的环境场数据,具有较高的精确度,但无法满足实时性的要求。预报驱动模式不需要实时采样的环境场数据,但预报准确度会随着预测时间增加而下降,无法满足精确性的要求。此外数值仿真方法通过将海域细分为小网格,通过变分法以及纳维

斯托克斯方程计算所有网格的数值,因此需要使用超级计算机或工作站,有较高的算力需求,而且需要消耗大量时间进行运算。

技术实现思路

[0004]本专利技术的目的在于针对现有技术的不足,提供一种基于注意力机制循环神经网络的三维声速场预测方法。本专利技术能够实现实时、高准确度、大范围的三维声速场预报。
[0005]本专利技术的目的是通过以下技术方案来实现的:一种基于注意力机制循环神经网络的三维声速场预测方法,包括以下步骤:
[0006](1)将时序连续的k个预报三维声速场和后报三维声速场作为输入,并与随后输出的h个后报三维声速场组成多组数据对,以构建训练集;
[0007](2)构建DA

RNN,并根据训练集对构建的DA

RNN进行训练,以获取最终的DA

RNN;
[0008](3)将预报三维声速场输入到最终的DA

RNN中,以获取预测的后报三维声速场,并评价DA

RNN预测的准确度。
[0009]可选地,所述步骤(2)包括以下子步骤:
[0010](2.1)构建DA

RNN,所述DA

RNN包括空间注意力层和时间注意力层,所述空间注意力层和时间注意力层连接;
[0011](2.2)根据步骤(1)得到的训练集对步骤(2.1)构建的DA

RNN进行训练,并更新DA

RNN的参数以获取最终的DA

RNN。
[0012]可选地,所述步骤(2.1)包括以下子步骤:
[0013](2.1.1)将预报三维声速场输入三维卷积层以获取空间注意力特征,以完成空间注意力层的构建;
[0014](2.1.2)将空间注意力特征输入时间注意力层以获取预测的后报三维声速场,以完成时间注意力层的构建。
[0015]可选地,所述步骤(2.1.1)包括以下子步骤:
[0016](2.1.1.1)将三维声速场定义为三维数组;
[0017](2.1.1.2)将预报三维声速场输入空间注意力层,并根据t

1时刻LSTM单元的状态p
t
‑1和输出h
t
‑1以及t时刻的预报三维声速场c
t
计算t时刻的空间注意力矩阵;
[0018](2.1.1.3)通过softmax函数对空间注意力矩阵进行归一化,计算t时刻的注意力权重矩阵;
[0019](2.1.1.4)根据注意力权重矩阵与预报三维声速场获取加权后的预报三维声速场;
[0020](2.1.1.5)根据加权后的预报三维声速场获取k个时序连续的空间注意力特征,以完成空间注意力层的构建。
[0021]可选地,所述步骤(2.1.2)包括以下子步骤:
[0022](2.1.2.1)将空间注意力特征以及对应时刻的后报三维声速场输入时间注意力层,并根据t

1时刻LSTM单元的状态s
t
‑1和输出d
t
‑1以及所有时刻的预报三维声速场注意力特征计算时间注意力矩阵;
[0023](2.1.2.2)通过softmax函数对时间注意力矩阵进行归一化,计算时间注意力加权矩阵;
[0024](2.1.2.3)根据时间注意力加权矩阵对空间注意力特征进行加权获取时

空注意力特征;
[0025](2.1.2.4)将后报三维声速场与时

空注意力特征进行拼接,获取加权后的预报三维声速场;
[0026](2.1.2.5)根据加权后的预报三维声速场与时

空注意力特征获取预测的后报三维声速场,以完成时间注意力层的构建。
[0027]可选地,所述步骤(2.2)包括以下子步骤:
[0028](2.2.1)将训练集中的预报三维声速场输入到DA

RNN中,输出后报三维声速场预测值;
[0029](2.2.2)使用均方误差计算后报三维声速场预测值与训练集中的后报三维声速场的误差;
[0030](2.2.3)判断所述步骤(2.2.2)中的误差是否小于等于设置的误差阈值,若误差小于等于设置的误差阈值,则停止训练,以获取最终的DA

RNN;否则,则通过梯度下降法调整DA

RNN的参数的数值,再通过后向传播算法更新DA

RNN的参数,返回所述步骤(2.2.1)。
[0031]可选地,所述DA

RNN预测的准确度通过均方根误差进行判断,其表达式为:
[0032][0033]其中,RMSE表示预测的后报三维声速场和真实测量的后报三维声速场之间的误差,c
*
(i,j,m)表示DA

RNN预测的后报三维声速场在(i,j,m)位置上的声速值,c

(i,j,k)表
示真实测量的后报三维声速场在(i,j,m)位置上的声速值,X、Y、Z为后报三维声速场在x轴、y轴、z轴上的采样数,X*Y*Z为后报三维声速场的整体采样数。
[0034]本专利技术的有益效果是,本专利技术提高了预测三维声速场的精确性,对比预报驱动的数值仿真方法,克服随预测时间增加导致预测准确度下降的局限;本专利技术提高了预测三维声速场的实时性,对比后报驱动的数值仿真方法,不需要布放水下设备实时采样环境场数据,避免了环境场数据通过卫星回传至岸基的时间开销;本专利技术提高预测三维声速场的易用性,需要的算力开销小,对比需要使用工作站或超级计算机进行计算的数值仿真方法,训练完成的DA

RNN可以部署在个人电脑以及可移动本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制循环神经网络的三维声速场预测方法,其特征在于,包括以下步骤:(1)将时序连续的k个预报三维声速场和后报三维声速场作为输入,并与随后输出的h个后报三维声速场组成多组数据对,以构建训练集;(2)构建DA

RNN,并根据训练集对构建的DA

RNN进行训练,以获取最终的DA

RNN;(3)将预报三维声速场输入到最终的DA

RNN中,以获取预测的后报三维声速场,并评价DA

RNN预测的准确度。2.根据权利要求1所述的基于注意力机制循环神经网络的三维声速场预测方法,其特征在于,所述步骤(2)包括以下子步骤:(2.1)构建DA

RNN,所述DA

RNN包括空间注意力层和时间注意力层,所述空间注意力层和时间注意力层连接;(2.2)根据步骤(1)得到的训练集对步骤(2.1)构建的DA

RNN进行训练,并更新DA

RNN的参数以获取最终的DA

RNN。3.根据权利要求2所述的基于注意力机制循环神经网络的三维声速场预测方法,其特征在于,所述步骤(2.1)包括以下子步骤:(2.1.1)将预报三维声速场输入三维卷积层以获取空间注意力特征,以完成空间注意力层的构建;(2.1.2)将空间注意力特征输入时间注意力层以获取预测的后报三维声速场,以完成时间注意力层的构建。4.根据权利要求3所述的基于注意力机制循环神经网络的三维声速场预测方法,其特征在于,所述步骤(2.1.1)包括以下子步骤:(2.1.1.1)将三维声速场定义为三维数组;(2.1.1.2)将预报三维声速场输入空间注意力层,并根据t

1时刻LSTM单元的状态p
t
‑1和输出h
t
‑1以及t时刻的预报三维声速场c
t
计算t时刻的空间注意力矩阵;(2.1.1.3)通过softmax函数对空间注意力矩阵进行归一化,计算t时刻的注意力权重矩阵;(2.1.1.4)根据注意力权重矩阵与预报三维声速场获取加权后的预报三维声速场;(2.1.1.5)根据加权后的预报三维声速场获取k个时序连续的空间注意力特征,以完成空间注意力层的构建。5.根据权利要求3所述的基于注意力机制...

【专利技术属性】
技术研发人员:李建龙郑荣华
申请(专利权)人:海南浙江大学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1