当前位置: 首页 > 专利查询>中国人民解放军战略支援部队航天工程大学专利>正文

一种基于GRU注意力的遥感影像区域关注与文本生成方法技术

技术编号：30140947 阅读：11 留言：0更新日期：2021-09-23 15:03

本发明专利技术提供了一种基于GRU注意力的遥感影像区域关注与文本生成方法包括如下步骤：步骤S1、在编码器部分提取遥感影像特征信息，输出特征图；步骤S2、特征图和训练集中的文本信息共同作为解码器的输入；所述解码器中，包括GRU注意力网络及LSTM语言网络，所述GRU注意力网络在输入的特征图的单词生成前，对特征图的特征向量和特征图生成文本信息的单词计算权重系数，增加对重点区域的选择和关注度，并将所述GRU注意力网络获得的注意力值及隐状态输入到所述LSTM语言网络，输出单词和状态。本发明专利技术能够更为准确地在到遥感影像的预选区域中判断出重点区域，以生成更为准确的描述。以生成更为准确的描述。以生成更为准确的描述。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于GRU注意力的遥感影像区域关注与文本生成方法

[0001]本专利技术涉及遥感影像文本生成
，特别涉及一种基于GRU(门控循环单元，Gated Recurrent Unit)注意力的遥感影像区域关注与文本生成方法。

技术介绍

[0002]现代航天遥感技术的高速进步，使得遥感卫星日趋成熟、遥感数据获取量成倍增长。然而，目前人们对航天遥感影像的推理与理解以检测和分类为主，其结果与高层信息之间仍存在较大差距。因此，面对如此海量的遥感影像数据，亟需具备与遥感影像获取速度相匹配的解译能力，如何在浩瀚的遥感影像中挖掘提取出高价值信息成为遥感领域进一步探索研究的方向。
[0003]航天遥感影像文本生成技术指对于输入的遥感影像，通过计算机自动生成影像中目标和场景文本描述的语义信息，是遥感影像智能处理的最终目标之一。航天遥感影像文本生成技术源于自然场景图像描述技术，处理流程是：首先利用卷积神经网络(Convolutional Neural Network，CNN)构成的特征编码器提取输入遥感影像的特征信息，生成便于计算机理解的特征图；接着将特征图输入由循环神经网络(Recurrent Neural Networks，RNN)构成的文本解码器，结合先验文本库，将特征图转换为文本描述，如图1所示。航天遥感影像文本生成技术能够充分利用海量的遥感影像，自主理解影像内容并获得影像中目标的特征和目标与目标、目标与场景间的关系，并从语义层面对遥感影像进行描述。该技术在民用和军事领域均具有极其重要的作用，是解决遥感数据增长量和人工

【技术保护点】

【技术特征摘要】
1.一种基于GRU注意力的遥感影像区域关注及文本生成方法，其特征在于，包括如下步骤：步骤S1、将获取的遥感影像输入编码器，在编码器部分提取遥感影像特征信息，输出特征图；步骤S2、将部分遥感影像作为数据集，将部分遥感影像及对应的文本信息作为训练集，将数据集的特征图和训练集中的文本信息共同作为解码器的输入；所述解码器中，包括GRU注意力网络及LSTM语言网络，所述GRU注意力网络在输入的特征图的单词生成前，对特征图的特征向量和特征图生成文本信息的单词计算权重系数，增加对重点区域的选择和关注度，并将所述GRU注意力网络获得的注意力值及隐状态输入到所述LSTM语言网络，输出单词和状态；其中，计算权重系数时，在遥感影像的预选区域中根据权重系数判断出重点区域，增加对重点区域的选择和关注度，所述注意力值即为权重系数，隐状态是用于控制LSTM语言网络每层输出的值。2.根据权利要求1所述的一种基于GRU注意力的遥感影像区域关注及文本生成方法，其特征在于，所述GRU注意力网络遵循以下公式：所述LSTM语言网络遵循以下公式：其中，和分别代表GRU注意力网络t时刻的输入和隐状态，表示GRU注意力网络t
‑
1时刻的隐状态，和分别代表LSTM语言网络t时刻的输入和隐状态，表示LSTM语言网络t
‑
1时刻的隐状态；GRU注意力网络满足以下公式：该式表示，GRU注意力网络的输入由三部分组成，分别是：(t
‑
1)时刻LSTM语言网络的隐状态输入特征图的平均池化特征和已生成单词的编码W
d
Π
t
。3.根据权利要求2所述的一种基于GRU注意力的遥感影像区域关注及文本生成方法，其特征在于，所述GRU注意力网络中对特征图的权重计算公式为：α
i,t
＝Softmax(m
i,t
)其中，α
i，t
为特征图中的关注度权重，为t时刻遥感影像特征图的动态表示，i表示输入遥感影像的第i个区域，K代表特征图的个数，用于计算平均池化特征，m
i,t
表示t时刻第i个区域的特征图，W
fm
，W
Hm
和均是网络参数，f
i
为第i个区域的特征图的平均池化特征，m表示
特征图表；GRU注意力网络输出的状态值和图像特征图构成了LSTM语言网络的输入，状态值为经过GRU注意力网络权重系数计算后的输出值，图像特征图为数据集的图像特征图：权重系数计算后的输出值，图像特征图为数据集的图像特征图：表示GRU注意力网络t时刻的隐状态，表示t时刻平均池化了的特征图；t时刻GRU注意力网络和LSTM语言网络输出的任一单词的概率分布为：t时刻GRU注意力网络和LSTM语言网络输出的任一单词的概率分布为：其中，Y
1:T
指代单词序列(Y1,Y2,...Y
t
...Y
T
)，p(Y
t
|Y
1:t
‑1)代表每个time step的条件分布，p(Y
1:T
)指完整的条件分布，W
p
和b
p
分别是GRU注意力网络和LSTM语言网络构成的模型的权重和偏差；偏差指的是每层网络计算过程中的偏置b；以交叉熵函数作为GRU注意力网络和LSTM语言网络构成的模型优化的损失函数：式中，p
θ
表示单词采样过程中的模型参数，指损失函数中的条件分布，其中的和均指代本模型中输入数据集描述的单词序列。4.根据权利要求3所述的一种基于GRU注意力的遥感影像区...

【专利技术属性】
技术研发人员：夏鲁瑞，林郁，李森，陈雪旗，张占月，王鹏，薛武，
申请(专利权)人：中国人民解放军战略支援部队航天工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人