一种基于变分信息瓶颈的跨视角地理图像检索方法技术

技术编号：33500449 阅读：18 留言：0更新日期：2022-05-19 01:10

本发明专利技术公开了一种基于变分信息瓶颈的跨视角地理图像检索方法，涉及计算机视觉中的跨视角地理图像检索技术领域，以往检索模型的分类器在训练过程中会很快收敛，导致其产生的梯度包含的信息过少而不能有效的对特征提取模块进行训练，导致检索模型容易过拟合，在测试的数据集上表现不佳；本发明专利技术使用变分信息瓶颈模块在训练过程中对分类器添加高斯噪声，迫使特征提取模块提取具有视图不变性的和判别性的图像表示，来提升检索模型的泛化能力和鲁棒性，并使用变分信息瓶颈模块压缩后的特征作为检索特征；从而达到提高检索结果准确性的目的。的。的。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于变分信息瓶颈的跨视角地理图像检索方法

[0001]本专利技术涉及计算机视觉中的跨视角地理图像检索
，更具体地是涉及一种基于变分信息瓶颈的跨视角地理图像检索方法。

技术介绍

[0002]跨视角地理图像检索是从地面视角或卫星视角等不同视角对图像中相同的地理目标进行检索匹配，例如，给定一个地面视角查询图像，在卫星视角的候选图像中搜索相同地理目标的卫星图像。它有着广泛的运用，如无人驾驶，其要求实现精确的地理目标定位，因此有着极大地应用价值和经济效益。
[0003]跨视角地理图像检索是一个具有挑战性的任务，因为极端的视角变化引起视觉外观的巨大变化；近几年来，跨视角地理图像检索任务得到了巨大的发展。
[0004]传统的方法侧重于挖掘图像中心地理目标的特征表示，但忽略了图像相邻区域上下文信息的重要性。因此有方法提出利用图像中心地理目标的相邻区域作为辅助信息，丰富判别线索，它显著的提升了检索效果。而本专利技术基于变分信息瓶颈模块实现，可以对特征提取模块的输出结果添加高斯噪声，使得分类器能够对噪声具有鲁棒性，迫使特征提取模块具有提取视图不变性的、判别性的图像表示，从而提升基于变分信息瓶颈的跨视角地理图像检索模型的泛化能力。

技术实现思路

[0005]本专利技术的目的在于：提供一种基于变分信息瓶颈的跨视角地理图像检索方法，通过提升检索模型的泛化能力和鲁棒性、并使用变分信息瓶颈模块压缩后的特征作为检索特征；得到具有视图不变性的、判别性的图像表示作为检索特征，从而达到提高检索结果准确性的目的。<...

【技术保护点】

【技术特征摘要】
1.一种基于变分信息瓶颈的跨视角地理图像检索方法，其特征在于，包括如下步骤：步骤S1：选择常用的跨视角地理图像数据集，其中包括train数据集和val数据集，它有两个视角的图像，分别为地面视角图像和卫星视角图像；步骤S2：训练基于变分信息瓶颈的跨视角地理图像检索模型；步骤S3：基于变分信息瓶颈的跨视角地理图像检索模型测试；选择任意一个地面视角图像，输入到步骤S2得到的基于变分信息瓶颈的跨视角地理图像检索模型，得到输出特征Z
ij
的均值Ｕ
ij
，将Ｕ
ij
按行拼接得到特征作为检索特征，从而检索出与地面视角图像具有相同目标的卫星视角图像。2.根据权利要求1所述的一种基于变分信息瓶颈的跨视角地理图像检索方法，其特征在于，所述基于变分信息瓶颈的跨视角地理图像检索模型包括特征提取模块、变分信息瓶颈模块和分类器模块；特征提取模块：是在ImageNet数据集上预训练的ResNet
‑
50模型来提取输入图像的特征；变分信息瓶颈模块：是由一个编码器组成的，变分信息瓶颈的输入是V
ij
，编码器有两个线性层作为输出层，维度大小为512，输出的两个特征向量分别作为变分信息瓶颈模块学习的均值和方差；分类器模块依次由全连接层、批处理归一化层、Dropout层和线性分类层组成，线性分类层的维度大小为分类目标的类别个数。3.根据权利要求2所述的一种基于变分信息瓶颈的跨视角地理图像检索方法，其特征在于，特征提取模块采用方环特征分区策略提取图像特征，根据图像周围区域到图像中心的距离提供注意力，丰富图像特征的判别线索。4.根据权利要求3所述的一种基于变分信息瓶颈的跨视角地理图像检索方法，其特征在于，特征提取模块具体操作为：将输入图像x
j
调整为固定大小256
×
256，输入特征提取模块，得到图像特征R
j
，其中x
j
∈｛x
d
，x
s
｝, x
d
与x
s
分别代表两个不同的视角，x
d
代表地面视角，x
s
代表卫星视角；然后使用方环特征分区设计，将特征图分成i个方环部分，记为R
ij
=P
slice
（R
j
，i），然后每个部分都经过平均池化得到维度为2048的特征R
ij
，记为V
ij
=Avgpool(R
ij
), 其中P
slice
为方环特征分区操作，Avgpool为平均池化操作。5.根据权利要求1所述的一种基于变分信息瓶颈的跨视角地理图像检索方法，其特征在于，所述步骤S2具体包括：步骤S2.1：使用特征提取模块提取train数据集的图像特征，特征提取模块的输入为不同视角的两个图像，记为地面视角图像x
d
和卫星视角图像x
s
；步骤S2.2：地面视角图像...

【专利技术属性】
技术研发人员：徐行，胡谦，李宛思，沈复民，申恒涛，
申请(专利权)人：成都考拉悠然科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人