基于融合多特征的街景图像处理方法及系统技术方案

技术编号：30965408 阅读：19 留言：0更新日期：2021-11-25 20:34

本发明专利技术公开了一种基于融合多特征的街景图像处理方法，包括以下步骤：待处理的街景图像经过卷积神经网络后得到C个特征信息图；将C个特征信息图均复制l份，并分别划分为大小不一的区域，然后将分好区域的图均输入三个池化层，对每幅图均进行平均池化计算、最大池化计算与广义平均池化计算；将经池化计算后的各个区域中的相同尺度向量归为一列，并将所有尺度向量进行串联，得到一个l*C维的多维特征向量；将三种池化层得到的多维特征向量进行拼接，得到最终的全局特征，并输入到全连接层进行降维。本发明专利技术能够有效提取图像特征，降低训练的复杂性，提高检索的精确率。提高检索的精确率。提高检索的精确率。

全部详细技术资料下载

【技术实现步骤摘要】
基于融合多特征的街景图像处理方法及系统

[0001]本专利技术涉及图像处理领域，尤其涉及一种基于融合多特征的街景图像处理方法及系统。

技术介绍

[0002]随着网络中的图片资源呈现指数级增长，而众多领域中，需要根据不同的需求检索相关图片，故检索相关图像的方法显得尤为重要。近些年，基于内容的图像检索方法(ContentBasedImageRetrieval，CBIR)兴起，并成为当前的研究热门方向。
[0003]传统的图像检索方法中，陈等使用SITF方法，在空间尺度中寻找极值点，并提取出其位置、尺度、旋转不变量，将极值点的属性信息作为图像的特征用于图像检索。马等通过GIST方法提取出图像的方向频率信息等局部特征作为图像特征。虽然此类方法取得了一定的效果，但无法捕获图像数据变化剧烈时的高层语义特征，限制了图像检索的精度。
[0004]近年来，随着ImageNet的出现，卷积神经网络得到了广泛应用，紧接着， AlexNet、VGGNet、GoogleNet等被相继提出。任等使用卷积神经网络提取特征进行图像检索，相对于传统检索方法，得到了良好的效果。但传统的卷积神经网络主要针对于图像分类任务，若直接用于图像检索，所提取到的特征并不能捕获街景图像的关键信息，仍存在检索精度低的问题。
[0005]为解决此问题，研究人员开始引入注意力机制提取关键区域的特征信息。李提出了一种软注意力与硬注意力机制并行的模型，通过多注意力机制的方法，突出图像特征的关键部分。Kim提出一种基于注意力机制...

【技术保护点】

【技术特征摘要】
1.一种基于融合多特征的街景图像处理方法，其特征在于，包括以下步骤：待处理的街景图像经过卷积神经网络后得到C个特征信息图，该卷积神经网络的最后一个卷积层作为特征层用来捕获图像中待处理的街景图像，且该最后一个卷积层连接三个池化层，包括多尺度平均池化层、多尺度最大池化层与多尺度广义平均池化层；将C个特征信息图均复制l份，并分别划分为大小不一的区域，然后将分好区域的图均输入三个池化层，对每幅图均进行平均池化计算、最大池化计算与广义平均池化计算；将经池化计算后的各个区域中的相同维度向量归为一列，经过排列组合并筛除组合后维度不同的向量后，将所有向量进行串联，得到一个l*C维的多维特征向量，其中l、C均为自然数；将三种池化层得到的多维特征向量输入到全连接层进行降维，将降维后的向量进行拼接，得到最终的全局特征。2.根据权利要求1所述的基于融合多特征的街景图像处理方法，其特征在于，n≥4。3.根据权利要求1所述的基于融合多特征的街景图像处理方法，其特征在于，划分区域region大小的公式如下所示：li的取值为1,2,3
…
l；H为特征信息图的高度，W为特征信息图的宽度。4.根据权利要求1所述的基于融合多特征的街景图像处理方法，其特征在于，该方法还包括步骤：计算待处理的街景图像的最终全局特征与预存的数据库中每张图像的全局特征之间的曼哈顿距离，找到与待处理的街景图像之间曼哈顿距离越小的图像。5.根据权利要求1所述的基于融合多特征的街景图像处理方法，其特征在于，通过交叉匹配的方式将区域中的相同尺度向量归为一列。6.一种基于融合多特征的街景图像处理的卷积神经网络，其...

【专利技术属性】
技术研发人员：李晓林，徐港，邵长成，周一凡，黄磊，
申请(专利权)人：武汉工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人