【技术实现步骤摘要】
一种基于语义偏好的快速图像检索方法
[0001]本专利技术属于图像检索
,更为具体地讲,涉及一种基于语义偏好的快速图像检索方法。
技术介绍
[0002]在多媒体内容数据日益丰富的今日,直接在大规模多媒体数据库中检索内容对于数据库来说,无论是时间开销还是内存开销都代价太昂贵了。如何在多媒体数据库尤其是图像数据库中快速检索,以获得高相关性的结果(图像)变得愈加重要。尽管最近开发的深度学习技术在识别和感知图像用于图像匹配方面取得了成功,但这些技术仍然需要巨大的时空间开销,无法应用于实际场景。
[0003]为了解决这一问题,快速图像检索方法受到了越来越多的关注。具体来说,一个快速图像检索方法需要在可接受的时间内从数据库中找到相似的图像。因为同时考虑到了时间开销的问题,快速图像检索方法研究具备相当的实际应用价值,可以应用于商品图像检索系统、社交媒体图像检索系统以及人脸图像检索系统等大规模图像检索系统。
[0004]作为快速图像检索的主流方法之一,基于语义偏好的快速图像检索方法常常同时具备低内存消耗、高执行效率以及高检索精度等优势。但现有基于语义偏好的快速图像检索方法主要有以下缺陷:1)训练检索模型时通常从成对、三元组或基于锚的损失中学习特征提取器,这些损失只关注样本间的局部关系,而不是从全局的视角对齐特征。这可能会造成整个空间的利用不充分以及不同语义之间的严重混淆,从而导致检索性能下降;2)此外,为了使量化器能够以端到端的方式进行学习,当前的实践通常用softmax作为不可微分的量化操作的松弛函数,但是它 ...
【技术保护点】
【技术特征摘要】
1.一种基于语义偏好的快速图像检索方法,其特征在于,包括以下步骤:(1)、训练语义中心分配模块,获取语义中心矩阵V1.1)、在给定的带标签的训练数据集中,统计各标签对应的图像集,计算标签i与标签j的关联度S
i,j
:其中,I
i
为标签i对应的图像集合,I
j
为标签j对应的图像集合,|| ||表示求图像集合的大小;1.2)、语义中心分配模块的参数即各标签的语义中心,在初始化时,语义中心分配模块用随机值来初始化各标签的语义中心,然后计算每对语义中心的势能G
s
(v
i
,v
j
):G
s
(v
i
,v
j
)=||cos(v
i
,v
j
)
‑
S
i,j
||2其中,v
i
为标签i对应的语义中心,v
j
为标签j对应的语义中心,语义中心为D维实数向量即cos(v
i
,v
j
)表示求语义中心v
i
、v
j
的余弦值,|| ||2表示求二范数;1.3)、计算融合了难样本挖掘技术的语义中心损失术的语义中心损失其中,N
c
表示标签的数量;1.4)、根据语义中心损失通过梯度下降法迭代地优化各语义中心,直到语义中心损失收敛;1.5)、应用归一化方程,将优化过后的各语义中心投影至同一超球面:其中,R为超球面的半径。1.6)、将各语义中心逐列拼接起来得到语义中心矩阵V,其中,第i列表示标签i对应的语义中心v
i
;(2)、基于语义中心矩阵V训练特征提取网络模块构建由卷积神经网络层、用于分类的全连接层FC
c
以及用于特征映射的全连接层FC
g
组成特征提取网络模块,然后进行训练:2.1)、在训练数据集中,选取一张图像及其对应的标签,将选取的图像进行数据增强操作后输入卷积神经网络层,得到隐藏特征向量f;2.2)、将隐藏特征向量f分别输入到全连接层FC
c
和全连接层FC
g
,分别得到图像对应的N
c
维实数标签预测向量p即和D维实数特征向量x即2.3)、对标签预测向量p计算交叉熵损失其中y表示图像对应的01标签向量,所述01标签向量为Nc维01组成的列向量,其中图像对应标签序号位为1,其余为0;2.4)、图像对应的目标语义向量t将会由其对应的语义中心融合得到,即:
2.5)、基于目标语义向量t,计算聚集损失2.5)、基于目标语义向量t,计算聚集损失其中,第一项表示特征提取模块输出的特征向量x同目标语义向量t的余弦相似度,第二项用于通过L2范数约束特征向量x的模长,而λ
mag
是平衡系数;2.6)、同时考虑分类损失和聚集损失得到用于优化特征提取模块的损失得到用于优化特征提取模块的损失其中,λ
C
是用于平衡分类损失和聚集损失的影响的超参数;2.7)、根据损失通过梯度下降法,优化特征提取网络模块参数,不断重复步骤2.1)到步骤2.7),直至损失收敛,然后固定特征提取模块的参数,完成特征提取网络模块的训练;(3)、使用特征提取网络模块得到特征向量并训练语义偏好量化模块3.1)、在训练数据集中,选取一张图像及其...
【专利技术属性】
技术研发人员:宋井宽,张志斌,申恒涛,朱筱苏,高联丽,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。