【技术实现步骤摘要】
一种用于单标签图像检索的标签表征构建方法
[0001]本专利技术涉及图像检索
,特别涉及一种用于单标签图像检索的标签表征构建方法。
技术介绍
[0002]目前,生活在互联网大数据时代,爆炸性的数据量以图像、视频、文本和音频等多种形式出现,对现有的搜索引擎和推荐系统带来了很大的挑战,因此使用深度哈希技术对图像进行编码,实现快速图像检索,提高检索效率;
[0003]传统的深度哈希方法大多基于成对标签或三元组的方法进行对比学习,但是该方法存在不足:一是对采样策略要求高,二是采样结果对数据分布的覆盖率不足;三是对不平衡数据的有效性较差,在现实场景中,不相似样本对的数量远大于相似样本对的数量。
[0004]因此,本专利技术提供了一种用于单标签图像检索的标签表征构建方法,用以通过确定单标签图像的单标签信息,便于准确生成单标签图像的标签表征,并鼓励标签表征相互之间保持最大的距离,从而增加标签表征之间的可辨别性,确保生成的类中心准确可靠,同时也为单标签图像检索提供了极大便利。
技术实现思路
[0005] ...
【技术保护点】
【技术特征摘要】
1.一种用于单标签图像检索的标签表征构建方法,其特征在于,包括:步骤1:基于单标签图像数据集获取所有的标签名称,并使用预训练的词向量作为标签的初始表征,将所述初始表征输入至全连接神经网络,输出得到各标签的标签表征,计算标签表征平衡损失和量化损失,并基于所述标签表征平衡损失和量化损失反向传播优化所述全连接神经网络;步骤2:基于卷积神经网络提取单标签图像的图像特征,并将标签表征作为同类单标签图像的特征中心,计算图像特征与对应标签表征之间的余弦距离,且基于所述余弦距离确定中心相似性损失,并基于所述中心相似性损失反向传播优化卷积神经网络;步骤3:基于训练完成的卷积神经网络提取数据集中所有单标签图像以及待检索单标签图像的图像特征,并将所述图像特征符号化为二进制码,且基于所述二进制码之间的汉明距离评估所述待检索单标签图像与数据集中所有单标签图像之间的相似性,并基于所述相似性完成单标签图像检索。2.根据权利要求1所述的一种用于单标签图像检索的标签表征构建方法,其特征在于,步骤1中,基于单标签图像数据集获取所有的标签名称,并使用预训练的词向量作为标签的初始表征,将所述初始表征输入至全连接神经网络,输出得到各标签的标签表征,计算标签表征平衡损失和量化损失,并基于所述标签表征平衡损失和量化损失反向传播优化所述全连接神经网络,包括:基于所述单标签图像数据集获取所述单标签图像的标签,并基于预训练的词向量模型来提取所述标签的词向量,将所述词向量作为各个标签的初始表征;将各个标签的初始表征输入至全连接神经网络,得到所述各个标签的表征向量,其中,所述全连接神经网络基于最小化标签表征平衡损失和量化损失来优化所得;其中,所述最小化标签表征平衡损失具体为最大化各个标签表征之前的距离,最小化各个标签表征之间的相似性,其中,所述表征向量之间的距离与表征向量之间的相似性呈负相关关系;其中,标签表征量化损失具体为将各个标签的表征向量的每一维度的值趋近于+1或
‑
1;基于最小化所述标签表征平衡损失和标签表征量化损失来优化全连接神经网络。3.根据权利要求2所述的一种用于单标签图像检索的标签表征构建方法,其特征在于,各个标签的表征向量的维度为预设的哈希码位数,其中,所述预设哈希码位数包括:16比特、32比特和64比特。4.根据权利要求1所述的一种用于单标签图像检索的标签表征构建方法,其特征在于,步骤2中,基于卷积神经网络提取单标签图像的图像特征,并将标签表征作为同类单标签图像的特征中心,计算图像特征与对应标签表征之间的余弦距离,且...
【专利技术属性】
技术研发人员:樊常林,黄永军,周均,李生,肖波,
申请(专利权)人:北京东方通科技股份有限公司北京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。