【技术实现步骤摘要】
用于图像的模型训练方法以及无监督图像哈希检索方法
[0001]本专利技术涉及计算机视觉
,尤其涉及一种用于图像的模型训练方法以及无监督图像哈希检索方法。
技术介绍
[0002]相似性搜索,也称近似最近邻搜索,其具体可以是基于内容的图像和文档搜索,或者是多媒体检索和抄袭检测等。在大数据时代,相似性搜索在现代信息检索系统中发挥着举足轻重的作用。
[0003]现有技术中,若直接在原始的实值特征空间中进行搜索,则会因为数据量巨大,对应的存储和计算的成本都非常高,降低检索效率。而哈希技术通过将数据表示为保留语义相似性的紧凑的二进制代码,并计算代码间的汉明距离来实现检索,显著减少了内存占用并提高了搜索效率,从而解决上述问题,也是最近几年研究的重点。
[0004]现有的哈希方法大致分为基于有监督学习的方式和基于无监督学习的方式。一方面,基于有监督学习的哈希在训练过程中依赖于数据标注,往往通过度量学习的优化目标来保证语义相近的数据具有接近的二进制表示代码,而语义不同的数据在汉明空间中远离。基于有监督学习的哈希通常表现很 ...
【技术保护点】
【技术特征摘要】
1.一种用于图像的模型训练方法,其特征在于,包括:获取无标签训练图像数据;对所述无标签训练图像数据进行两次数据增广,获得第一增广数据以及第二增广数据;利用预先构建的哈希特征提取模型分别对所述第一增广数据以及第二增广数据进行前向传播,获得第一预测值以及第二预测值;基于所述第一预测值以及第二预测值,利用预先构建的损失函数计算得到损失值,其中,所述损失函数基于谱对比学习算法构建;根据所述损失值对所述预先构建的哈希特征提取模型中的网络参数进行更新,直到所述损失值小于损失阈值停止网络参数的更新,以获得训练好的哈希特征提取模型。2.根据权利要求1所述的用于图像的模型训练方法,其特征在于,所述损失函数基于谱对比学习算法构建,包括:构建所述第一增广数据与所述第二增广数据之间的图,所述图中的边表征所述第一增广数据与所述第二增广数据的联合概率分布;利用所述预先构建的哈希特征提取模型输出的特征定义损失函数,利用定义得到的损失函数实现对所述图对应的邻接矩阵进行谱分解,从而获得基于谱对比学习算法构建的损失函数。3.根据权利要求2所述的用于图像的模型训练方法,其特征在于,所述构建所述第一增广数据与所述第二增广数据之间的图,包括:构建所述第一增广数据与所述第二增广数据之间的图A;相应地,所述利用所述预先构建的哈希特征提取模型输出的特征,定义损失函数,包括:获取所述图A对应的标准化邻接矩阵基于矩阵分解的准则对所述标准化邻接矩阵进行谱分解,获得定义得到的损失函数l:其中,F∈R
N
×
k
表示全体增广数据的k维特征矩阵;利用预先构建的哈希特征提取模型f(x)输出特征矩阵F,并将所述标准化邻接矩阵转换为概率分布形式,以获得基于谱对比学习算法构建的损失函数l
′
:其中,x和x
+
是随机数据增广对应的分布中的两个独立采样;x
‑
为不同于无标签数据的数据所生成的增广数据。4.根据权利要求3所述的用于图像的模型训练方法,其特征在于,所述基于所述第一预测值以及第二预测值,利用预先构建的损失函数计算得到损失值,包括:基于第一预测值z
i
=f(x
i
)以及第二预测值z
i
′
=f(x
i
′
),并根据损失函数l
′
,计算得到损失函数l
′
的随机估计,将该随机估计作为损失值,该损失值为:
其中,B为批量大小。5.根据权利要求1所述的用于图像的模型训练方法,其特征...
【专利技术属性】
技术研发人员:请求不公布姓名,
申请(专利权)人:北京瑞莱智慧科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。